Категории

Извлекатель текста

Извлекает определенные шаблоны (эл. почта, телефоны, URL, числа)

Ключевые факты

Категория
Text Processing
Типы входных данных
textarea, select, text, checkbox
Тип результата
text
Покрытие примерами
4
API доступен
Yes

Обзор

Извлекатель текста — это быстрый инструмент для автоматического поиска и сбора специфических данных, таких как адреса электронной почты, номера телефонов, URL-адреса или числа, из больших массивов неструктурированного текста.

Когда использовать

  • Когда нужно быстро собрать все контактные данные из длинного документа или статьи.
  • При необходимости очистить текст от лишней информации, оставив только нужные числовые значения.
  • Для поиска уникальных ссылок или специфических форматов данных в логах или отчетах.

Как это работает

  • Вставьте исходный текст в поле ввода.
  • Выберите нужный тип данных (например, Email или Телефон) или укажите свой регулярный шаблон.
  • Настройте формат вывода, выбрав список, строку через запятую или подсчет уникальных значений.
  • Нажмите кнопку обработки, чтобы мгновенно получить результат.

Сценарии использования

Сбор базы контактов из открытых источников или переписки.
Анализ лог-файлов для поиска всех упомянутых IP-адресов или числовых идентификаторов.
Извлечение списка ссылок из веб-страниц или текстовых документов для дальнейшей обработки.

Примеры

1. Сбор email-адресов из переписки

Менеджер по продажам
Контекст
У менеджера есть длинная цепочка писем, из которой нужно выписать все адреса электронной почты для CRM.
Проблема
Вручную копировать каждый адрес долго и есть риск пропустить контакт.
Как использовать
Вставить текст переписки, выбрать тип 'Email Addresses' и формат 'Unique Items'.
Результат
Получен чистый список уникальных email-адресов, готовый к импорту в CRM.

2. Извлечение цен из прайс-листа

Аналитик
Контекст
Аналитик получил текстовый отчет с описанием товаров и их стоимостью вперемешку с текстом.
Проблема
Нужно быстро собрать все числовые значения цен для расчета среднего чека.
Как использовать
Вставить текст, выбрать тип 'Numbers' и формат 'List'.
Результат
Сформирован столбец всех чисел, найденных в тексте, что позволяет быстро перенести их в Excel для расчетов.

Проверить на примерах

text

Связанные хабы

FAQ

Какие типы данных можно извлечь?

Инструмент поддерживает извлечение email-адресов, номеров телефонов, URL-ссылок, чисел, дат и пользовательских шаблонов через регулярные выражения.

Можно ли извлечь только уникальные значения?

Да, в настройках выходного формата выберите опцию 'Unique Items', чтобы исключить дубликаты из результата.

Поддерживает ли инструмент поиск с учетом регистра?

Да, вы можете включить опцию 'С учетом регистра' для более точного поиска по пользовательским шаблонам.

Что делать, если нужного мне формата нет в списке?

Выберите 'Пользовательский шаблон' в типе извлечения и введите собственное регулярное выражение (regex) в соответствующее поле.

Как получить только количество найденных элементов?

Выберите формат вывода 'Count Only', и инструмент вернет общее число найденных совпадений вместо самих данных.

Документация API

Конечная точка запроса

POST /ru/api/tools/text-extractor

Параметры запроса

Имя параметра Тип Обязательно Описание
textInput textarea Да -
extractType select Да -
customPattern text Нет -
caseSensitive checkbox Нет -
outputFormat select Да -

Формат ответа

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Текст: Текст

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-text-extractor": {
      "name": "text-extractor",
      "description": "Извлекает определенные шаблоны (эл. почта, телефоны, URL, числа)",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=text-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]