Ключевые факты
- Категория
- Text Processing
- Типы входных данных
- textarea, select, text, checkbox
- Тип результата
- text
- Покрытие примерами
- 4
- API доступен
- Yes
Обзор
Извлекатель текста — это быстрый инструмент для автоматического поиска и сбора специфических данных, таких как адреса электронной почты, номера телефонов, URL-адреса или числа, из больших массивов неструктурированного текста.
Когда использовать
- •Когда нужно быстро собрать все контактные данные из длинного документа или статьи.
- •При необходимости очистить текст от лишней информации, оставив только нужные числовые значения.
- •Для поиска уникальных ссылок или специфических форматов данных в логах или отчетах.
Как это работает
- •Вставьте исходный текст в поле ввода.
- •Выберите нужный тип данных (например, Email или Телефон) или укажите свой регулярный шаблон.
- •Настройте формат вывода, выбрав список, строку через запятую или подсчет уникальных значений.
- •Нажмите кнопку обработки, чтобы мгновенно получить результат.
Сценарии использования
Примеры
1. Сбор email-адресов из переписки
Менеджер по продажам- Контекст
- У менеджера есть длинная цепочка писем, из которой нужно выписать все адреса электронной почты для CRM.
- Проблема
- Вручную копировать каждый адрес долго и есть риск пропустить контакт.
- Как использовать
- Вставить текст переписки, выбрать тип 'Email Addresses' и формат 'Unique Items'.
- Результат
- Получен чистый список уникальных email-адресов, готовый к импорту в CRM.
2. Извлечение цен из прайс-листа
Аналитик- Контекст
- Аналитик получил текстовый отчет с описанием товаров и их стоимостью вперемешку с текстом.
- Проблема
- Нужно быстро собрать все числовые значения цен для расчета среднего чека.
- Как использовать
- Вставить текст, выбрать тип 'Numbers' и формат 'List'.
- Результат
- Сформирован столбец всех чисел, найденных в тексте, что позволяет быстро перенести их в Excel для расчетов.
Проверить на примерах
textСвязанные хабы
FAQ
Какие типы данных можно извлечь?
Инструмент поддерживает извлечение email-адресов, номеров телефонов, URL-ссылок, чисел, дат и пользовательских шаблонов через регулярные выражения.
Можно ли извлечь только уникальные значения?
Да, в настройках выходного формата выберите опцию 'Unique Items', чтобы исключить дубликаты из результата.
Поддерживает ли инструмент поиск с учетом регистра?
Да, вы можете включить опцию 'С учетом регистра' для более точного поиска по пользовательским шаблонам.
Что делать, если нужного мне формата нет в списке?
Выберите 'Пользовательский шаблон' в типе извлечения и введите собственное регулярное выражение (regex) в соответствующее поле.
Как получить только количество найденных элементов?
Выберите формат вывода 'Count Only', и инструмент вернет общее число найденных совпадений вместо самих данных.