Ключевые факты
- Категория
- Text Processing
- Типы входных данных
- textarea, select, text, checkbox, number
- Тип результата
- json
- Покрытие примерами
- 4
- API доступен
- Yes
Обзор
Инструмент для быстрого анализа текстовых данных, позволяющий извлекать и подсчитывать частоту вхождения определенных паттернов, таких как email-адреса, URL, номера телефонов или пользовательские регулярные выражения.
Когда использовать
- •Когда нужно извлечь все контактные данные из большого массива неструктурированного текста.
- •Для проверки частоты упоминания определенных терминов или форматов данных в документах.
- •При необходимости быстрого аудита текста на наличие ошибок в форматировании или специфических шаблонов.
Как это работает
- •Вставьте исходный текст в поле ввода.
- •Выберите тип паттерна из списка или укажите собственный регулярный шаблон.
- •Настройте параметры фильтрации, такие как учет регистра или ограничение количества результатов.
- •Получите структурированный отчет с частотным анализом и списком найденных совпадений.
Сценарии использования
Примеры
1. Извлечение email-адресов из базы данных
Маркетолог- Контекст
- Необходимо собрать все адреса электронной почты из неструктурированного текстового файла с отзывами клиентов.
- Проблема
- Вручную искать адреса в тексте объемом более 10 000 символов слишком долго.
- Как использовать
- Вставить текст в поле ввода, выбрать тип паттерна 'Email Addresses' и нажать кнопку анализа.
- Пример конфигурации
-
patternType: 'emails', showDistribution: true - Результат
- Получен список всех уникальных email-адресов с указанием частоты их упоминания в тексте.
2. Поиск специфических кодов товаров
Складской менеджер- Контекст
- Нужно найти все артикулы товаров, которые состоят из 4 цифр, в описании инвентаризации.
- Проблема
- Стандартные инструменты поиска не позволяют выделить только 4-значные числа среди другого текста.
- Как использовать
- Выбрать 'Custom Regex', ввести шаблон '\b\d{4}\b' и запустить обработку.
- Пример конфигурации
-
patternType: 'custom', customPattern: '\\b\\d{4}\\b' - Результат
- Система вывела список всех 4-значных чисел, найденных в тексте, исключив все остальные числовые значения.
Проверить на примерах
text, regexСвязанные хабы
FAQ
Какие типы паттернов поддерживает инструмент?
Поддерживаются числа, email-адреса, URL, номера телефонов, даты, слова с заглавной буквы, а также пользовательские регулярные выражения.
Можно ли использовать свои регулярные выражения?
Да, выберите опцию 'Custom Regex' и введите свой шаблон в поле 'Пользовательский Regex'.
Влияет ли регистр символов на поиск?
Вы можете включить или выключить учет регистра с помощью соответствующего чекбокса в настройках.
Есть ли ограничение на количество выводимых результатов?
Да, вы можете ограничить количество отображаемых совпадений в поле 'Максимум результатов' (от 10 до 500).
В каком формате предоставляется результат?
Результат анализа возвращается в формате JSON, содержащем список найденных совпадений и статистику их распределения.