Категории

Статистика текстовых паттернов

Статистика и частотный анализ паттернов в тексте (числа, email, URL и т.д.)

Required when "Custom Regex" is selected. Can include flags like /pattern/gi

Ключевые факты

Категория
Text Processing
Типы входных данных
textarea, select, text, checkbox, number
Тип результата
json
Покрытие примерами
4
API доступен
Yes

Обзор

Инструмент для быстрого анализа текстовых данных, позволяющий извлекать и подсчитывать частоту вхождения определенных паттернов, таких как email-адреса, URL, номера телефонов или пользовательские регулярные выражения.

Когда использовать

  • Когда нужно извлечь все контактные данные из большого массива неструктурированного текста.
  • Для проверки частоты упоминания определенных терминов или форматов данных в документах.
  • При необходимости быстрого аудита текста на наличие ошибок в форматировании или специфических шаблонов.

Как это работает

  • Вставьте исходный текст в поле ввода.
  • Выберите тип паттерна из списка или укажите собственный регулярный шаблон.
  • Настройте параметры фильтрации, такие как учет регистра или ограничение количества результатов.
  • Получите структурированный отчет с частотным анализом и списком найденных совпадений.

Сценарии использования

Извлечение списка всех email-адресов из логов или переписки для формирования базы контактов.
Анализ частоты использования числовых значений в финансовых отчетах.
Поиск и проверка корректности всех URL-ссылок в SEO-контенте.

Примеры

1. Извлечение email-адресов из базы данных

Маркетолог
Контекст
Необходимо собрать все адреса электронной почты из неструктурированного текстового файла с отзывами клиентов.
Проблема
Вручную искать адреса в тексте объемом более 10 000 символов слишком долго.
Как использовать
Вставить текст в поле ввода, выбрать тип паттерна 'Email Addresses' и нажать кнопку анализа.
Пример конфигурации
patternType: 'emails', showDistribution: true
Результат
Получен список всех уникальных email-адресов с указанием частоты их упоминания в тексте.

2. Поиск специфических кодов товаров

Складской менеджер
Контекст
Нужно найти все артикулы товаров, которые состоят из 4 цифр, в описании инвентаризации.
Проблема
Стандартные инструменты поиска не позволяют выделить только 4-значные числа среди другого текста.
Как использовать
Выбрать 'Custom Regex', ввести шаблон '\b\d{4}\b' и запустить обработку.
Пример конфигурации
patternType: 'custom', customPattern: '\\b\\d{4}\\b'
Результат
Система вывела список всех 4-значных чисел, найденных в тексте, исключив все остальные числовые значения.

Проверить на примерах

text, regex

Связанные хабы

FAQ

Какие типы паттернов поддерживает инструмент?

Поддерживаются числа, email-адреса, URL, номера телефонов, даты, слова с заглавной буквы, а также пользовательские регулярные выражения.

Можно ли использовать свои регулярные выражения?

Да, выберите опцию 'Custom Regex' и введите свой шаблон в поле 'Пользовательский Regex'.

Влияет ли регистр символов на поиск?

Вы можете включить или выключить учет регистра с помощью соответствующего чекбокса в настройках.

Есть ли ограничение на количество выводимых результатов?

Да, вы можете ограничить количество отображаемых совпадений в поле 'Максимум результатов' (от 10 до 500).

В каком формате предоставляется результат?

Результат анализа возвращается в формате JSON, содержащем список найденных совпадений и статистику их распределения.

Документация API

Конечная точка запроса

POST /ru/api/tools/text-pattern-stats

Параметры запроса

Имя параметра Тип Обязательно Описание
textInput textarea Да -
patternType select Да -
customPattern text Нет Required when "Custom Regex" is selected. Can include flags like /pattern/gi
caseSensitive checkbox Нет -
showDistribution checkbox Нет -
maxResults number Нет -

Формат ответа

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Данные JSON: Данные JSON

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-text-pattern-stats": {
      "name": "text-pattern-stats",
      "description": "Статистика и частотный анализ паттернов в тексте (числа, email, URL и т.д.)",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=text-pattern-stats",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]