分类

文本模式统计

统计和分析文本中的模式频率(数字、邮箱、URL等)

Required when "Custom Regex" is selected. Can include flags like /pattern/gi

关键信息

分类
Text Processing
输入类型
textarea, select, text, checkbox, number
输出类型
json
样本覆盖
4
支持 API
Yes

概览

文本模式统计工具是一款高效的文本分析助手,旨在帮助用户快速识别并统计长文本中的特定信息模式,如数字、邮箱地址、URL 或自定义正则表达式匹配项,从而实现精准的数据提取与频率分析。

适用场景

  • 需要从杂乱的文档中批量提取并统计所有邮箱地址或电话号码时。
  • 在进行数据清洗时,需要快速定位并分析文本中特定格式数字的分布情况。
  • 需要验证文本内容是否符合特定正则表达式规则,并获取匹配频率统计时。

工作原理

  • 将待分析的文本粘贴至输入框中。
  • 在模式类型下拉菜单中选择预设规则(如邮箱、URL)或选择自定义正则。
  • 根据需要调整区分大小写、显示分布等高级选项。
  • 点击执行,系统将自动计算匹配项的出现频率并展示统计结果。

使用场景

市场调研:从客户反馈文本中快速提取并统计所有提及的联系方式。
日志分析:通过正则匹配快速统计服务器日志中特定错误代码的出现频率。
内容审核:识别并统计文章中出现的外部链接,以检查是否存在违规推广。

用户案例

1. 提取并统计客户反馈中的邮箱

客服专员
背景原因
客服专员收到了一份包含数百条客户反馈的汇总文档,需要整理出所有提及的联系邮箱以便后续跟进。
解决问题
手动查找效率极低且容易遗漏,需要批量提取并去重统计。
如何使用
将反馈内容粘贴到文本输入框,选择“Email Addresses”模式,开启“显示分布”。
示例配置
patternType: emails, showDistribution: true
效果
系统输出了所有提取到的邮箱列表,并清晰展示了每个邮箱出现的次数,方便快速整理联系人名单。

2. 分析日志中的错误代码频率

运维工程师
背景原因
运维工程师需要分析一段长达数万行的服务器日志,找出其中特定格式的错误代码(如 ERR_XXXX)的出现频率。
解决问题
日志量巨大,无法通过肉眼观察,需要通过正则匹配进行自动化统计。
如何使用
将日志粘贴到输入框,选择“Custom Regex”,输入正则模式 `ERR_\d{4}`,并设置最大结果数为 500。
示例配置
patternType: custom, customPattern: ERR_\d{4}, maxResults: 500
效果
成功提取出所有符合格式的错误代码,并按频率高低排序,帮助工程师快速定位系统故障高发点。

用 Samples 测试

text, regex

相关专题

常见问题

该工具支持哪些预设模式?

支持数字、大写单词、首字母大写单词、邮箱地址、URL、电话号码、日期等常用模式。

如何使用自定义正则表达式?

选择“自定义”模式类型,并在“自定义正则表达式”输入框中输入符合标准的正则语法即可。

“显示分布”选项有什么作用?

开启后,工具不仅会列出匹配项,还会统计每个匹配项在文本中出现的具体频率和占比。

最大结果数限制是多少?

您可以根据需求设置最大结果数,范围在 10 到 500 之间,以控制输出列表的长度。

处理大型文本时会卡顿吗?

该工具经过优化,能够高效处理常见规模的文本数据,建议根据文本长度合理设置最大结果数以获得最佳体验。

API 文档

请求端点

POST /zh/api/tools/text-pattern-stats

请求参数

参数名 类型 必填 描述
textInput textarea -
patternType select -
customPattern text Required when "Custom Regex" is selected. Can include flags like /pattern/gi
caseSensitive checkbox -
showDistribution checkbox -
maxResults number -

响应格式

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
JSON数据: JSON数据

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-text-pattern-stats": {
      "name": "text-pattern-stats",
      "description": "统计和分析文本中的模式频率(数字、邮箱、URL等)",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=text-pattern-stats",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

如果遇见问题,请联系我们:[email protected]