分类

文本提取器

提取特定模式(电子邮件、电话、URL、数字)

关键信息

分类
Text Processing
输入类型
textarea, select, text, checkbox
输出类型
text
样本覆盖
4
支持 API
Yes

概览

文本提取器是一款高效的在线工具,旨在帮助用户从杂乱的文本中快速筛选并提取电子邮件、电话号码、URL、数字或日期等特定信息,支持自定义正则表达式以满足复杂的数据处理需求。

适用场景

  • 从长篇文档或网页内容中快速整理联系人列表时。
  • 需要从非结构化文本中清洗出特定格式的数据进行分析时。
  • 在处理大量日志或代码片段,需要提取特定标识符或数值时。

工作原理

  • 将需要处理的原始文本粘贴到输入框中。
  • 在“提取类型”中选择预设模式(如电子邮件、电话),或选择“自定义”并输入正则表达式。
  • 根据需求选择输出格式(如列表、逗号分隔或仅统计数量)。
  • 点击执行,工具将自动扫描并提取符合条件的所有内容。

使用场景

市场营销:从客户反馈或评论中批量提取联系邮箱。
数据分析:从非结构化报告中提取所有关键数值进行汇总。
网络爬虫:从抓取的网页源代码中提取所有链接地址。

用户案例

1. 批量提取客户联系邮箱

市场专员
背景原因
从一份包含数百条客户反馈的文档中,需要整理出所有有效的联系邮箱地址。
解决问题
手动查找效率极低且容易遗漏。
如何使用
将反馈文本粘贴到输入框,选择“Email Addresses”,输出格式选择“Unique Items”。
示例配置
extractType: emails, outputFormat: unique
效果
快速获得一份去重后的干净邮箱列表,可直接用于邮件营销。

2. 从日志中提取关键错误代码

后端开发工程师
背景原因
需要从数千行的服务器日志中提取所有以 'ERR-' 开头的错误代码。
解决问题
日志量巨大,无法通过肉眼筛选。
如何使用
选择“自定义”模式,输入正则表达式 'ERR-\d+',输出格式选择“List”。
示例配置
extractType: custom, customPattern: ERR-\d+, outputFormat: list
效果
瞬间提取出所有错误代码,方便进行故障排查和统计。

用 Samples 测试

text

相关专题

常见问题

文本提取器支持哪些预设模式?

目前支持提取电子邮件、电话号码、URL、数字和日期。

如果预设模式无法满足需求怎么办?

您可以选择“自定义”模式,并输入您自己的正则表达式(Regex)来匹配特定的文本格式。

可以去除提取结果中的重复项吗?

可以,在“输出格式”选项中选择“唯一项(Unique Items)”即可自动过滤重复内容。

该工具是否区分大小写?

是的,您可以勾选“区分大小写”选项来控制匹配逻辑。

提取结果支持哪些导出格式?

支持按行列表、逗号分隔、仅统计数量或提取唯一项四种格式。

API 文档

请求端点

POST /zh/api/tools/text-extractor

请求参数

参数名 类型 必填 描述
textInput textarea -
extractType select -
customPattern text -
caseSensitive checkbox -
outputFormat select -

响应格式

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
文本: 文本

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-text-extractor": {
      "name": "text-extractor",
      "description": "提取特定模式(电子邮件、电话、URL、数字)",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=text-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

如果遇见问题,请联系我们:[email protected]