关键信息
- 分类
- Development
- 输入类型
- textarea, checkbox, number
- 输出类型
- json
- 样本覆盖
- 4
- 支持 API
- Yes
概览
多规则批量匹配工具允许您一次性对文本执行多个正则表达式模式匹配。通过定义标签、模式和可选标志,您可以高效地从文本中提取多种信息,如邮箱、电话号码或网址,适用于批量数据处理和分析。
适用场景
- •当需要从大量文本中批量提取多种类型的信息时。
- •当处理日志文件或数据报告,需要同时匹配多个正则表达式模式时。
- •当进行数据清洗或验证,需要检查文本是否符合多个规则时。
工作原理
- •在文本输入框中粘贴或输入要搜索的文本内容。
- •在模式定义框中,每行定义一个模式,格式为“标签|模式|标志”,例如“邮箱|\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b|gi”。
- •根据需要设置选项,如区分大小写、显示空模式或限制每个模式的最大匹配数。
- •执行后,工具返回JSON格式的结果,显示每个标签的匹配项列表。
使用场景
从网页或文档中批量提取联系信息,如邮箱和电话号码。
分析服务器日志,同时匹配错误代码、IP地址和时间戳等模式。
验证用户输入文本,检查是否包含邮箱、网址等多种格式。
用户案例
1. 批量提取联系信息
数据分析师- 背景原因
- 从一份包含混合文本的报告中,需要提取所有邮箱地址和电话号码。
- 解决问题
- 手动查找效率低下,容易遗漏关键信息。
- 如何使用
- 粘贴报告文本到输入框,然后在模式定义中配置邮箱和电话号码的正则表达式。
- 示例配置
-
邮箱|\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b|gi 电话|\b\d{3}-\d{3}-\d{4}\b|g - 效果
- 工具返回所有匹配的邮箱地址和电话号码列表,便于导出或进一步分析。
2. 日志文件多模式匹配
- 背景原因
- 系统日志文件包含大量条目,需要同时提取错误消息和用户ID。
- 解决问题
- 日志量大,手动分析耗时且容易出错。
- 如何使用
- 输入日志文本,定义错误模式和用户ID模式进行匹配。
- 示例配置
-
错误|ERROR:.*|gi 用户ID|user_id:\d+|g - 效果
- 快速识别日志中的错误条目和相关用户ID,加速故障排查和监控。
用 Samples 测试
text, regex正则表达式模式替代方案
多种编写相同正则表达式模式的方法,在可读性、性能和准确性方面有不同的权衡
title token pattern
正则表达式命名捕获组
使用命名捕获组从文本中提取结构化数据的正则表达式模式集合。命名组通过为捕获的部分分配有意义的名称,使模式更易读和更易维护。
matched family text,regex
Glob 模式示例
Glob 模式示例,用于文件匹配,从基本到复杂模式
title token pattern
多租户架构示例
全面的多租户架构模式,涵盖数据隔离、租户管理、资源配额和白标解决方案
title token multi
相关专题
常见问题
模式定义中的标志有哪些?
标志包括g(全局匹配)、i(不区分大小写)、m(多行模式)、s(点匹配换行符)和u(Unicode模式),均为可选。
如何定义多个模式?
在模式定义框中,每行输入一个模式,格式为标签|模式|标志,例如:邮箱|模式|gi。
结果是什么格式?
结果以JSON格式返回,包含每个标签的匹配列表,便于程序处理或查看。
可以限制匹配数量吗?
是的,通过设置“每个模式最大匹配数”选项,可以限制每个模式返回的匹配项数量,默认为50。
如果模式没有匹配项会怎样?
如果启用了“显示空模式”选项,未匹配的模式也会在结果中显示为空列表;否则,只显示有匹配的模式。