关键信息
- 分类
- Text Processing
- 输入类型
- textarea, select, text, checkbox
- 输出类型
- text
- 样本覆盖
- 4
- 支持 API
- Yes
概览
过滤文本段落工具能快速从输入文本中提取符合特定模式或条件的段落,支持多种过滤类型和输出格式,简化文本处理任务。
适用场景
- •当您需要从长文档中搜索包含特定关键词或短语的段落时。
- •当您想使用正则表达式匹配复杂模式来筛选文本段落时。
- •当您需要根据段落长度、词数或行数等条件过滤内容时。
工作原理
- •在文本输入区域粘贴或输入要处理的文本。
- •选择过滤类型,如‘包含文本’、‘正则表达式’或‘段落长度’。
- •根据所选类型设置模式、文本或条件参数。
- •配置输出格式和其他选项,如删除重复项或排序,然后获取结果。
使用场景
从服务器日志中提取所有包含错误代码的段落进行分析。
在学术论文中筛选出引用参考文献的段落。
整理客户反馈邮件,提取提到特定产品名称的段落。
用户案例
1. 提取包含特定关键词的段落
- 背景原因
- 用户有一份市场调研报告,需要快速找到所有提及‘竞争对手’的段落。
- 解决问题
- 报告内容冗长,手动查找关键词段落效率低下。
- 如何使用
- 将报告文本粘贴到输入框,选择过滤类型为‘包含文本’,输入‘竞争对手’,设置输出格式为双换行符分隔。
- 效果
- 立即获得所有包含‘竞争对手’的段落列表,便于进一步分析。
2. 使用正则表达式提取邮箱地址段落
- 背景原因
- 从一份联系人列表文本中,需要定位所有包含邮箱地址的段落。
- 解决问题
- 文本中邮箱地址格式多样,直接搜索不准确。
- 如何使用
- 输入文本,选择过滤类型为‘正则表达式’,输入邮箱匹配模式,如‘[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}’。
- 效果
- 返回所有包含有效邮箱地址的段落,方便提取联系人信息。
3. 筛选短段落用于摘要生成
- 背景原因
- 用户需要从一篇长文章中提取短段落来创建摘要。
- 解决问题
- 文章段落长度不一,手动筛选短段落耗时。
- 如何使用
- 选择过滤类型为‘段落长度’,设置最大长度为150字符,输出格式为编号列表。
- 效果
- 获得所有长度不超过150字符的段落,并以编号列表形式展示,便于整理摘要。
用 Samples 测试
video, text, regex相关专题
常见问题
工具支持哪些过滤类型?
支持包含文本、开始于、结束于、完全匹配、正则表达式、段落长度、词数统计等多种过滤类型。
如何定义段落的分隔方式?
可以通过‘段落分隔符’选项选择双换行符、单换行符或空行来分隔段落。
可以去除重复的段落吗?
是的,勾选‘删除重复项’选项即可自动去除重复段落。
输出结果有哪些格式可选?
输出格式包括双换行符分隔、单换行符、空格、编号列表、项目符号、HTML和Markdown。
匹配时是否区分大小写?
默认不区分大小写,但可以通过‘区分大小写’选项启用大小写敏感匹配。