Text Processing
清理和消毒文件名,移除Windows、Linux和Mac的非法字符
filename-sanitizerText Processing
从文本中移除所有非字母数字的特殊字符,提供灵活的保留选项
non-alphanumeric-cleanerText Processing
移除文本中所有没有任何内容的空行
empty-line-removerText Processing
将连续的多个空格/制表符替换为单个空格;去除行首行尾空白
whitespace-normalizerText Processing
从文本中提取多种格式的日期,包括中文、ISO和美国格式,提供详细分析和摘要
date-extractorText Processing
从HTML代码中移除标签并提取纯文本内容
new-html-tag-stripperText Processing
自动检测并脱敏文本中的敏感信息,如手机号码、电子邮件、身份证号和银行卡号
sensitive-data-maskerText Processing
从文本中提取所有Unicode表情符号,或者可选择删除表情符号
emoji-extractorText Processing
从社交媒体文本(如Twitter、Instagram等)中提取话题标签(#话题)和用户提及(@用户名)。
hashtag-mention-extractorText Processing
从HTML源代码中提取图片URL(src属性)。支持懒加载图片和srcset属性。
image-source-extractorText Processing
从日志文件、服务器日志、网络跟踪或任何文本内容中提取IPv4和IPv6地址
ip-address-extractorText Processing
在文本内容中查找、格式化和标准化电话号码
text-phone-normalizer