关键信息
- 分类
- Data Processing
- 输入类型
- textarea, select, checkbox, number
- 输出类型
- json
- 样本覆盖
- 4
- 支持 API
- Yes
概览
隐私信息扫描器是一款用于检测文本或日志中个人身份信息(PII)的在线工具。它能快速识别并标注出电子邮件、电话号码、身份证号、信用卡号等敏感数据的位置与类型,帮助您进行数据脱敏和合规性检查。
适用场景
- •在共享或发布日志、用户反馈等文本数据前,需要移除或匿名化其中的个人敏感信息时。
- •进行GDPR、CCPA等数据隐私法规的合规性自查,确保数据集中不包含未受保护的PII时。
- •对内部文档、代码注释或配置文件进行安全审计,排查意外泄露的API密钥、内部凭证等信息时。
工作原理
- •在文本框中输入或粘贴需要扫描的文本内容。
- •从列表中选择需要扫描的隐私信息类型,例如电子邮件、电话号码、身份证号等。
- •点击扫描按钮,工具将使用预定义的正则表达式模式对文本进行匹配分析。
- •扫描完成后,工具将以结构化JSON格式输出结果,清晰列出每个匹配项的类型、内容、位置及可选的前后文。
使用场景
用户案例
1. 客服日志脱敏
数据分析师- 背景原因
- 公司需要将上一季度的客服聊天记录用于训练AI模型,但日志中包含大量用户的邮箱和手机号。
- 解决问题
- 手动查找并替换数百条记录中的PII效率极低,且容易遗漏。
- 如何使用
- 将导出的聊天记录文本粘贴到输入框,勾选“电子邮件地址”和“电话号码”扫描类型,开启“包含上下文”以确认匹配无误。
- 效果
- 工具快速输出所有邮箱和电话号码的位置列表,分析师根据此列表编写脚本,将这些信息统一替换为“[REDACTED]”,完成数据脱敏。
2. 数据导出合规检查
- 背景原因
- 市场部门计划将一份包含用户反馈的Excel表格分享给合作伙伴,需要确保其中不包含任何个人隐私信息。
- 解决问题
- 表格内容混杂,人工逐行检查姓名、身份证号等信息耗时费力。
- 如何使用
- 将Excel表格中相关列的内容复制为纯文本,粘贴到工具中。选择扫描“国民身份证”、“电子邮件地址”等所有相关类型。
- 效果
- 扫描结果显示有3条记录包含疑似身份证号。根据定位信息,返回Excel中精确删除或模糊化这些单元格内容后,再安全地分享文件。
用 Samples 测试
text相关专题
常见问题
这个工具能识别哪些类型的个人身份信息?
支持识别电子邮件地址、电话号码、社会保障号码(SSN)、信用卡号、IP地址、网址、护照号码、国民身份证号、银行账户(IBAN)和API密钥等多种常见PII类型。
我可以上传文件进行扫描吗?
目前本工具仅支持直接输入或粘贴文本内容。您需要先将文件内容提取为纯文本,再粘贴到输入框中进行扫描。
扫描结果是什么格式?
扫描结果以JSON格式返回,是一个包含多个匹配对象的数组。每个对象详细记录了匹配到的PII类型、具体内容、在原文中的起始和结束位置。
“包含上下文”选项有什么作用?
开启后,每个匹配结果会额外包含该PII前后指定数量的字符。这有助于您理解该信息出现的语境,判断其是否为误报或需要特别处理。
我的文本数据会被存储吗?
不会。所有扫描操作均在您的浏览器本地完成,文本内容不会上传至任何服务器,确保您的数据隐私与安全。