关键信息
- 分类
- 文档与 PDF
- 输入类型
- file, select, checkbox
- 输出类型
- json
- 样本覆盖
- 4
- 支持 API
- Yes
概览
PDF 对比工具支持在线逐页比较两个 PDF 文档的文本差异。通过提取原文件与修改后文件的文本,您可以在词级、行级或字符级进行精准比对,快速获取每页的修改状态及文档的整体相似度。
适用场景
- •需要核对合同、协议或法律文件的修订版本,确保没有未授权的改动时。
- •比较翻译前后的双语 PDF 文档,或校对排版更新后的文档内容时。
- •检查代码导出的 PDF 报告或学术论文在多次修改前后的文本差异时。
工作原理
- •上传需要比对的“原 PDF 文件”和“修改后 PDF 文件”。
- •选择对比模式(词级、行级或字符级),并根据需要设置是否区分大小写或忽略空白差异。
- •提交后,系统将逐页提取文本并进行差异分析,输出包含相似度和具体差异的 JSON 报告。
使用场景
用户案例
1. 商务合同版本差异比对
法务专员- 背景原因
- 收到合作方返回的修改版合同 PDF,需要确认对方具体修改了哪些条款,防止遗漏潜在风险。
- 解决问题
- 手动逐字阅读两份几十页的合同非常耗时,且容易遗漏细微的文字修改。
- 如何使用
- 上传原版合同作为原文件,上传合作方返回的合同作为修改后文件。选择“字符级”对比模式,勾选“忽略空白差异”,然后运行对比。
- 示例配置
-
{"comparisonMode": "char", "caseSensitive": false, "ignoreWhitespace": true} - 效果
- 快速生成对比报告,显示两份合同的整体相似度为 98%,并精准定位到具体条款的修改位置。
2. 英文技术文档更新校验
技术文档工程师- 背景原因
- 软件版本更新后,需要核对新版英文用户手册与旧版手册的文本差异。
- 解决问题
- 需要在词级别快速找出所有新增和删除的专业术语,确保文档描述与新功能一致。
- 如何使用
- 上传旧版手册和新版手册,将对比模式设置为“词级”,开启“区分大小写”,运行工具。
- 示例配置
-
{"comparisonMode": "word", "caseSensitive": true, "ignoreWhitespace": true} - 效果
- 输出 JSON 结果,显示文档页数及 94% 的相似度,并列出所有大小写变化和词汇替换。
用 Samples 测试
pdf, text, file相关专题
常见问题
这个工具可以对比 PDF 中的图片或扫描件吗?
本工具主要提取并对比 PDF 中的文本内容。如果是纯图片或未经过 OCR 的扫描件,将无法提取文本进行对比。
什么是词级、行级和字符级对比?
词级以词为单位比对,适合英文等分词明确的文本;行级按整行比对,适合结构化文本;字符级逐字比对,适合中文等无空格分词的文本。
忽略空白差异有什么作用?
开启后,工具会忽略空格、制表符和换行符的变化,只专注于实际文字内容的修改。
对比结果会以什么格式呈现?
对比结果以 JSON 格式输出,包含原文件与修改后文件的页数、整体相似度以及具体的差异详情。
上传的 PDF 文件有大小限制吗?
单个 PDF 文件的最大限制为 100MB。