PDF 对比

逐页对比两个 PDF 文档,高亮文本差异

从两个 PDF 逐页提取文本,在词级、行级或字符级进行差异比对,报告每页状态和整体相似度。

示例结果

1 个示例

对比两版 PDF

在词级别找出原版与修订版的文本差异。

{
  "pageCountOriginal": 6,
  "pageCountModified": 6,
  "overallSimilarity": 0.94
}
查看输入参数
{ "originalFile": "/public/samples/pdf/sample-multipage.pdf", "modifiedFile": "/public/samples/pdf/sample-multipage-revised.pdf", "comparisonMode": "word", "caseSensitive": false, "ignoreWhitespace": true }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

关键信息

分类
文档与 PDF
输入类型
file, select, checkbox
输出类型
json
样本覆盖
4
支持 API
Yes

概览

PDF 对比工具支持在线逐页比较两个 PDF 文档的文本差异。通过提取原文件与修改后文件的文本,您可以在词级、行级或字符级进行精准比对,快速获取每页的修改状态及文档的整体相似度。

适用场景

  • 需要核对合同、协议或法律文件的修订版本,确保没有未授权的改动时。
  • 比较翻译前后的双语 PDF 文档,或校对排版更新后的文档内容时。
  • 检查代码导出的 PDF 报告或学术论文在多次修改前后的文本差异时。

工作原理

  • 上传需要比对的“原 PDF 文件”和“修改后 PDF 文件”。
  • 选择对比模式(词级、行级或字符级),并根据需要设置是否区分大小写或忽略空白差异。
  • 提交后,系统将逐页提取文本并进行差异分析,输出包含相似度和具体差异的 JSON 报告。

使用场景

合同版本校对:法务人员快速比对两份合同 PDF,找出修改、添加或删除的条款。
论文修改稿对比:科研人员对比论文初稿与修改稿,确认导师或审稿人提出的修改意见是否已全部落实。
产品说明书更新检查:技术写作人员比对新旧版本的产品手册,确保更新内容准确无误。

用户案例

1. 商务合同版本差异比对

法务专员
背景原因
收到合作方返回的修改版合同 PDF,需要确认对方具体修改了哪些条款,防止遗漏潜在风险。
解决问题
手动逐字阅读两份几十页的合同非常耗时,且容易遗漏细微的文字修改。
如何使用
上传原版合同作为原文件,上传合作方返回的合同作为修改后文件。选择“字符级”对比模式,勾选“忽略空白差异”,然后运行对比。
示例配置
{"comparisonMode": "char", "caseSensitive": false, "ignoreWhitespace": true}
效果
快速生成对比报告,显示两份合同的整体相似度为 98%,并精准定位到具体条款的修改位置。

2. 英文技术文档更新校验

技术文档工程师
背景原因
软件版本更新后,需要核对新版英文用户手册与旧版手册的文本差异。
解决问题
需要在词级别快速找出所有新增和删除的专业术语,确保文档描述与新功能一致。
如何使用
上传旧版手册和新版手册,将对比模式设置为“词级”,开启“区分大小写”,运行工具。
示例配置
{"comparisonMode": "word", "caseSensitive": true, "ignoreWhitespace": true}
效果
输出 JSON 结果,显示文档页数及 94% 的相似度,并列出所有大小写变化和词汇替换。

用 Samples 测试

pdf, text, file

相关专题

常见问题

这个工具可以对比 PDF 中的图片或扫描件吗?

本工具主要提取并对比 PDF 中的文本内容。如果是纯图片或未经过 OCR 的扫描件,将无法提取文本进行对比。

什么是词级、行级和字符级对比?

词级以词为单位比对,适合英文等分词明确的文本;行级按整行比对,适合结构化文本;字符级逐字比对,适合中文等无空格分词的文本。

忽略空白差异有什么作用?

开启后,工具会忽略空格、制表符和换行符的变化,只专注于实际文字内容的修改。

对比结果会以什么格式呈现?

对比结果以 JSON 格式输出,包含原文件与修改后文件的页数、整体相似度以及具体的差异详情。

上传的 PDF 文件有大小限制吗?

单个 PDF 文件的最大限制为 100MB。

API 文档

请求端点

POST /zh/api/tools/pdf-diff

请求参数

参数名 类型 必填 描述
originalFile file (需要先上传) -
modifiedFile file (需要先上传) -
comparisonMode select -
caseSensitive checkbox -
ignoreWhitespace checkbox -

文件类型参数需要先通过 POST /upload/pdf-diff 上传获取 filePath,然后将 filePath 传递给对应的文件字段。

响应格式

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
JSON数据: JSON数据

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-pdf-diff": {
      "name": "pdf-diff",
      "description": "逐页对比两个 PDF 文档,高亮文本差异",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-diff",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

支持 URL 文件链接或 Base64 编码作为文件参数。

如果遇见问题,请联系我们:[email protected]