PDF 删除线审阅提取器

检测 PDF 审阅稿中的删除线内容,并生成适合合同、制度和修订稿分析的报告

上传 PDF 后,工具会开启 OpenDataLoader 的删除线检测,并从 JSON 与 Markdown 输出中提取被删除或被审阅标记的文本,帮助你快速核查修订差异。

示例结果

1 个示例

提取审阅稿中被删除的条款

真实 sample 会列出带删除线的候选文本,方便快速核对。

pdf-strikethrough-review-extractor-example1.html 查看文件
查看输入参数
{ "pdfFile": "/public/samples/pdf/pdf-strikethrough-review-extractor-source-example1.pdf", "pages": "", "useStructTree": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

关键信息

分类
开发与 Web
输入类型
file, text, checkbox
输出类型
html
样本覆盖
4
支持 API
Yes

概览

PDF 删除线审阅提取器是一款专门用于检测和提取 PDF 文档中被划掉(删除线)内容的工具。它利用 OpenDataLoader 技术精准识别审阅标记,并生成结构化的报告,帮助用户在合同审核、制度修订和文稿校对过程中快速定位被删除的关键条款或信息。

适用场景

  • 需要核对法律合同中被对方删除的特定条款时
  • 审计公司内部规章制度的修订版本,确认哪些旧规定已被废除
  • 在多轮编辑审阅过程中,快速汇总所有被标记为删除的文本内容

工作原理

  • 上传需要分析的 PDF 审阅稿文件,并根据需要指定页码范围
  • 系统调用 OpenDataLoader 引擎,扫描文档中的图形层和文本层以识别删除线标记
  • 提取被删除线覆盖的文本内容,并结合文档结构树保持上下文关联
  • 生成一份直观的 HTML 报告,清晰展示所有被删除的文本及其在原文档中的位置

使用场景

法律合规审查:快速提取合同修订稿中被剔除的免责条款或违约责任说明
政策文件比对:在制度更新时,自动汇总旧版文件中不再适用的条文
出版校对:编辑可以一键导出审阅者在样稿中划掉的所有冗余文字,方便后续修改

用户案例

1. 提取合同修订中的删除条款

法务专员
背景原因
在处理一份长达 50 页的并购合同时,对方发回了带有大量删除线标记的修订稿。
解决问题
手动查找并记录所有被删除的条款非常低效,且容易遗漏细微的改动。
如何使用
上传合同 PDF,勾选“使用结构树”以保持章节逻辑,点击运行。
效果
获得一份 HTML 报告,按章节顺序列出了所有被删除的法律条文,方便逐条评估风险。

2. 审计公司年度手册更新

合规审计师
背景原因
公司发布了新版员工手册,审计师需要确认旧版中关于差旅补贴的哪些具体规定已被移除。
解决问题
需要从复杂的排版中精准剥离出带有删除线的旧规定,避免与新增内容混淆。
如何使用
上传手册 PDF,在页码范围输入相关章节所在的页码(如 12-15)。
效果
快速提取出所有被划掉的补贴标准,直接用于编写审计差异报告。

用 Samples 测试

pdf, text, file

相关专题

常见问题

该工具支持哪些文件格式?

目前仅支持 PDF 格式的文档。

如何只处理文档中的特定几页?

您可以在“页码范围”选项中输入具体的页码(如 1, 3)或范围(如 5-7)。

“使用结构树”选项有什么作用?

开启后,工具会尝试根据 PDF 的内部结构(如标题、段落)来组织提取的内容,使报告更具可读性。

提取的结果以什么形式展示?

工具会生成一个 HTML 页面,列出所有检测到的删除线文本及其对应的审阅上下文。

它能识别手写的删除线吗?

该工具主要针对电子文档中通过 PDF 编辑软件添加的标准删除线标记进行检测。

API 文档

请求端点

POST /zh/api/tools/pdf-strikethrough-review-extractor

请求参数

参数名 类型 必填 描述
pdfFile file (需要先上传) -
pages text -
useStructTree checkbox -

文件类型参数需要先通过 POST /upload/pdf-strikethrough-review-extractor 上传获取 filePath,然后将 filePath 传递给对应的文件字段。

响应格式

{
  "result": "
Processed HTML content
", "error": "Error message (optional)", "message": "Notification message (optional)", "metadata": { "key": "value" } }
HTML: HTML

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-pdf-strikethrough-review-extractor": {
      "name": "pdf-strikethrough-review-extractor",
      "description": "检测 PDF 审阅稿中的删除线内容,并生成适合合同、制度和修订稿分析的报告",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-strikethrough-review-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

支持 URL 文件链接或 Base64 编码作为文件参数。

如果遇见问题,请联系我们:[email protected]