什么是 OCR 文本层？

OCR 文本层是在原有的 PDF 图片上方叠加的一层透明文字，它保留了原文档的视觉外观，同时赋予了文档可搜索和可复制的功能。

支持哪些语言的识别？

工具支持多种语言识别，您可以通过设置参数（如 eng 或 eng+chi_sim）来指定识别的语言类型。

DPI 设置越高越好吗？

通常 300 DPI 是平衡识别准确率与处理速度的最佳选择。过高的 DPI 会增加处理时间，过低则可能影响识别精度。

处理后的 PDF 文件大小会变大吗？

由于添加了额外的文本层，文件大小可能会略有增加，但通常在可接受范围内。

该工具支持批量处理吗？

目前该工具支持单文件上传处理，您可以逐个上传并转换您的扫描文档。

Elysia Tools

导航

PDF Tools

PDF OCR 文本层

为扫描版 PDF 添加 OCR 文本层，使其可搜索/可复制

详情

这个工具可以帮你完成什么

先将PDF页面转为图片，再用 Tesseract 逐页OCR并合并，输出可检索可复制的文本层PDF。

执行

运行这个工具

填写表单、运行工具，并在同一页面查看结果。

预设示例运行

点击示例可自动填充表单；文件类型仍需手动上传。

2 个示例

标准OCR文本层

使用英文OCR、300DPI和默认分割模式生成可搜索PDF

{
  "type": "file",
  "filePath": "/public/samples/pdf/pdf-ocr-text-layer-example1.pdf"
}

快速OCR（低DPI）

使用200DPI和psm=6提升处理速度并减小输出体积

{
  "type": "file",
  "filePath": "/public/samples/pdf/pdf-ocr-text-layer-example2.pdf"
}

输入参数

填写必要字段后运行工具。

5 个选项

文件上传此流程需要的源文件。1

源PDF文件file必填

单文件最大体积：100 MB支持格式：application/pdf

内容粘贴或输入主要内容。1

OCR语言text可选

参数设置调整格式、范围、数值和模式。3

输入DPInumber可选OCR引擎模式number可选页面分割模式number可选

结果

等待运行

运行工具后，这里会展示文件、文本、结构化数据或流式返回结果。

案例

PDF OCR 文本层

这个工具可以帮你完成什么

运行这个工具

预设示例运行

输入参数

结果

与这个工具匹配的案例

继续查看相关工具与专题

预设示例运行

输入参数

结果

详细了解工具的适用范围、支持能力及用户案例。

关键事实

概览

适用场景

使用方式

常见用途

示例

1. 标准 OCR 文本层生成

2. 快速 OCR 处理

常见问题

PDF示例

Markdown 幻灯片示例

中英混合文本示例

大小写转换样本

PDF去噪

PDF 在线添加签名

批量 PDF 水印

PDF去歪斜

PDF 转换与文档导出工具

文档 OCR 与结构化提取工具

PDF 转 LLM 与 RAG 预处理工具

PDF 归档、无障碍与可信交付工具