这个工具支持哪些节点类型的过滤？

支持过滤显示全部节点，或者仅显示标题（heading）、表格（table）和列表（list）节点，方便您快速定位特定结构。

如何只解析 PDF 的部分页面？

您可以在“页码范围”输入框中指定需要解析的页面，例如输入“1-5,8”即可仅提取这些页面的结构数据。

什么是边界框（Bounding Box）？

边界框（BBox）是记录文本或表格在 PDF 页面上具体物理位置的坐标数据，有助于进行精准的版面分析和内容定位。

“脱敏敏感数据”功能有什么作用？

开启该功能后，工具会在解析过程中自动识别并遮蔽常见的敏感信息，保护数据隐私。

导出的结果是什么格式？

工具会直接在浏览器中生成一份交互式的 HTML 报告，您可以在其中直观地浏览 JSON 结构和语义节点。

Elysia Tools

导航

Developer Tools

PDF 转 JSON 结构浏览器

提取 PDF 的 OpenDataLoader JSON 结构，并以浏览器视图查看标题、段落、表格、列表、页码和 bbox

详情

这个工具可以帮你完成什么

上传 PDF 后，工具会生成 OpenDataLoader JSON，然后把识别到的标题、段落、列表、表格与页码、bounding box 一起渲染成结构浏览报告。适合调试解析质量、核对表格识别以及查看文档的语义层。

执行

运行这个工具

填写表单、运行工具，并在同一页面查看结果。

预设示例运行

点击示例可自动填充表单；文件类型仍需手动上传。

1 个示例

浏览品牌指南 PDF 的语义结构

真实 sample 展示了 20 个语义节点，无需手读原始 JSON。

<div>Explorer report showing 20 semantic nodes from brand-guidelines-pdf-example1.pdf with page metadata, node counts, and JSON preview.</div>

输入参数

填写必要字段后运行工具。

6 个选项

文件上传此流程需要的源文件。1

PDF 文件file必填

支持格式：application/pdf

内容粘贴或输入主要内容。2

页码范围text可选搜索词text可选

参数设置调整格式、范围、数值和模式。1

节点类型过滤select可选

开关选项启用或关闭可选行为。2

使用结构树checkbox可选勾选后启用脱敏敏感数据checkbox可选勾选后启用

结果

等待运行

运行工具后，这里会展示文件、文本、结构化数据或流式返回结果。

案例

PDF 转 JSON 结构浏览器

这个工具可以帮你完成什么

运行这个工具

预设示例运行

输入参数

结果

与这个工具匹配的案例

继续查看相关工具与专题

预设示例运行

输入参数

结果

详细了解工具的适用范围、支持能力及用户案例。

关键事实

概览

适用场景

使用方式

常见用途

示例

1. 浏览品牌指南 PDF 的语义结构

2. 提取并核对财务报表中的表格

常见问题

PDF示例

Terraform Plan JSON 样本

JSON 示例

聊天记录 JSON 示例

PDF 注释导出

PDF 表单数据导出

PDF 表格提取到 CSV/JSON

加密 PDF 转换器

PDF 转换与文档导出工具

文档 OCR 与结构化提取工具

PDF 转 LLM 与 RAG 预处理工具

PDF 抽取排障与安全审查工具