关键信息
- 分类
- 文档与 PDF
- 输入类型
- file, checkbox
- 输出类型
- text
- 样本覆盖
- 4
- 支持 API
- Yes
概览
本工具专门用于读取 PDF 文件中的 AcroForm 表单数据,能够快速提取所有表单字段的名称、类型、当前填充值以及可选选项,并直接将其导出为结构化的 JSON 字符串。该工具采用纯前端技术安全运行,只读不修改源文件,方便您快速分析 PDF 表单结构或提取已填写的表单数据。
适用场景
- •需要批量提取或备份已填写 PDF 表单中的用户输入数据时。
- •在开发 PDF 自动填写程序前,需要分析空白 PDF 模板的表单字段结构和字段名称时。
- •需要核对 PDF 表单中下拉菜单、单选框等控件的预设选项值时。
工作原理
- •上传包含 AcroForm 表单的 PDF 文件。
- •根据需要勾选是否包含空字段以及是否包含单选/下拉框的字段选项。
- •工具在浏览器本地解析 PDF,并将提取出的字段名称、类型、当前值及选项以 JSON 格式直接显示在输出区域。
使用场景
用户案例
1. 提取已填写申请表的数据
数据录入员- 背景原因
- 录入员收到了客户填写的 PDF 格式申请表,需要将里面的姓名、同意条款状态以及会员级别等信息录入到系统数据库中。
- 解决问题
- 手动复制 PDF 表单中的内容效率低下且容易出错。
- 如何使用
- 上传已填写的 PDF 申请表文件,保持“包含空字段”和“包含字段选项”为勾选状态,点击运行。
- 示例配置
-
开启 includeEmptyFields 和 includeFieldOptions - 效果
- 输出区直接生成了包含姓名、同意条款状态和会员级别的 JSON 字符串,方便直接复制或解析。
2. 分析空白 PDF 表单模板结构
后端开发人员- 背景原因
- 开发人员需要编写一个自动填充 PDF 合同的脚本,但不知道 PDF 模板中各个输入框的具体字段 Key。
- 解决问题
- 需要获取空白 PDF 模板中所有表单字段的精确名称和类型,以便在代码中进行映射。
- 如何使用
- 上传空白的 PDF 模板文件,勾选“包含空字段”以确保未填写的字段也能被导出,运行后查看 JSON。
- 示例配置
-
开启 includeEmptyFields - 效果
- 成功获取到包含所有表单字段名称、类型及下拉选项的 JSON 结构,明确了代码对接的字段名。
用 Samples 测试
json, pdf, file相关专题
常见问题
这个工具会修改我的原始 PDF 文件吗?
不会,本工具为只读操作,仅提取表单数据并输出为 JSON,不会对上传的 PDF 文件进行任何修改。
导出的 JSON 数据可以直接下载为文件吗?
导出的 JSON 结果会直接显示在页面的输出文本框中,您可以直接复制使用,本工具不提供单独的 JSON 文件下载。
为什么有些 PDF 文件的表单字段无法提取?
本工具仅支持标准的 AcroForm 表单。如果 PDF 使用的是 XFA 表单或只是普通的扁平化文本,将无法提取出表单字段。
包含空字段和包含字段选项这两个选项有什么作用?
“包含空字段”决定是否导出未填写的表单项;“包含字段选项”决定是否导出下拉菜单或单选框等控件的可用候选值。
我的 PDF 文件会被上传到服务器吗?
不会,本工具基于纯 JS 在您的浏览器本地完成解析,文件数据不会上传到任何服务器,确保您的隐私安全。