PDF 表单数据导出

读取 PDF AcroForm 字段的名称、类型和当前值,并导出为 JSON 字符串

读取 PDF 的 AcroForm 并将每个字段(名称、类型、当前值、选项)导出为 JSON 字符串(直接显示在输出区,不生成下载文件)。它是表单填写器的反向操作:只读不改源 PDF。基于 pdf-lib 的纯 JS 实现。

示例结果

2 个示例

导出已填表单值为 JSON

读取所有 AcroForm 字段(文本、复选、单选、下拉)并导出名称与值为 JSON 字符串。

{
  "sourceFile": "form-sample-acroform.pdf",
  "hasXfa": false,
  "count": 5,
  "totalFields": 5,
  "fields": [
    {
      "name": "full_name",
      "type": "text",
      "value": "Alex Doe",
      "required": true,
      "readOnly": false
    },
    {
      "name": "agree_terms",
      "type": "checkbox",
      "value": true,
      "required": false,
      "readOnly": false
    },
    {
      "name": "tier",
      "type": "radio",
      "value": "pro",
      "required": false,
      "readOnly": false,
      "options": [
        "basic",
        "pro"
      ]
    }
  ],
  "values": {
    "full_name": "Alex Doe",
    "agree_terms": true,
    "tier": "pro"
  }
}
查看输入参数
{ "pdfFile": "/public/samples/pdf/form-sample-acroform.pdf", "includeEmptyFields": true, "includeFieldOptions": true }

查看空白表单模板结构

导出空白模板的字段结构(名称、类型、选项)为 JSON 字符串,便于准备填写数据。

{
  "sourceFile": "form-template-blank.pdf",
  "count": 3,
  "fields": [
    {
      "name": "applicant_name",
      "type": "text",
      "value": "",
      "required": true,
      "readOnly": false
    },
    {
      "name": "department",
      "type": "dropdown",
      "value": "",
      "required": false,
      "readOnly": false,
      "options": [
        "Engineering",
        "Design",
        "Sales"
      ]
    }
  ],
  "values": {
    "applicant_name": "",
    "department": ""
  }
}
查看输入参数
{ "pdfFile": "/public/samples/pdf/form-template-blank.pdf", "includeEmptyFields": true, "includeFieldOptions": true }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Include fields that have no value in the export

Include available options for radio/dropdown/list fields

关键信息

分类
文档与 PDF
输入类型
file, checkbox
输出类型
text
样本覆盖
4
支持 API
Yes

概览

本工具专门用于读取 PDF 文件中的 AcroForm 表单数据,能够快速提取所有表单字段的名称、类型、当前填充值以及可选选项,并直接将其导出为结构化的 JSON 字符串。该工具采用纯前端技术安全运行,只读不修改源文件,方便您快速分析 PDF 表单结构或提取已填写的表单数据。

适用场景

  • 需要批量提取或备份已填写 PDF 表单中的用户输入数据时。
  • 在开发 PDF 自动填写程序前,需要分析空白 PDF 模板的表单字段结构和字段名称时。
  • 需要核对 PDF 表单中下拉菜单、单选框等控件的预设选项值时。

工作原理

  • 上传包含 AcroForm 表单的 PDF 文件。
  • 根据需要勾选是否包含空字段以及是否包含单选/下拉框的字段选项。
  • 工具在浏览器本地解析 PDF,并将提取出的字段名称、类型、当前值及选项以 JSON 格式直接显示在输出区域。

使用场景

收集并整理用户提交的 PDF 申请表、问卷等表单中的数据。
提取 PDF 模板的字段 Schema,用于自动化表单填写系统的配置。
快速检查 PDF 表单中各个交互式组件的属性和默认值。

用户案例

1. 提取已填写申请表的数据

数据录入员
背景原因
录入员收到了客户填写的 PDF 格式申请表,需要将里面的姓名、同意条款状态以及会员级别等信息录入到系统数据库中。
解决问题
手动复制 PDF 表单中的内容效率低下且容易出错。
如何使用
上传已填写的 PDF 申请表文件,保持“包含空字段”和“包含字段选项”为勾选状态,点击运行。
示例配置
开启 includeEmptyFields 和 includeFieldOptions
效果
输出区直接生成了包含姓名、同意条款状态和会员级别的 JSON 字符串,方便直接复制或解析。

2. 分析空白 PDF 表单模板结构

后端开发人员
背景原因
开发人员需要编写一个自动填充 PDF 合同的脚本,但不知道 PDF 模板中各个输入框的具体字段 Key。
解决问题
需要获取空白 PDF 模板中所有表单字段的精确名称和类型,以便在代码中进行映射。
如何使用
上传空白的 PDF 模板文件,勾选“包含空字段”以确保未填写的字段也能被导出,运行后查看 JSON。
示例配置
开启 includeEmptyFields
效果
成功获取到包含所有表单字段名称、类型及下拉选项的 JSON 结构,明确了代码对接的字段名。

用 Samples 测试

json, pdf, file

相关专题

常见问题

这个工具会修改我的原始 PDF 文件吗?

不会,本工具为只读操作,仅提取表单数据并输出为 JSON,不会对上传的 PDF 文件进行任何修改。

导出的 JSON 数据可以直接下载为文件吗?

导出的 JSON 结果会直接显示在页面的输出文本框中,您可以直接复制使用,本工具不提供单独的 JSON 文件下载。

为什么有些 PDF 文件的表单字段无法提取?

本工具仅支持标准的 AcroForm 表单。如果 PDF 使用的是 XFA 表单或只是普通的扁平化文本,将无法提取出表单字段。

包含空字段和包含字段选项这两个选项有什么作用?

“包含空字段”决定是否导出未填写的表单项;“包含字段选项”决定是否导出下拉菜单或单选框等控件的可用候选值。

我的 PDF 文件会被上传到服务器吗?

不会,本工具基于纯 JS 在您的浏览器本地完成解析,文件数据不会上传到任何服务器,确保您的隐私安全。

API 文档

请求端点

POST /zh/api/tools/pdf-form-data-export

请求参数

参数名 类型 必填 描述
pdfFile file (需要先上传) -
includeEmptyFields checkbox Include fields that have no value in the export
includeFieldOptions checkbox Include available options for radio/dropdown/list fields

文件类型参数需要先通过 POST /upload/pdf-form-data-export 上传获取 filePath,然后将 filePath 传递给对应的文件字段。

响应格式

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
文本: 文本

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-pdf-form-data-export": {
      "name": "pdf-form-data-export",
      "description": "读取 PDF AcroForm 字段的名称、类型和当前值,并导出为 JSON 字符串",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-form-data-export",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

支持 URL 文件链接或 Base64 编码作为文件参数。

如果遇见问题,请联系我们:[email protected]