PDF转Excel

从PDF文件中提取表格数据并转换为Excel电子表格,支持自定义解析选项

使用纯Node.js将包含表格的PDF文档转换为Excel格式。

示例结果

1 个示例

PDF表格转Excel

从PDF中提取表格数据并转换为Excel格式

pdf-to-excel-output.xlsx 查看文件
查看输入参数
{ "sourceFile": "/public/samples/pdf/table-data.pdf", "delimiter": "auto", "hasHeader": true }

Click to upload file or drag and drop file here

Maximum file size: 50MB Supported formats: application/pdf

关键信息

分类
文档与 PDF
输入类型
file, select, checkbox, text
输出类型
file
样本覆盖
4
支持 API
Yes

概览

PDF转Excel工具能够高效地从PDF文档中提取表格数据,并将其转换为标准的Excel电子表格(.xlsx)。该工具支持自定义列分隔符、自动识别表头、跳过空行以及自动调整列宽,帮助您快速将静态的PDF数据转化为可编辑、可分析的结构化表格。

适用场景

  • 需要将PDF格式的财务报表、销售数据或统计表格导入Excel进行二次计算和分析时。
  • 面对包含大量空白行或特殊列分隔符的PDF表格,需要自定义解析规则以确保转换格式整洁时。
  • 希望快速提取PDF中的单张表格并直接生成带有自定义工作表名称的Excel文件时。

工作原理

  • 上传需要转换的PDF文件(支持最大50MB的PDF文档)。
  • 根据PDF表格的排版特征,选择列分隔符(如自动检测、逗号或制表符),并设置是否保留首行标题、跳过空行及自动调整列宽。
  • 点击转换按钮,系统将解析PDF中的表格结构并生成一个可下载的Excel(.xlsx)文件。

使用场景

财务报表整理:将PDF格式的季度财务报告或银行对账单转换为Excel,便于进行公式计算和财务审计。
学术数据提取:从PDF格式的学术论文或行业报告中提取实验数据表格,导入Excel进行数据分析。
销售业绩汇总:将PDF格式的客户名单或销售业绩表转换为电子表格,方便销售团队进行筛选和排序。

用户案例

1. 财务对账单数据提取

财务专员
背景原因
收到一份PDF格式的年度供应商对账单,需要将里面的表格数据导入Excel进行核对。
解决问题
手动复制PDF表格容易错行,且格式混乱,需要快速且整洁地提取数据。
如何使用
上传对账单PDF,保持“首行包含标题”和“自动调整列宽”勾选,设置工作表名称为“2025对账明细”,点击转换。
示例配置
PDF文件: statement.pdf, 列分隔符: 自动检测, 首行包含标题: 开启, 跳过空行: 开启, 工作表名称: 2025对账明细
效果
成功生成一个排版整齐的Excel文件,列宽已自动适应,且工作表命名为“2025对账明细”,可直接用于公式计算。

2. 转换特殊分隔符的PDF数据表

数据分析师
背景原因
拥有一份使用竖线(|)作为列分隔符的PDF格式原始数据集。
解决问题
默认的自动检测可能无法完美切分这种特殊符号分隔的列。
如何使用
上传该PDF文件,在“列分隔符”下拉菜单中选择“Pipe (|)”,并勾选“跳过空行”。
示例配置
PDF文件: dataset.pdf, 列分隔符: Pipe (|), 首行包含标题: 开启, 跳过空行: 开启
效果
提取出的Excel表格严格按照竖线符号进行了分列,没有出现错位,且过滤掉了所有无意义的空行。

用 Samples 测试

xlsx, xls, pdf

相关专题

常见问题

该工具支持转换扫描件或图片格式的PDF吗?

本工具主要用于从包含文本和表格数据的可编辑PDF中提取内容,暂不支持OCR扫描件或纯图片PDF的识别。

转换后的Excel文件支持自定义工作表名称吗?

支持。您可以在转换前在“工作表名称”输入框中指定自定义的名称,默认名称为“Sheet1”。

如果PDF表格的列对齐不规范,该如何处理?

您可以通过调整“列分隔符”选项(如选择制表符、竖线、逗号或多空格)来匹配PDF的排版,以获得更准确的列划分。

可以一次性上传并转换多个PDF文件吗?

不可以,本工具目前仅支持单文件上传与转换。

转换时如何处理PDF中的空白行?

默认情况下勾选了“跳过空行”选项,工具会自动过滤掉无数据的空白行;如果需要保留完整结构,可以取消勾选该选项。

API 文档

请求端点

POST /zh/api/tools/pdf-to-excel

请求参数

参数名 类型 必填 描述
sourceFile file (需要先上传) -
delimiter select -
hasHeader checkbox -
skipEmptyRows checkbox -
autoColumnWidth checkbox -
sheetName text -

文件类型参数需要先通过 POST /upload/pdf-to-excel 上传获取 filePath,然后将 filePath 传递给对应的文件字段。

响应格式

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
文件: 文件

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-pdf-to-excel": {
      "name": "pdf-to-excel",
      "description": "从PDF文件中提取表格数据并转换为Excel电子表格,支持自定义解析选项",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-to-excel",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

支持 URL 文件链接或 Base64 编码作为文件参数。

如果遇见问题,请联系我们:[email protected]