分类

PDF文本提取器

从PDF文档中提取文本内容,支持页面选择、格式选项和多语言处理

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

支持最大100MB的PDF文件

指定要提取的页面(1-5为范围,3为单页,1,3,5为多页)。留空则提取所有页面。

尽可能保持原始布局、间距和格式

清理多余的空格和换行符

为提取的文本添加行号

API 文档

请求端点

POST /zh/api/tools/pdf-text-extractor

请求参数

参数名 类型 必填 描述
pdfFile file (需要先上传) 支持最大100MB的PDF文件
pageRange text 指定要提取的页面(1-5为范围,3为单页,1,3,5为多页)。留空则提取所有页面。
outputFormat select -
preserveFormatting checkbox 尽可能保持原始布局、间距和格式
removeExtraWhitespace checkbox 清理多余的空格和换行符
includeLineNumbers checkbox 为提取的文本添加行号
encoding select -

文件类型参数需要先通过 POST /upload/pdf-text-extractor 上传获取 filePath,然后将 filePath 传递给对应的文件字段。

响应格式

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
文本: 文本

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-pdf-text-extractor": {
      "name": "pdf-text-extractor",
      "description": "从PDF文档中提取文本内容,支持页面选择、格式选项和多语言处理",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-text-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

支持 URL 文件链接或 Base64 编码作为文件参数。

如果遇见问题,请联系我们:[email protected]