PDF文本提取器
从PDF文档中提取文本内容,支持页面选择、格式选项和多语言处理
API 文档
请求端点
POST /zh/api/tools/pdf-text-extractor
请求参数
| 参数名 | 类型 | 必填 | 描述 |
|---|---|---|---|
| pdfFile | file (需要先上传) | 是 | 支持最大100MB的PDF文件 |
| pageRange | text | 否 | 指定要提取的页面(1-5为范围,3为单页,1,3,5为多页)。留空则提取所有页面。 |
| outputFormat | select | 否 | - |
| preserveFormatting | checkbox | 否 | 尽可能保持原始布局、间距和格式 |
| removeExtraWhitespace | checkbox | 否 | 清理多余的空格和换行符 |
| includeLineNumbers | checkbox | 否 | 为提取的文本添加行号 |
| encoding | select | 否 | - |
文件类型参数需要先通过 POST /upload/pdf-text-extractor 上传获取 filePath,然后将 filePath 传递给对应的文件字段。
响应格式
{
"result": "Processed text content",
"error": "Error message (optional)",
"message": "Notification message (optional)",
"metadata": {
"key": "value"
}
}
文本:
文本
AI MCP 文档
将此工具添加到您的 MCP 服务器配置中:
{
"mcpServers": {
"elysiatools-pdf-text-extractor": {
"name": "pdf-text-extractor",
"description": "从PDF文档中提取文本内容,支持页面选择、格式选项和多语言处理",
"baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-text-extractor",
"command": "",
"args": [],
"env": {},
"isActive": true,
"type": "sse"
}
}
}
你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。
支持 URL 文件链接或 Base64 编码作为文件参数。
如果遇见问题,请联系我们:[email protected]