Извлекатель Текста PDF
Извлекает текстовое содержимое из PDF-документов с поддержкой выбора страниц, опций форматирования и многоязычной обработки
Документация API
Конечная точка запроса
Параметры запроса
| Имя параметра | Тип | Обязательно | Описание |
|---|---|---|---|
| pdfFile | file (Требуется загрузка) | Да | Поддерживает PDF файлы до 100MB |
| pageRange | text | Нет | Укажите страницы для извлечения (1-5 для диапазона, 3 для одной страницы, 1,3,5 для нескольких). Оставьте пустым для всех страниц. |
| outputFormat | select | Нет | - |
| preserveFormatting | checkbox | Нет | Сохранять оригинальную разметку, интервалы и форматирование насколько возможно |
| removeExtraWhitespace | checkbox | Нет | Очистить избыточные пробелы и переносы строк |
| includeLineNumbers | checkbox | Нет | Добавить номера строк к извлеченному тексту |
| encoding | select | Нет | - |
Параметры типа файл должны быть загружены сначала через POST /upload/pdf-text-extractor для получения filePath, затем filePath должен быть передан в соответствующее поле файла.
Формат ответа
{
"result": "Processed text content",
"error": "Error message (optional)",
"message": "Notification message (optional)",
"metadata": {
"key": "value"
}
}
Документация MCP
Добавьте этот инструмент к конфигурации сервера MCP:
{
"mcpServers": {
"elysiatools-pdf-text-extractor": {
"name": "pdf-text-extractor",
"description": "Извлекает текстовое содержимое из PDF-документов с поддержкой выбора страниц, опций форматирования и многоязычной обработки",
"baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-text-extractor",
"command": "",
"args": [],
"env": {},
"isActive": true,
"type": "sse"
}
}
}
Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.
Поддерживает ссылки на файлы URL или кодирование Base64 для параметров файла.
Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]