PDF в Excel

Извлекает табличные данные из PDF-файлов и конвертирует их в электронные таблицы Excel с настраиваемыми опциями парсинга

Конвертирует PDF-документы с таблицами в формат Excel на чистом Node.js.

Примеры результатов

1 Примеры

PDF-таблица в Excel

Извлекает табличные данные из PDF и конвертирует в формат Excel

pdf-to-excel-output.xlsx Показать файл
Показать параметры ввода
{ "sourceFile": "/public/samples/pdf/table-data.pdf", "delimiter": "auto", "hasHeader": true }

Click to upload file or drag and drop file here

Maximum file size: 50MB Supported formats: application/pdf

Ключевые факты

Категория
Документы и PDF
Типы входных данных
file, select, checkbox, text
Тип результата
file
Покрытие примерами
4
API доступен
Yes

Обзор

Этот инструмент позволяет быстро извлекать табличные данные из PDF-файлов и конвертировать их в электронные таблицы Excel (XLSX). Вы можете настроить параметры парсинга, такие как разделители столбцов, автоматическую ширину колонок, пропуск пустых строк и имя итогового листа, чтобы получить готовую к работе таблицу без ручного копирования.

Когда использовать

  • Когда необходимо перенести финансовые отчеты или прайс-листы из формата PDF в редактируемый формат Excel.
  • При необходимости точного распознавания структуры таблиц в PDF с ручным или автоматическим выбором разделителей колонок.
  • Для быстрого импорта табличных данных из PDF-документов с автоматической подгонкой ширины столбцов и удалением пустых строк.

Как это работает

  • Загрузите исходный PDF-файл, содержащий таблицы, через форму выбора файла.
  • Настройте параметры парсинга: укажите разделитель столбцов, необходимость пропуска пустых строк, наличие заголовков и имя для создаваемого листа Excel.
  • Запустите конвертацию и скачайте готовый файл в формате XLSX с сохраненной структурой данных.

Сценарии использования

Конвертация ежемесячных отчетов о продажах из PDF в Excel для последующего анализа и построения графиков.
Перенос каталогов товаров и прайс-листов от поставщиков из PDF в XLSX для обновления базы данных.
Извлечение статистических таблиц из научных или аналитических публикаций в формате PDF для расчетов.

Примеры

1. Конвертация финансового отчета

Финансовый аналитик
Контекст
Аналитик получил годовой отчет компании в формате PDF, где все ключевые показатели представлены в виде таблиц на нескольких страницах.
Проблема
Необходимо перенести эти таблицы в Excel для проведения расчетов, избегая ручного перепечатывания цифр.
Как использовать
Загрузите PDF-файл отчета, выберите автоопределение разделителя, включите опции 'Первая Строка Содержит Заголовки' и 'Пропускать Пустые Строки', затем укажите имя листа 'Отчет 2025'.
Пример конфигурации
{
  "delimiter": "auto",
  "hasHeader": true,
  "skipEmptyRows": true,
  "sheetName": "Отчет 2025",
  "autoColumnWidth": true
}
Результат
Получен файл Excel, где все таблицы из PDF аккуратно распределены по строкам и колонкам с настроенной шириной столбцов.

2. Импорт прайс-листа поставщика

Менеджер по закупкам
Контекст
Поставщик прислал новый прайс-лист в формате PDF, где колонки разделены символом точки с запятой.
Проблема
Нужно быстро импортировать цены в Excel для сравнения с другими предложениями.
Как использовать
Загрузите PDF-файл прайс-листа, выберите разделитель ';' (Semicolon), активируйте автоподгон ширины столбцов и запустите обработку.
Пример конфигурации
{
  "delimiter": ";",
  "hasHeader": true,
  "skipEmptyRows": true,
  "sheetName": "Цены",
  "autoColumnWidth": true
}
Результат
Создана таблица Excel с листом 'Цены', где все товары и цены четко разделены по соответствующим колонкам.

Проверить на примерах

xlsx, xls, pdf

Связанные хабы

FAQ

Можно ли настроить имя листа в итоговом файле Excel?

Да, вы можете указать желаемое имя листа в поле «Имя Листа» перед началом конвертации.

Как инструмент определяет границы столбцов в PDF?

По умолчанию используется автоопределение, но вы можете вручную выбрать разделитель, например, табуляцию, запятую или точку с запятой.

Что делать, если в PDF-таблице есть пустые строки?

Включите опцию «Пропускать Пустые Строки», чтобы очистить итоговую таблицу от лишних пустых строк.

Поддерживает ли конвертер автоматическое форматирование ширины колонок?

Да, опция «Автоматическая Ширина Столбцов» автоматически подгоняет размер ячеек под длину содержимого.

Можно ли указать, что первая строка PDF-таблицы является заголовком?

Да, для этого активируйте чекбокс «Первая Строка Содержит Заголовки».

Документация API

Конечная точка запроса

POST /ru/api/tools/pdf-to-excel

Параметры запроса

Имя параметра Тип Обязательно Описание
sourceFile file (Требуется загрузка) Да -
delimiter select Нет -
hasHeader checkbox Нет -
skipEmptyRows checkbox Нет -
autoColumnWidth checkbox Нет -
sheetName text Нет -

Параметры типа файл должны быть загружены сначала через POST /upload/pdf-to-excel для получения filePath, затем filePath должен быть передан в соответствующее поле файла.

Формат ответа

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Файл: Файл

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-pdf-to-excel": {
      "name": "pdf-to-excel",
      "description": "Извлекает табличные данные из PDF-файлов и конвертирует их в электронные таблицы Excel с настраиваемыми опциями парсинга",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-to-excel",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Поддерживает ссылки на файлы URL или кодирование Base64 для параметров файла.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]