Извлечение изображений и captions из PDF

Извлекает изображения PDF, сопоставляет ближайшие captions и создает HTML-индекс

После загрузки PDF инструмент экспортирует изображения, анализирует структурированный JSON и сопоставляет ближайшие captions для каждого изображения по странице и позиции, а затем создает HTML-отчет.

Примеры результатов

1 Примеры

Извлечь изображения PDF и соседние подписи

Реальный sample создал HTML-отчет с изображениями и подписями.

pdf-image-caption-extractor-example1.html Показать файл
Показать параметры ввода
{ "pdfFile": "/public/samples/pdf/pdf-image-caption-extractor-source-example1.pdf", "imageFormat": "png", "pages": "", "useStructTree": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Ключевые факты

Категория
Изображения, аудио и видео
Типы входных данных
file, select, text, checkbox
Тип результата
html
Покрытие примерами
4
API доступен
Yes

Обзор

Этот инструмент автоматически извлекает изображения из PDF-документов, находит соответствующие им подписи (captions) на основе расположения и генерирует удобный HTML-отчет. Он анализирует структуру документа для точного сопоставления графики и текста, что значительно упрощает каталогизацию визуальных данных из учебников, отчетов и презентаций.

Когда использовать

  • Когда нужно быстро собрать все иллюстрации из многостраничного отчета вместе с их описаниями.
  • При подготовке базы данных изображений из научных статей или учебных пособий.
  • Для аудита визуального контента в PDF-документах без ручного копирования каждой картинки.

Как это работает

  • Загрузите PDF-файл и выберите нужный формат изображений (PNG или JPEG).
  • Укажите диапазон страниц и активируйте использование структуры тегов для более точного поиска подписей.
  • Система экспортирует графические ресурсы и анализирует метаданные текста для сопоставления ближайших подписей к изображениям.
  • Получите готовый HTML-файл со списком всех найденных изображений, их описаний и номеров страниц.

Сценарии использования

Создание каталога иллюстраций для технической документации с сохранением их названий.
Извлечение графиков и их описаний из финансовых или научных отчетов для последующего анализа.
Подготовка контента для переноса из PDF-файлов в веб-ориентированные системы управления контентом (CMS).

Примеры

1. Обработка научного отчета

Исследователь
Контекст
Имеется 50-страничный PDF с графиками, каждый из которых подписан в формате «Рис. X: Описание».
Проблема
Необходимо быстро выгрузить все графики вместе с их названиями для вставки в презентацию.
Как использовать
Загрузить PDF, выбрать формат PNG, указать диапазон страниц и включить использование структуры тегов.
Результат
HTML-файл, в котором каждый график отображается рядом с соответствующим текстом подписи и номером страницы.

2. Извлечение фото из каталога продукции

Контент-менеджер
Контекст
PDF-каталог содержит сотни товаров с фотографиями и краткими описаниями под ними.
Проблема
Ручное сохранение каждой фотографии и копирование описания занимает слишком много времени.
Как использовать
Загрузить файл каталога, выбрать формат JPEG и запустить процесс извлечения.
Результат
Структурированный список всех товаров с изображениями и их характеристиками в одном HTML-документе, готовый к импорту.

Проверить на примерах

html, pdf, image

Связанные хабы

FAQ

Какие форматы изображений поддерживаются?

Вы можете экспортировать извлеченные изображения в форматах PNG или JPEG.

Можно ли обработать только определенные страницы?

Да, в поле «Страницы» можно указать конкретные номера или диапазоны, например «1, 3, 5-10».

Что делает опция «Использовать структуру тегов»?

Она позволяет инструменту использовать внутреннюю логическую разметку PDF для более точного определения связи между картинкой и текстом подписи.

В каком виде я получу результат?

Инструмент генерирует HTML-отчет, который можно открыть в любом браузере для просмотра и копирования извлеченных данных.

Как инструмент понимает, какой текст является подписью?

Алгоритм анализирует пространственное расположение текста относительно изображения на странице и использует структуру документа.

Документация API

Конечная точка запроса

POST /ru/api/tools/pdf-image-caption-extractor

Параметры запроса

Имя параметра Тип Обязательно Описание
pdfFile file (Требуется загрузка) Да -
imageFormat select Нет -
pages text Нет -
useStructTree checkbox Нет -

Параметры типа файл должны быть загружены сначала через POST /upload/pdf-image-caption-extractor для получения filePath, затем filePath должен быть передан в соответствующее поле файла.

Формат ответа

{
  "result": "
Processed HTML content
", "error": "Error message (optional)", "message": "Notification message (optional)", "metadata": { "key": "value" } }
HTML: HTML

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-pdf-image-caption-extractor": {
      "name": "pdf-image-caption-extractor",
      "description": "Извлекает изображения PDF, сопоставляет ближайшие captions и создает HTML-индекс",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-image-caption-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Поддерживает ссылки на файлы URL или кодирование Base64 для параметров файла.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]