Экспорт аннотаций PDF

Извлекает существующие аннотации (выделения, комментарии, штампы, ссылки) из PDF в строку JSON

Читает встроенные в PDF аннотации и экспортирует их как структурированную строку JSON, отображаемую прямо в области вывода (без файла для скачивания). Поддерживаются разметка (выделение/подчёркивание/зачёркивание), заметки, штампы, ссылки и фигуры. Чистая JS-реализация на pdf-lib.

Примеры результатов

1 Примеры

Экспорт выделений и комментариев в JSON

Извлекает разметку/заметки из рецензируемого PDF и возвращает структурированный JSON.

{
  "sourceFile": "pdf-annotation-export-sample.pdf",
  "count": 2,
  "subtypes": {
    "Highlight": 1,
    "Text": 1
  },
  "annotations": [
    {
      "page": 1,
      "subtype": "Highlight",
      "author": "Alice",
      "text": "important claim",
      "color": "#ffff00"
    },
    {
      "page": 1,
      "subtype": "Text",
      "author": "Bob",
      "text": "Please review this section.",
      "color": "#ffcc00"
    }
  ]
}
Показать параметры ввода
{ "pdfFile": "/public/samples/pdf/pdf-annotation-export-sample.pdf", "includePageNumbers": true }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Ключевые факты

Категория
Документы и PDF
Типы входных данных
file, checkbox
Тип результата
text
Покрытие примерами
4
API доступен
Yes

Обзор

Удобный онлайн-инструмент для быстрого извлечения встроенных аннотаций, комментариев, выделений текста, штампов и ссылок из PDF-файлов с последующим экспортом в структурированный формат JSON прямо в окне браузера.

Когда использовать

  • Когда необходимо собрать все текстовые заметки и выделения из учебника или научной статьи для последующего анализа.
  • При автоматизации процесса проверки документов, когда нужно выгрузить комментарии рецензентов в базу данных или таск-трекер.
  • Для резервного копирования и архивации метаданных разметки и правок, внесенных в PDF-документ.

Как это работает

  • Загрузите PDF-документ, содержащий аннотации, комментарии или выделения текста.
  • Выберите, нужно ли включать номера страниц в итоговый отчет с помощью соответствующего флажка.
  • Инструмент обработает файл локально с помощью библиотеки pdf-lib и мгновенно выведет структурированный JSON-текст на экран.

Сценарии использования

Сбор правок редактора из макета книги для составления списка доработок.
Импорт учебных заметок и цитат из электронных книг в личные базы знаний.
Анализ отзывов клиентов на проектную документацию путем парсинга JSON-отчетов.

Примеры

1. Сбор правок из дизайн-макета

Выпускающий редактор
Контекст
Редактор получил PDF-макет журнала с десятками комментариев и выделений от корректора. Переносить их вручную в таблицу долго.
Проблема
Необходимо быстро получить список всех текстовых правок с указанием страниц для авторов.
Как использовать
Загрузите PDF-макет в поле ввода, оставьте включенной опцию номеров страниц и скопируйте полученный JSON.
Пример конфигурации
pdfFile: layout_v2_comments.pdf, includePageNumbers: true
Результат
Получен структурированный JSON со списком всех комментариев, авторов правок и номеров страниц для быстрого исправления ошибок.

2. Экспорт цитат из научной статьи

Исследователь
Контекст
При чтении научной публикации исследователь выделил желтым цветом ключевые гипотезы и добавил текстовые заметки.
Проблема
Нужно перенести все выделенные цитаты в личный архив без ручного копирования каждого абзаца.
Как использовать
Загрузите размеченный PDF-файл статьи и скопируйте сгенерированный JSON-код с выделенным текстом.
Пример конфигурации
pdfFile: science_paper_marked.pdf, includePageNumbers: true
Результат
Все выделения (Highlight) и текстовые заметки (Text) экспортированы в JSON с сохранением исходного текста и цвета выделения.

Проверить на примерах

json, pdf, file

Связанные хабы

FAQ

Какие типы аннотаций поддерживает этот инструмент?

Инструмент извлекает текстовые выделения, подчёркивания, зачёркивания, комментарии, штампы, ссылки и геометрические фигуры.

Безопасно ли загружать конфиденциальные PDF-документы?

Да, обработка происходит полностью в вашем браузере на стороне клиента, файлы не загружаются на сервер.

Можно ли скачать результат в виде файла?

Инструмент выводит структурированный JSON-текст непосредственно на экран, откуда его можно скопировать.

Поддерживается ли извлечение номеров страниц для каждой аннотации?

Да, при включении опции «Включать номера страниц» в JSON будет указан точный номер страницы для каждого элемента.

Почему некоторые комментарии не отображаются в JSON?

Инструмент извлекает только стандартные аннотации, встроенные в PDF. Если текст написан поверх документа как часть изображения, он не будет распознан.

Документация API

Конечная точка запроса

POST /ru/api/tools/pdf-annotation-export

Параметры запроса

Имя параметра Тип Обязательно Описание
pdfFile file (Требуется загрузка) Да -
includePageNumbers checkbox Нет -

Параметры типа файл должны быть загружены сначала через POST /upload/pdf-annotation-export для получения filePath, затем filePath должен быть передан в соответствующее поле файла.

Формат ответа

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Текст: Текст

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-pdf-annotation-export": {
      "name": "pdf-annotation-export",
      "description": "Извлекает существующие аннотации (выделения, комментарии, штампы, ссылки) из PDF в строку JSON",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-annotation-export",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Поддерживает ссылки на файлы URL или кодирование Base64 для параметров файла.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]