PDF Diff

Сравнивает два PDF-документа постранично и выделяет различия

Извлекает текст постранично из двух PDF и сравнивает по словам, строкам или символам с итоговой схожестью.

Примеры результатов

1 Примеры

Сравнить две версии PDF

Находит текстовые изменения на уровне слов.

{
  "pageCountOriginal": 6,
  "pageCountModified": 6,
  "overallSimilarity": 0.94
}
Показать параметры ввода
{ "originalFile": "/public/samples/pdf/sample-multipage.pdf", "modifiedFile": "/public/samples/pdf/sample-multipage-revised.pdf", "comparisonMode": "word", "caseSensitive": false, "ignoreWhitespace": true }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Ключевые факты

Категория
Документы и PDF
Типы входных данных
file, select, checkbox
Тип результата
json
Покрытие примерами
4
API доступен
Yes

Обзор

PDF Diff — это специализированный инструмент для постраничного сравнения двух PDF-документов. Он извлекает текстовое содержимое файлов и находит различия на уровне слов, строк или символов, предоставляя точный отчет о схожести документов.

Когда использовать

  • При необходимости проверить финальную версию договора на наличие скрытых правок со стороны контрагента.
  • Для контроля версий текстовых отчетов, инструкций или книг, сохраненных в формате PDF.
  • При сверке документов после конвертации или редактирования для подтверждения целостности текста.

Как это работает

  • Загрузите исходный PDF-документ в поле «Исходный PDF».
  • Загрузите отредактированную версию документа в поле «Изменённый PDF».
  • Выберите подходящий режим сравнения: по словам, по строкам или по символам, а также настройте учет регистра и пробелов.
  • Запустите процесс сравнения и получите итоговый JSON-отчет с показателями схожести и количеством страниц.

Сценарии использования

Сравнение юридических соглашений и контрактов для выявления несанкционированных изменений в тексте.
Контроль версий технической документации при переносе описаний спецификаций.
Сверка многостраничных финансовых отчетов на предмет изменения числовых показателей.

Примеры

1. Сравнение версий договора поставки

Юрист
Контекст
Контрагент вернул подписанный PDF-документ. Юристу необходимо быстро проверить, не изменились ли условия соглашения.
Проблема
Ручная вычитка многостраничного договора занимает слишком много времени и повышает риск пропустить мелкие правки.
Как использовать
Загрузите оригинальный договор в качестве исходного файла, измененный файл от контрагента — в качестве измененного. Выберите режим сравнения «По словам» и отключите учет регистра.
Результат
Инструмент выдал JSON-отчет со схожестью 0.97, указав на наличие точечных изменений в тексте.

2. Проверка обновленной спецификации оборудования

Инженер проекта
Контекст
В спецификацию оборудования были внесены изменения в артикулы деталей.
Проблема
Нужно точно определить, в каких именно строках изменились индексы и артикулы.
Как использовать
Загрузите старую и новую спецификации PDF, выберите режим сравнения «По символам» и включите опцию «Учитывать регистр» для точного сопоставления буквенно-цифровых кодов.
Результат
Получен отчет, подтверждающий точечные изменения символов в артикулах при сохранении структуры остального текста.

Проверить на примерах

pdf, text, file

Связанные хабы

FAQ

Какие режимы сравнения доступны в инструменте?

Вы можете сравнивать документы по словам (word), по строкам (line) или по отдельным символам (char).

Можно ли игнорировать различия в регистре букв?

Да, для этого достаточно отключить опцию «Учитывать регистр» в настройках сравнения.

Как инструмент реагирует на лишние пробелы и переносы строк?

По умолчанию включена опция «Игнорировать пробелы», которая позволяет не учитывать разницу в форматировании пробельных символов.

Какой результат возвращает инструмент?

Инструмент возвращает JSON-данные с количеством страниц в оригинальном и измененном файлах, а также общий коэффициент схожести (overallSimilarity).

Работает ли сравнение для отсканированных PDF без текстового слоя?

Нет, инструмент извлекает и сравнивает только встроенный текстовый слой документов. Отсканированные изображения без распознанного текста не поддерживаются.

Документация API

Конечная точка запроса

POST /ru/api/tools/pdf-diff

Параметры запроса

Имя параметра Тип Обязательно Описание
originalFile file (Требуется загрузка) Да -
modifiedFile file (Требуется загрузка) Да -
comparisonMode select Нет -
caseSensitive checkbox Нет -
ignoreWhitespace checkbox Нет -

Параметры типа файл должны быть загружены сначала через POST /upload/pdf-diff для получения filePath, затем filePath должен быть передан в соответствующее поле файла.

Формат ответа

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Данные JSON: Данные JSON

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-pdf-diff": {
      "name": "pdf-diff",
      "description": "Сравнивает два PDF-документа постранично и выделяет различия",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-diff",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Поддерживает ссылки на файлы URL или кодирование Base64 для параметров файла.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]