Ключевые факты
- Категория
- Документы и PDF
- Типы входных данных
- file, select, checkbox
- Тип результата
- json
- Покрытие примерами
- 4
- API доступен
- Yes
Обзор
PDF Diff — это специализированный инструмент для постраничного сравнения двух PDF-документов. Он извлекает текстовое содержимое файлов и находит различия на уровне слов, строк или символов, предоставляя точный отчет о схожести документов.
Когда использовать
- •При необходимости проверить финальную версию договора на наличие скрытых правок со стороны контрагента.
- •Для контроля версий текстовых отчетов, инструкций или книг, сохраненных в формате PDF.
- •При сверке документов после конвертации или редактирования для подтверждения целостности текста.
Как это работает
- •Загрузите исходный PDF-документ в поле «Исходный PDF».
- •Загрузите отредактированную версию документа в поле «Изменённый PDF».
- •Выберите подходящий режим сравнения: по словам, по строкам или по символам, а также настройте учет регистра и пробелов.
- •Запустите процесс сравнения и получите итоговый JSON-отчет с показателями схожести и количеством страниц.
Сценарии использования
Примеры
1. Сравнение версий договора поставки
Юрист- Контекст
- Контрагент вернул подписанный PDF-документ. Юристу необходимо быстро проверить, не изменились ли условия соглашения.
- Проблема
- Ручная вычитка многостраничного договора занимает слишком много времени и повышает риск пропустить мелкие правки.
- Как использовать
- Загрузите оригинальный договор в качестве исходного файла, измененный файл от контрагента — в качестве измененного. Выберите режим сравнения «По словам» и отключите учет регистра.
- Результат
- Инструмент выдал JSON-отчет со схожестью 0.97, указав на наличие точечных изменений в тексте.
2. Проверка обновленной спецификации оборудования
Инженер проекта- Контекст
- В спецификацию оборудования были внесены изменения в артикулы деталей.
- Проблема
- Нужно точно определить, в каких именно строках изменились индексы и артикулы.
- Как использовать
- Загрузите старую и новую спецификации PDF, выберите режим сравнения «По символам» и включите опцию «Учитывать регистр» для точного сопоставления буквенно-цифровых кодов.
- Результат
- Получен отчет, подтверждающий точечные изменения символов в артикулах при сохранении структуры остального текста.
Проверить на примерах
pdf, text, fileСвязанные хабы
FAQ
Какие режимы сравнения доступны в инструменте?
Вы можете сравнивать документы по словам (word), по строкам (line) или по отдельным символам (char).
Можно ли игнорировать различия в регистре букв?
Да, для этого достаточно отключить опцию «Учитывать регистр» в настройках сравнения.
Как инструмент реагирует на лишние пробелы и переносы строк?
По умолчанию включена опция «Игнорировать пробелы», которая позволяет не учитывать разницу в форматировании пробельных символов.
Какой результат возвращает инструмент?
Инструмент возвращает JSON-данные с количеством страниц в оригинальном и измененном файлах, а также общий коэффициент схожести (overallSimilarity).
Работает ли сравнение для отсканированных PDF без текстового слоя?
Нет, инструмент извлекает и сравнивает только встроенный текстовый слой документов. Отсканированные изображения без распознанного текста не поддерживаются.