OCR текстовый слой PDF

Добавляет OCR текстовый слой в сканированный PDF для поиска и копирования

Растрирует страницы PDF в изображения, выполняет OCR Tesseract по страницам и объединяет в поисковый PDF.

Примеры результатов

2 Примеры

Стандартный OCR-слой

Добавляет английский OCR-слой с 300 DPI и стандартным режимом сегментации

pdf-ocr-text-layer-example1.pdf Показать файл
Показать параметры ввода
{ "sourceFile": "/Users/quyue/www/elysia-tools/public/samples/pdf/pdf-2026-02-19-source-4pages.pdf", "language": "eng", "dpi": 300, "oem": 1, "psm": 3 }

Быстрый OCR с низким DPI

Использует 200 DPI и psm=6 для ускорения OCR и уменьшения размера файла

pdf-ocr-text-layer-example2.pdf Показать файл
Показать параметры ввода
{ "sourceFile": "/Users/quyue/www/elysia-tools/public/samples/pdf/pdf-2026-02-19-source-4pages.pdf", "language": "eng", "dpi": 200, "oem": 1, "psm": 6 }

Click to upload file or drag and drop file here

Maximum file size: 500MB Supported formats: application/pdf

Ключевые факты

Категория
Документы и PDF
Типы входных данных
file, text, number
Тип результата
file
Покрытие примерами
4
API доступен
Yes

Обзор

Инструмент для добавления OCR-слоя в сканированные PDF-документы, который преобразует изображения текста в полноценный поисковый и копируемый формат с помощью движка Tesseract.

Когда использовать

  • Когда у вас есть сканированный документ или изображение в формате PDF, из которого невозможно скопировать текст.
  • Когда необходимо сделать архив бумажных документов доступным для полнотекстового поиска.
  • Когда нужно подготовить PDF-файл для цитирования или обработки данных, извлекая информацию из нередактируемых сканов.

Как это работает

  • Загрузите ваш PDF-файл в систему.
  • Выберите язык документа и настройте параметры DPI для оптимального распознавания.
  • Выберите режим сегментации страницы и движка OCR для повышения точности.
  • Система растрирует страницы, распознает текст и создает новый PDF-файл с невидимым текстовым слоем поверх изображений.

Сценарии использования

Оцифровка архивных договоров и счетов для быстрого поиска по ключевым словам.
Преобразование сканированных книг и статей в формат, удобный для цитирования.
Подготовка юридических документов к автоматизированной обработке данных.

Примеры

1. Стандартная обработка документов

Офисный сотрудник
Контекст
Необходимо сделать архив сканированных отчетов за год доступным для поиска по базе данных.
Проблема
Текст в PDF-файлах представлен в виде картинок, поиск по ним невозможен.
Как использовать
Загрузите PDF, установите DPI на 300 и выберите нужный язык распознавания.
Пример конфигурации
language: eng, dpi: 300, oem: 1, psm: 3
Результат
Получен PDF-файл, в котором можно выделять текст и искать информацию через стандартный поиск в PDF-ридере.

2. Быстрая обработка для экономии места

Архивариус
Контекст
Требуется быстро обработать большой объем сканов для внутреннего пользования, где критична скорость и размер файла.
Проблема
Высокое разрешение сканов создает слишком тяжелые файлы после OCR.
Как использовать
Установите DPI на 200 и используйте режим сегментации psm=6 для ускорения процесса.
Пример конфигурации
language: eng, dpi: 200, oem: 1, psm: 6
Результат
Файл стал поисковым, при этом размер документа остался минимальным, а время обработки сократилось.

Проверить на примерах

pdf, text, file

Связанные хабы

FAQ

Что такое OCR-слой?

Это невидимый слой текста, наложенный на изображение страницы, который позволяет выделять, копировать и искать текст в PDF.

Какие языки поддерживает инструмент?

Инструмент поддерживает любые языки, совместимые с Tesseract, включая многоязычные документы (например, eng+rus).

Как выбрать правильный DPI?

Для стандартных документов рекомендуется 300 DPI. Более низкие значения ускоряют процесс, но могут снизить точность распознавания.

Можно ли обрабатывать защищенные паролем PDF?

Инструмент работает с открытыми PDF-файлами. Если файл защищен, предварительно снимите ограничение.

Изменяется ли внешний вид исходного документа?

Нет, визуально документ остается прежним, добавляется только возможность взаимодействия с текстом.

Документация API

Конечная точка запроса

POST /ru/api/tools/pdf-ocr-text-layer

Параметры запроса

Имя параметра Тип Обязательно Описание
sourceFile file (Требуется загрузка) Да -
language text Нет -
dpi number Нет -
oem number Нет -
psm number Нет -

Параметры типа файл должны быть загружены сначала через POST /upload/pdf-ocr-text-layer для получения filePath, затем filePath должен быть передан в соответствующее поле файла.

Формат ответа

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Файл: Файл

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-pdf-ocr-text-layer": {
      "name": "pdf-ocr-text-layer",
      "description": "Добавляет OCR текстовый слой в сканированный PDF для поиска и копирования",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-ocr-text-layer",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Поддерживает ссылки на файлы URL или кодирование Base64 для параметров файла.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]