Extrator de imagens e captions PDF

Extrai imagens PDF, relaciona captions proximas e gera um indice HTML navegavel

Depois de enviar um PDF, a ferramenta exporta os recursos visuais, analisa o JSON estruturado e associa captions proximas a cada imagem com base na pagina e na posicao antes de gerar um relatorio HTML navegavel.

Exemplos de resultados

1 Exemplos

Extrair imagens PDF e captions proximas

O sample real gerou um relatorio HTML navegavel com imagens e captions.

pdf-image-caption-extractor-example1.html Ver arquivo
Ver parâmetros de entrada
{ "pdfFile": "/public/samples/pdf/pdf-image-caption-extractor-source-example1.pdf", "imageFormat": "png", "pages": "", "useStructTree": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Fatos principais

Categoria
Imagens, áudio e vídeo
Tipos de entrada
file, select, text, checkbox
Tipo de saída
html
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Extrator de imagens e captions PDF é uma ferramenta especializada que identifica e exporta elementos visuais de documentos PDF, associando automaticamente cada imagem à sua legenda correspondente. Ele processa a estrutura semântica do arquivo para gerar um relatório HTML navegável, facilitando a revisão e a reutilização de figuras e metadados de página.

Quando usar

  • Quando você precisa extrair figuras de relatórios técnicos ou livros didáticos mantendo o contexto das legendas.
  • Para criar um catálogo visual rápido de todas as imagens contidas em um documento PDF extenso.
  • Ao preparar materiais de apresentação que exigem imagens e suas descrições originais extraídas de documentos de referência.

Como funciona

  • Carregue o arquivo PDF e selecione o formato de saída das imagens entre PNG ou JPEG.
  • O sistema analisa a árvore estrutural do PDF para localizar imagens e blocos de texto próximos em cada página.
  • A ferramenta associa cada imagem à legenda mais provável com base na posição espacial e na hierarquia do documento.
  • Um arquivo HTML é gerado contendo o índice de imagens, as legendas extraídas e os metadados de navegação.

Casos de uso

Pesquisadores que precisam catalogar figuras de artigos científicos para referências bibliográficas.
Designers que desejam extrair ativos visuais de manuais de marca ou catálogos de produtos preservando as descrições.
Editores que precisam revisar a consistência de legendas e imagens em provas de livros digitais extensos.

Exemplos

1. Extração de Figuras de Relatório Técnico

Engenheiro Civil
Contexto
O engenheiro possui um relatório de inspeção de 200 páginas com centenas de fotos de obras e diagramas técnicos.
Problema
Ele precisa isolar todas as fotos com suas respectivas descrições para anexar a um novo laudo de conformidade.
Como usar
Fez o upload do PDF, selecionou o formato JPEG e ativou a opção de árvore estrutural para garantir a precisão das legendas.
Configuração de exemplo
imageFormat: jpeg, useStructTree: true
Resultado
Um arquivo HTML organizado com todas as fotos e legendas listadas por página, prontas para cópia e colagem.

2. Catálogo de Produtos para E-commerce

Analista de Marketing
Contexto
A empresa lançou um catálogo em PDF e o analista precisa das imagens dos produtos para atualizar o site.
Problema
As imagens precisam estar vinculadas aos nomes e códigos dos produtos que aparecem logo abaixo de cada foto no documento.
Como usar
Carregou o catálogo, definiu o intervalo de páginas dos produtos e escolheu o formato PNG para manter a qualidade.
Configuração de exemplo
imageFormat: png, pages: 10-50
Resultado
Uma galeria HTML navegável com imagens de alta qualidade e os nomes dos produtos extraídos automaticamente como captions.

Testar com amostras

html, pdf, image

Hubs relacionados

FAQ

Quais formatos de imagem são suportados para exportação?

Você pode optar por exportar as imagens extraídas nos formatos PNG ou JPEG.

Posso extrair imagens de apenas algumas páginas específicas?

Sim, utilize o campo 'Páginas' para especificar números ou intervalos, como '1, 3, 5-10'.

O que faz a opção 'Usar árvore estrutural'?

Ela utiliza a hierarquia interna do PDF para aumentar a precisão na vinculação entre a imagem e sua legenda correta.

Qual é o formato do resultado final entregue pela ferramenta?

A ferramenta gera um pacote em formato HTML que permite navegar visualmente pelas imagens e seus respectivos textos.

A ferramenta funciona com qualquer tipo de PDF?

Funciona com PDFs que contenham camadas de imagem e texto; arquivos protegidos por senha devem ser desbloqueados antes do envio.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/pdf-image-caption-extractor

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
pdfFile file (Upload necessário) Sim -
imageFormat select Não -
pages text Não -
useStructTree checkbox Não -

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/pdf-image-caption-extractor para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "result": "
Processed HTML content
", "error": "Error message (optional)", "message": "Notification message (optional)", "metadata": { "key": "value" } }
HTML: HTML

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-image-caption-extractor": {
      "name": "pdf-image-caption-extractor",
      "description": "Extrai imagens PDF, relaciona captions proximas e gera um indice HTML navegavel",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-image-caption-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]