PDF para XML

Converte documentos PDF em formato XML estruturado com hierarquia de conteúdo preservada

Converte documentos PDF em formato XML estruturado usando Node.js puro.

Exemplos de resultados

1 Exemplos

Documento PDF para XML

Converte um documento PDF em formato XML estruturado

pdf-to-xml-output.xml Ver arquivo
Ver parâmetros de entrada
{ "sourceFile": "/public/samples/pdf/document.pdf", "outputMode": "structured", "includeDeclaration": true }

Click to upload file or drag and drop file here

Maximum file size: 50MB Supported formats: application/pdf

Fatos principais

Categoria
Documentos e PDF
Tipos de entrada
file, select, checkbox
Tipo de saída
file
Cobertura de amostras
4
API disponível
Yes

Visão geral

O conversor de PDF para XML permite transformar seus documentos PDF em arquivos XML estruturados, preservando a hierarquia do conteúdo original de forma rápida e segura.

Quando usar

  • Quando precisar extrair dados de relatórios em PDF para processamento automatizado em sistemas que utilizam XML.
  • Ao integrar dados de documentos PDF legados em fluxos de trabalho e bancos de dados estruturados.
  • Para analisar a estrutura hierárquica de textos e tabelas contidos em arquivos PDF sem a necessidade de transcrição manual.

Como funciona

  • Faça o upload do arquivo PDF que deseja converter através do campo de seleção.
  • Escolha o modo de saída desejado, optando por XML compacto (structured) ou formatado (pretty-printed).
  • Defina se deseja incluir a declaração XML no início do arquivo gerado.
  • Clique no botão de conversão para processar o documento e baixe o arquivo XML resultante.

Casos de uso

Extração de dados de faturas e recibos em PDF para importação direta em sistemas ERP baseados em XML.
Migração de manuais técnicos e relatórios corporativos em PDF para sistemas de gerenciamento de conteúdo.
Automação de leitura de relatórios financeiros para análise de dados estruturados em pipelines de BI.

Exemplos

1. Extração de Relatório Financeiro

Analista de Dados
Contexto
Um analista precisa importar dados de um relatório financeiro trimestral em PDF para um sistema de análise que aceita apenas arquivos XML estruturados.
Problema
Extrair o texto e a estrutura do PDF sem perder a hierarquia das seções e tabelas.
Como usar
O usuário faz o upload do PDF do relatório, seleciona o modo de saída 'Pretty-printed XML' para facilitar a validação visual e mantém a declaração XML ativada.
Configuração de exemplo
sourceFile: financeiro.pdf, outputMode: pretty, includeDeclaration: true
Resultado
Um arquivo XML bem formatado com tags estruturadas representando os títulos, parágrafos e tabelas do relatório financeiro.

2. Integração de Notas Fiscais com ERP

Desenvolvedor de Software
Contexto
Um desenvolvedor precisa integrar um lote de notas fiscais recebidas em formato PDF com o sistema ERP da empresa, que processa dados via XML compacto.
Problema
Converter os PDFs de forma rápida e com o menor tamanho de arquivo possível para otimizar a largura de banda.
Como usar
O desenvolvedor envia a nota fiscal em PDF, escolhe o modo de saída 'Compact XML' e desmarca a declaração XML para atender aos requisitos do parser do ERP.
Configuração de exemplo
sourceFile: nota_fiscal.pdf, outputMode: structured, includeDeclaration: false
Resultado
Um arquivo XML compacto e sem espaços em branco, contendo todos os dados da nota fiscal prontos para consumo pelo ERP.

Testar com amostras

xml, pdf, file

Hubs relacionados

FAQ

O conversor mantém a estrutura original do PDF?

Sim, a ferramenta preserva a hierarquia de conteúdo e a organização estrutural do documento original no arquivo XML gerado.

Qual é a diferença entre os modos de saída?

O modo 'Compact XML' gera um arquivo sem espaços desnecessários para economizar tamanho, enquanto o 'Pretty-printed XML' inclui recuos e quebras de linha para facilitar a leitura.

Posso remover a declaração XML do arquivo final?

Sim, basta desmarcar a opção 'Incluir Declaração XML' antes de iniciar a conversão do arquivo.

Existe um limite de tamanho para o arquivo PDF enviado?

O limite máximo suportado para o upload de arquivos PDF é de 50 MB.

Os meus dados estão seguros ao realizar a conversão?

Sim, o processamento é feito de forma segura e os arquivos enviados não são armazenados permanentemente em nossos servidores.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/pdf-to-xml

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
sourceFile file (Upload necessário) Sim -
outputMode select Não -
includeDeclaration checkbox Não -

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/pdf-to-xml para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Arquivo: Arquivo

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-to-xml": {
      "name": "pdf-to-xml",
      "description": "Converte documentos PDF em formato XML estruturado com hierarquia de conteúdo preservada",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-to-xml",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]