Extrator de intervalo de paginas PDF

Extrai apenas um intervalo de paginas PDF e o exporta como Markdown, JSON ou texto

Depois de enviar um PDF, informe uma expressao de paginas como 1,3,5-7 e a ferramenta processara apenas essas paginas. Isso e util para relatórios longos, manuais, artigos e contratos quando voce precisa so de um trecho.

Exemplos de resultados

1 Exemplos

Extrair apenas as duas primeiras paginas

O sample real exportou as paginas 1-2 como Markdown reutilizavel.

pdf-page-range-extractor-example1.md Ver arquivo
Ver parâmetros de entrada
{ "pdfFile": "/public/samples/pdf/financial-report-example1.pdf", "exportFormat": "markdown", "pages": "1-2", "useStructTree": true, "keepLineBreaks": true, "includePageSeparators": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Fatos principais

Categoria
Desenvolvimento e Web
Tipos de entrada
file, select, text, checkbox
Tipo de saída
file
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Extrator de Intervalo de Páginas PDF permite selecionar e extrair páginas específicas de documentos longos, exportando o conteúdo diretamente para Markdown, JSON ou texto puro. Basta informar os números das páginas desejadas para isolar capítulos, apêndices ou cláusulas de contratos sem precisar processar o arquivo inteiro, otimizando seu tempo e facilitando a análise de dados.

Quando usar

  • Quando precisar extrair capítulos ou apêndices específicos de manuais e relatórios longos.
  • Para isolar cláusulas ou páginas de assinaturas em contratos jurídicos extensos.
  • Ao preparar trechos selecionados de documentos para ingestão em ferramentas de IA.

Como funciona

  • Faça o upload do seu arquivo PDF na ferramenta.
  • Informe o intervalo de páginas desejado usando o formato de expressão (ex: 1,3,5-7).
  • Selecione o formato de exportação (Markdown, JSON ou Texto) e ajuste as opções de formatação, como manter quebras de linha.
  • Baixe o arquivo gerado contendo apenas o texto das páginas selecionadas.

Casos de uso

Pesquisadores extraindo apenas a metodologia e os resultados de artigos científicos extensos.
Advogados isolando páginas específicas de processos para anexar em petições ou enviar a clientes.
Analistas de dados convertendo tabelas de páginas específicas de relatórios financeiros para JSON.

Exemplos

1. Extração de Resumo Executivo

Analista Financeiro
Contexto
Um analista precisa do resumo executivo de um relatório anual de 200 páginas para criar uma apresentação.
Problema
Processar o PDF inteiro é demorado e gera excesso de informações desnecessárias.
Como usar
Faça o upload do relatório, defina as páginas como '1-2' e escolha a exportação em Markdown.
Configuração de exemplo
Páginas: 1-2 | Formato: Markdown | Incluir separadores: Sim
Resultado
As duas primeiras páginas são extraídas perfeitamente em Markdown, prontas para serem copiadas para a apresentação.

2. Isolamento de Cláusulas Contratuais

Assistente Jurídico
Contexto
Um assistente precisa enviar apenas as páginas de rescisão e assinatura de um contrato de 50 páginas para um cliente.
Problema
O cliente precisa ler apenas as páginas 15 e 50 em formato de texto simples, sem o restante do documento.
Como usar
Envie o contrato em PDF, insira '15,50' no campo de páginas e selecione a exportação como Texto.
Configuração de exemplo
Páginas: 15,50 | Formato: Texto | Manter quebras de linha: Sim
Resultado
Um arquivo de texto contendo exclusivamente o conteúdo das páginas 15 e 50 é gerado rapidamente.

Testar com amostras

json, markdown, pdf

Hubs relacionados

FAQ

Quais formatos de exportação estão disponíveis?

Você pode exportar o conteúdo extraído em Markdown, JSON ou texto puro.

Como devo digitar o intervalo de páginas?

Use vírgulas para páginas individuais e hifens para intervalos contínuos. Por exemplo, '1,3,5-7' extrairá as páginas 1, 3, 5, 6 e 7.

O que faz a opção de usar árvore estrutural?

Ela ajuda a manter a hierarquia e a organização original do documento, melhorando a qualidade da extração, especialmente para o formato Markdown.

Posso manter as quebras de linha originais do PDF?

Sim, basta marcar a opção 'Manter quebras de linha' antes de iniciar a extração.

A ferramenta adiciona separadores entre as páginas extraídas?

Sim, você pode ativar a opção 'Incluir separadores de página' para identificar facilmente onde cada página começa e termina no arquivo final.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/pdf-page-range-extractor

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
pdfFile file (Upload necessário) Sim -
exportFormat select Não -
pages text Sim -
useStructTree checkbox Não -
keepLineBreaks checkbox Não -
includePageSeparators checkbox Não -

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/pdf-page-range-extractor para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Arquivo: Arquivo

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-page-range-extractor": {
      "name": "pdf-page-range-extractor",
      "description": "Extrai apenas um intervalo de paginas PDF e o exporta como Markdown, JSON ou texto",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-page-range-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]