Extrator de revisao com tachado em PDF

Detecta texto riscado em PDFs revisados e gera um relatorio para contratos e revisoes

Depois de enviar um PDF, a ferramenta ativa a deteccao de tachado do OpenDataLoader e extrai texto removido ou marcado para revisao das saidas JSON e Markdown para verificar diferencas rapidamente.

Exemplos de resultados

1 Exemplos

Extrair clausulas riscadas de um PDF revisado

O sample real lista os textos riscados para verificacao rapida.

pdf-strikethrough-review-extractor-example1.html Ver arquivo
Ver parâmetros de entrada
{ "pdfFile": "/public/samples/pdf/pdf-strikethrough-review-extractor-source-example1.pdf", "pages": "", "useStructTree": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Fatos principais

Categoria
Desenvolvimento e Web
Tipos de entrada
file, text, checkbox
Tipo de saída
html
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Extrator de revisão com tachado em PDF identifica e extrai automaticamente textos riscados em documentos PDF, facilitando a análise de alterações em contratos, políticas e rascunhos editoriais através de um relatório consolidado.

Quando usar

  • Ao revisar contratos jurídicos onde cláusulas foram removidas manualmente com marcações de tachado.
  • Durante a auditoria de políticas internas para identificar trechos obsoletos marcados para exclusão em rascunhos.
  • No fluxo editorial para comparar versões de manuscritos e verificar o que foi descartado pelo revisor antes da publicação.

Como funciona

  • Carregue o arquivo PDF que contém as marcações de texto riscado (strikethrough) na interface.
  • Defina o intervalo de páginas específico ou processe o documento inteiro utilizando a árvore estrutural para maior precisão na detecção.
  • O motor OpenDataLoader analisa as camadas do PDF para detectar a formatação de tachado aplicada aos caracteres.
  • A ferramenta gera um relatório HTML consolidando todo o conteúdo removido para conferência rápida e precisa.

Casos de uso

Comparação de minutas contratuais para identificar termos removidos pela contraparte durante negociações.
Revisão de manuais técnicos para validar a exclusão de procedimentos antigos marcados para remoção.
Auditoria de conformidade em documentos regulatórios para rastrear mudanças em rascunhos de políticas.

Exemplos

1. Auditoria de Contrato de Aluguel

Advogado Imobiliário
Contexto
Um contrato de locação foi devolvido com diversas cláusulas riscadas pelo locatário após uma rodada de negociação.
Problema
Identificar rapidamente todas as exclusões feitas pela outra parte sem precisar ler o documento de 50 páginas linha por linha.
Como usar
Carrega o PDF do contrato e ativa a opção 'Usar árvore estrutural' para garantir que o contexto das cláusulas seja mantido.
Resultado
Um relatório HTML listando todas as frases e parágrafos que foram removidos do contrato original, permitindo uma revisão jurídica ágil.

2. Revisão de Política de Privacidade

Analista de Compliance
Contexto
A empresa atualizou sua política de privacidade e marcou os termos obsoletos com tachado para revisão interna.
Problema
Documentar formalmente o que foi removido para manter o histórico de versões e conformidade regulatória.
Como usar
Insere o PDF da política revisada e define o intervalo de páginas onde as alterações de conformidade foram concentradas.
Resultado
Extração limpa do texto obsoleto em um arquivo HTML, facilitando a criação de um log de alterações para auditorias futuras.

Testar com amostras

pdf, text, file

Hubs relacionados

FAQ

O que a ferramenta extrai exatamente?

Ela extrai apenas o texto que possui a formatação visual de tachado (riscado) detectada nos metadados do PDF.

Posso processar apenas algumas páginas do documento?

Sim, utilize o campo 'Páginas' para especificar números ou intervalos como '1, 3, 5-7'.

O que é a opção 'Usar árvore estrutural'?

É um recurso que utiliza a hierarquia interna do PDF para melhorar a precisão da detecção e extração do texto.

Qual o formato do resultado final?

O resultado é entregue em formato HTML, permitindo visualizar o texto extraído de forma organizada no navegador.

A ferramenta funciona com PDFs digitalizados como imagem?

A detecção depende de metadados de texto; PDFs que são apenas imagens sem camada de texto OCR não são suportados.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/pdf-strikethrough-review-extractor

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
pdfFile file (Upload necessário) Sim -
pages text Não -
useStructTree checkbox Não -

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/pdf-strikethrough-review-extractor para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "result": "
Processed HTML content
", "error": "Error message (optional)", "message": "Notification message (optional)", "metadata": { "key": "value" } }
HTML: HTML

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-strikethrough-review-extractor": {
      "name": "pdf-strikethrough-review-extractor",
      "description": "Detecta texto riscado em PDFs revisados e gera um relatorio para contratos e revisoes",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-strikethrough-review-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]