Redução de Ruído PDF

Remove o ruído visual de páginas PDF digitalizadas — granulado tipo sal e pimenta, grão aleatório e velos de fundo pálidos — usando algoritmos reais de processamento de imagem. As páginas de texto são preservadas como conteúdo vetorial pesquisável.

Limpa páginas PDF digitalizadas com ruído por meio de um pipeline em JavaScript puro (sem binários externos) e núcleos reais de processamento de imagem.

Processamento adaptativo por tipo de conteúdo (importante):

  • Páginas de imagem (documentos digitalizados): rasterizadas e reduzidas de ruído.
  • Páginas de texto (incluindo texto + imagem): copiadas tal qual. Texto vetorial, fontes e capacidade de pesquisa são totalmente preservados.
  • Páginas vazias: copiadas tal qual.

Se a sua digitalização tem uma camada de texto OCR (lida como página de "texto"), mas a imagem subjacente ainda tem ruído, ative "Rasterizar Páginas de Texto" para forçar o processamento.

Modos de redução de ruído (todos algoritmos reais):

  • Automático: filtro de mediana 3x3 + remoção de manchas isoladas. Limpeza equilibrada que preserva tom e bordas — opção recomendada.
  • Mediana: filtro de mediana 3x3 por canal (1–3 passagens). O remédio clássico para ruído impulsivo / sal e pimenta.
  • Binarizar: limiar adaptativo Otsu. Transforma velos de fundo em branco puro e o primeiro plano em preto sólido — ideal para a legibilidade do texto digitalizado.

Exemplos de resultados

2 Exemplos

Reduzir ruído de uma digitalização automaticamente

Limpeza equilibrada de mediana + remoção de manchas nas páginas de imagem digitalizadas com ruído, preservando as páginas de texto vetorial

pdf_denoised.pdf Ver arquivo
Ver parâmetros de entrada
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "auto", "strength": 2, "rasterizeText": "false", "pageRange": "" }

Binarizar uma digitalização desbotada para legibilidade

Aplica um limiar Otsu para transformar uma digitalização pálida e enevoada em texto nítido em preto e branco

pdf_denoised.pdf Ver arquivo
Ver parâmetros de entrada
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "binarize", "rasterizeText": "false", "pageRange": "1-3" }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Automático: mediana + remoção de manchas equilibrada (preserva o tom). Mediana: melhor para ruído sal e pimenta/impulsivo. Binarizar: o limiar Otsu torna fundos pálidos brancos e o texto preto sólido.

Número de passagens do filtro de mediana 3x3 (1–3). Maior = remoção de ruído mais forte, mas mais suavização. Ignorado no modo Binarizar.

Por padrão, as páginas de texto são preservadas como conteúdo vetorial pesquisável (sem redução de ruído). Ative apenas para digitalizações OCR cuja imagem subjacente tem ruído, assumindo a perda da seleção de texto.

Especifique as páginas a reduzir o ruído (ex. 1-3,5,7-9). Deixe em branco para todas.

Fatos principais

Categoria
Documentos e PDF
Tipos de entrada
file, select, number, text
Tipo de saída
file
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Redutor de Ruído PDF remove imperfeições visuais de documentos digitalizados, como ruído sal e pimenta, granulação e fundos acinzentados, aplicando filtros de imagem avançados diretamente nas páginas rasterizadas, enquanto preserva o texto vetorial pesquisável.

Quando usar

  • Quando você tem documentos digitalizados com manchas, poeira ou ruído de fundo que dificultam a leitura ou a impressão.
  • Para limpar arquivos PDF antes de aplicar processos de arquivamento ou OCR, melhorando a nitidez do texto.
  • Quando deseja remover o fundo escuro ou cinza de digitalizações antigas, transformando-as em páginas com fundo branco puro e texto preto nítido.

Como funciona

  • O arquivo PDF é analisado página por página para identificar se são páginas de imagem (digitalizações) ou páginas de texto vetorial.
  • As páginas de imagem são rasterizadas e processadas usando o algoritmo selecionado, como o filtro de mediana ou a binarização adaptativa de Otsu.
  • O ruído visual, como granulados e manchas isoladas, é removido de acordo com a intensidade configurada.
  • As páginas limpas são recombinadas com as páginas de texto originais preservadas, gerando um novo arquivo PDF otimizado.

Casos de uso

Limpeza de contratos e documentos digitalizados antigos com fundo escuro ou manchas de digitalização.
Preparação de apostilas e livros digitalizados para impressão econômica, removendo o cinza do fundo.
Otimização de relatórios com ruído visual para melhorar a legibilidade em dispositivos móveis.

Exemplos

1. Limpeza automática de contrato digitalizado

Advogado
Contexto
Precisa enviar um contrato digitalizado para um cliente, mas a digitalização ficou cheia de pequenos pontos pretos e ruído de fundo.
Problema
O documento parece pouco profissional devido ao ruído visual acumulado na digitalização.
Como usar
Carregue o PDF do contrato, selecione o modo 'Automático' e defina a intensidade como 2. Deixe a opção de rasterizar texto desativada para manter o texto pesquisável.
Configuração de exemplo
{
  "mode": "auto",
  "strength": 2,
  "rasterizeText": "false"
}
Resultado
Um PDF limpo, sem os pontos pretos de ruído, mantendo a legibilidade e a formatação original do texto.

2. Binarização de livro antigo digitalizado

Pesquisador acadêmico
Contexto
Possui um PDF de um livro antigo cujas páginas estão amareladas e com baixo contraste entre o texto e o fundo.
Problema
O fundo escuro dificulta a leitura prolongada e consome muita tinta ao imprimir.
Como usar
Envie o PDF do livro, selecione o modo 'Binarizar (Otsu)' e defina o intervalo de páginas para processar todo o documento.
Configuração de exemplo
{
  "mode": "binarize",
  "rasterizeText": "false",
  "pageRange": ""
}
Resultado
As páginas do livro passam a ter fundo branco puro e texto em preto nítido, facilitando a leitura e economizando tinta na impressão.

Testar com amostras

pdf, image, video

Hubs relacionados

FAQ

O que acontece com o texto pesquisável do meu PDF?

Por padrão, as páginas que contêm texto vetorial pesquisável são preservadas intactas para não perder a capacidade de busca e seleção.

Como funciona o modo de binarização Otsu?

Este modo aplica um limiar adaptativo que converte fundos cinzas ou desbotados em branco puro e o texto em preto sólido, ideal para máxima legibilidade.

Posso aplicar a redução de ruído apenas em algumas páginas?

Sim, você pode especificar o intervalo de páginas desejado no campo correspondente, como '1-3,5', para processar apenas partes específicas do documento.

O que faz a opção 'Rasterizar Páginas de Texto'?

Ela força a conversão de páginas de texto em imagens para que os filtros de ruído sejam aplicados, útil se a imagem de fundo sob o texto OCR estiver muito suja.

Qual é a diferença entre o modo Automático e o filtro de Mediana?

O modo Automático combina o filtro de mediana com a remoção de manchas preservando tons, enquanto o filtro de Mediana puro foca na eliminação de ruídos do tipo sal e pimenta.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/pdf-denoise

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
sourceFile file (Upload necessário) Sim -
mode select Sim Automático: mediana + remoção de manchas equilibrada (preserva o tom). Mediana: melhor para ruído sal e pimenta/impulsivo. Binarizar: o limiar Otsu torna fundos pálidos brancos e o texto preto sólido.
strength number Não Número de passagens do filtro de mediana 3x3 (1–3). Maior = remoção de ruído mais forte, mas mais suavização. Ignorado no modo Binarizar.
rasterizeText select Não Por padrão, as páginas de texto são preservadas como conteúdo vetorial pesquisável (sem redução de ruído). Ative apenas para digitalizações OCR cuja imagem subjacente tem ruído, assumindo a perda da seleção de texto.
pageRange text Não Especifique as páginas a reduzir o ruído (ex. 1-3,5,7-9). Deixe em branco para todas.

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/pdf-denoise para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Arquivo: Arquivo

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-denoise": {
      "name": "pdf-denoise",
      "description": "Remove o ruído visual de páginas PDF digitalizadas — granulado tipo sal e pimenta, grão aleatório e velos de fundo pálidos — usando algoritmos reais de processamento de imagem. As páginas de texto são preservadas como conteúdo vetorial pesquisável.",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-denoise",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]