Fatos principais
- Categoria
- Documentos e PDF
- Tipos de entrada
- file, select, number, text
- Tipo de saída
- file
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Redutor de Ruído PDF remove imperfeições visuais de documentos digitalizados, como ruído sal e pimenta, granulação e fundos acinzentados, aplicando filtros de imagem avançados diretamente nas páginas rasterizadas, enquanto preserva o texto vetorial pesquisável.
Quando usar
- •Quando você tem documentos digitalizados com manchas, poeira ou ruído de fundo que dificultam a leitura ou a impressão.
- •Para limpar arquivos PDF antes de aplicar processos de arquivamento ou OCR, melhorando a nitidez do texto.
- •Quando deseja remover o fundo escuro ou cinza de digitalizações antigas, transformando-as em páginas com fundo branco puro e texto preto nítido.
Como funciona
- •O arquivo PDF é analisado página por página para identificar se são páginas de imagem (digitalizações) ou páginas de texto vetorial.
- •As páginas de imagem são rasterizadas e processadas usando o algoritmo selecionado, como o filtro de mediana ou a binarização adaptativa de Otsu.
- •O ruído visual, como granulados e manchas isoladas, é removido de acordo com a intensidade configurada.
- •As páginas limpas são recombinadas com as páginas de texto originais preservadas, gerando um novo arquivo PDF otimizado.
Casos de uso
Exemplos
1. Limpeza automática de contrato digitalizado
Advogado- Contexto
- Precisa enviar um contrato digitalizado para um cliente, mas a digitalização ficou cheia de pequenos pontos pretos e ruído de fundo.
- Problema
- O documento parece pouco profissional devido ao ruído visual acumulado na digitalização.
- Como usar
- Carregue o PDF do contrato, selecione o modo 'Automático' e defina a intensidade como 2. Deixe a opção de rasterizar texto desativada para manter o texto pesquisável.
- Configuração de exemplo
-
{ "mode": "auto", "strength": 2, "rasterizeText": "false" } - Resultado
- Um PDF limpo, sem os pontos pretos de ruído, mantendo a legibilidade e a formatação original do texto.
2. Binarização de livro antigo digitalizado
Pesquisador acadêmico- Contexto
- Possui um PDF de um livro antigo cujas páginas estão amareladas e com baixo contraste entre o texto e o fundo.
- Problema
- O fundo escuro dificulta a leitura prolongada e consome muita tinta ao imprimir.
- Como usar
- Envie o PDF do livro, selecione o modo 'Binarizar (Otsu)' e defina o intervalo de páginas para processar todo o documento.
- Configuração de exemplo
-
{ "mode": "binarize", "rasterizeText": "false", "pageRange": "" } - Resultado
- As páginas do livro passam a ter fundo branco puro e texto em preto nítido, facilitando a leitura e economizando tinta na impressão.
Testar com amostras
pdf, image, videoHubs relacionados
FAQ
O que acontece com o texto pesquisável do meu PDF?
Por padrão, as páginas que contêm texto vetorial pesquisável são preservadas intactas para não perder a capacidade de busca e seleção.
Como funciona o modo de binarização Otsu?
Este modo aplica um limiar adaptativo que converte fundos cinzas ou desbotados em branco puro e o texto em preto sólido, ideal para máxima legibilidade.
Posso aplicar a redução de ruído apenas em algumas páginas?
Sim, você pode especificar o intervalo de páginas desejado no campo correspondente, como '1-3,5', para processar apenas partes específicas do documento.
O que faz a opção 'Rasterizar Páginas de Texto'?
Ela força a conversão de páginas de texto em imagens para que os filtros de ruído sejam aplicados, útil se a imagem de fundo sob o texto OCR estiver muito suja.
Qual é a diferença entre o modo Automático e o filtro de Mediana?
O modo Automático combina o filtro de mediana com a remoção de manchas preservando tons, enquanto o filtro de Mediana puro foca na eliminação de ruídos do tipo sal e pimenta.