Reducir Ruido PDF

Elimina el ruido visual de las páginas PDF escaneadas — moteado de sal y pimienta, grano aleatorio y velos de fondo tenues — con algoritmos reales de procesamiento de imagen. Las páginas de texto se conservan como contenido vectorial buscable.

Limpia páginas PDF escaneadas con ruido mediante una tubería de JavaScript puro (sin binarios externos) y núcleos reales de procesamiento de imagen.

Procesamiento adaptativo por tipo de contenido (importante):

  • Páginas de imagen (documentos escaneados): rasterizadas y reducidas de ruido.
  • Páginas de texto (incluidas texto + imagen): se copian tal cual. Se preservan texto vectorial, fuentes y capacidad de búsqueda.
  • Páginas vacías: se copian tal cual.

Si tu escaneo tiene una capa de texto OCR (y se lee como página de "texto") pero la imagen subyacente sigue con ruido, activa "Rasterizar páginas de texto" para forzar el procesamiento.

Modos de reducción de ruido (todos algoritmos reales):

  • Automático: filtro de mediana 3x3 + eliminación de motas aisladas. Limpieza equilibrada que conserva tono y bordes — opción recomendada.
  • Mediana: filtro de mediana 3x3 por canal (1-3 pasadas). El remedio clásico para el ruido de sal y pimienta / impulso.
  • Binarizar: umbral adaptativo Otsu. Convierte velos de fondo en blanco puro y el frente en negro sólido — ideal para la legibilidad del texto escaneado.

Resultados de ejemplo

2 Ejemplos

Reducir ruido de un escaneo automáticamente

Limpieza equilibrada de mediana + eliminación de motas en páginas de imagen escaneadas con ruido, preservando las páginas de texto vectorial

pdf_denoised.pdf Ver archivo
Ver parámetros de entrada
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "auto", "strength": 2, "rasterizeText": "false", "pageRange": "" }

Binarizar un escaneo descolorido para mayor legibilidad

Aplica un umbral Otsu para convertir un escaneo tenue y brumoso en texto nítido en blanco y negro

pdf_denoised.pdf Ver archivo
Ver parámetros de entrada
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "binarize", "rasterizeText": "false", "pageRange": "1-3" }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Automático: mediana + despeckle equilibrado (conserva el tono). Mediana: ideal para ruido sal y pimienta/impulso. Binarizar: el umbral Otsu vuelve blancos los fondos tenues y negro sólido el texto.

Número de pasadas del filtro de mediana 3x3 (1-3). Mayor = mayor eliminación de ruido pero más suavizado. Se ignora en modo Binarizar.

Por defecto las páginas de texto se preservan como contenido vectorial buscable (sin reducir ruido). Actívalo solo para escaneos OCR cuya imagen subyacente tiene ruido, asumiendo la pérdida de la selección de texto.

Especifica páginas a reducir de ruido (ej. 1-3,5,7-9). Dejar en blanco para todas.

Datos clave

Categoría
Documentos y PDF
Tipos de entrada
file, select, number, text
Tipo de salida
file
Cobertura de muestras
4
API disponible
Yes

Resumen

Limpia y optimiza tus documentos PDF escaneados eliminando el ruido visual, el grano aleatorio y las manchas de fondo. Esta herramienta procesa de forma inteligente las páginas de imagen aplicando filtros avanzados como la mediana y la binarización de Otsu, mientras conserva intactas las páginas de texto vectorial para mantener su capacidad de búsqueda.

Cuándo usarlo

  • Cuando tienes documentos PDF escaneados con ruido de fondo, motas oscuras o grano que dificultan la lectura.
  • Al preparar archivos PDF digitalizados para sistemas de reconocimiento óptico de caracteres (OCR) que requieren texto limpio y contrastado.
  • Cuando necesitas limpiar las imágenes de un PDF mixto sin perder el texto vectorial ni la capacidad de búsqueda en las páginas digitales nativas.

Cómo funciona

  • El usuario sube el archivo PDF y selecciona el modo de reducción de ruido (Automático, Mediana o Binarizar) junto con el rango de páginas a procesar.
  • La herramienta analiza cada página: las páginas de texto vectorial se conservan intactas, mientras que las páginas de imagen se rasterizan para aplicar los algoritmos de limpieza.
  • Se aplican filtros de mediana para eliminar el ruido de sal y pimienta o el umbral adaptativo de Otsu para convertir fondos grises en blanco puro.
  • Se reconstruye el documento PDF combinando las páginas limpiadas y las páginas vectoriales originales en un único archivo optimizado.

Casos de uso

Limpieza de contratos y facturas escaneadas con motas de polvo y ruido de fotocopia.
Preparación de libros digitalizados antiguos mediante binarización para mejorar el contraste del texto antes de su lectura.
Optimización de documentos mixtos que contienen tanto diagramas escaneados ruidosos como páginas de texto digital nativo.

Ejemplos

1. Limpieza automática de contratos escaneados

Asistente legal
Contexto
Un asistente legal recibe contratos escaneados con mucho ruido de fondo y pequeñas motas negras que dificultan la lectura de las cláusulas.
Problema
El ruido visual en las páginas escaneadas da un aspecto poco profesional y reduce la legibilidad del documento.
Cómo usarlo
Sube el PDF del contrato, selecciona el modo 'Automático (mediana + despeckle)' con una intensidad de 2 pasadas y procesa el archivo.
Configuración de ejemplo
mode: 'auto', strength: 2, rasterizeText: 'false'
Resultado
Se genera un PDF limpio donde las motas de polvo han desaparecido y el fondo es uniforme, manteniendo el texto legible.

2. Binarización de documentos históricos tenues

Archivista digital
Contexto
Un archivista está digitalizando manuscritos y documentos antiguos cuyas páginas tienen un fondo amarillento y texto descolorido.
Problema
El bajo contraste entre el papel envejecido y la tinta dificulta la lectura y el almacenamiento eficiente.
Cómo usarlo
Sube el archivo PDF, selecciona el modo 'Binarizar (Otsu)' para las páginas de la 1 a la 5 y ejecuta la herramienta.
Configuración de ejemplo
mode: 'binarize', pageRange: '1-5'
Resultado
Las páginas seleccionadas se convierten a blanco y negro puro, eliminando el fondo oscuro y haciendo que el texto sea completamente nítido.

Probar con muestras

pdf, image, video

Hubs relacionados

Preguntas frecuentes

¿El proceso elimina el texto seleccionable de mi PDF?

No por defecto. Las páginas con texto vectorial se conservan intactas para mantener la búsqueda, a menos que actives la opción de rasterizar texto.

¿Qué hace el modo de binarización Otsu?

Convierte los fondos tenues o grises en blanco puro y el texto en negro sólido, mejorando drásticamente el contraste y la legibilidad.

¿Cuándo debo activar la opción 'Rasterizar páginas de texto'?

Actívala únicamente si tu PDF tiene una capa de texto OCR invisible pero la imagen de fondo sigue teniendo ruido visual que deseas limpiar.

¿Qué rango de páginas puedo procesar?

Puedes especificar páginas individuales o rangos separados por comas (por ejemplo, '1-3,5'), o dejarlo en blanco para procesar todo el documento.

¿Cuántas pasadas del filtro de mediana se recomiendan?

Se recomiendan 2 pasadas para un equilibrio óptimo entre la eliminación de ruido de sal y pimienta y la nitidez de los bordes.

Documentación de la API

Punto final de la solicitud

POST /es/api/tools/pdf-denoise

Parámetros de la solicitud

Nombre del parámetro Tipo Requerido Descripción
sourceFile file (Subida requerida) -
mode select Automático: mediana + despeckle equilibrado (conserva el tono). Mediana: ideal para ruido sal y pimienta/impulso. Binarizar: el umbral Otsu vuelve blancos los fondos tenues y negro sólido el texto.
strength number No Número de pasadas del filtro de mediana 3x3 (1-3). Mayor = mayor eliminación de ruido pero más suavizado. Se ignora en modo Binarizar.
rasterizeText select No Por defecto las páginas de texto se preservan como contenido vectorial buscable (sin reducir ruido). Actívalo solo para escaneos OCR cuya imagen subyacente tiene ruido, asumiendo la pérdida de la selección de texto.
pageRange text No Especifica páginas a reducir de ruido (ej. 1-3,5,7-9). Dejar en blanco para todas.

Los parámetros de tipo archivo necesitan ser subidos primero vía POST /upload/pdf-denoise para obtener filePath, luego pasar filePath al campo de archivo correspondiente.

Formato de respuesta

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Archivo: Archivo

Documentación de MCP

Agregue este herramienta a su configuración de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-denoise": {
      "name": "pdf-denoise",
      "description": "Elimina el ruido visual de las páginas PDF escaneadas — moteado de sal y pimienta, grano aleatorio y velos de fondo tenues — con algoritmos reales de procesamiento de imagen. Las páginas de texto se conservan como contenido vectorial buscable.",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-denoise",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Puede encadenar múltiples herramientas, por ejemplo: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máximo 20 herramientas.

Soporte para enlaces de archivos URL o codificación Base64 para parámetros de archivo.

Si encuentra algún problema, por favor, póngase en contacto con nosotros en [email protected]