Réduction de Bruit PDF

Supprime le bruit visuel des pages PDF numérisées — bruit poivre et sel, grain aléatoire et voiles d'arrière-plan — à l'aide d'algorithmes réels de traitement d'image. Les pages de texte sont conservées en tant que contenu vectoriel consultable.

Nettoie les pages PDF numérisées bruitées avec un pipeline JavaScript pur (sans binaire externe) et de véritables noyaux de traitement d'image.

Traitement adaptatif par type de contenu (important) :

  • Pages d'image (documents numérisés) : rasterisées et débruitées.
  • Pages de texte (y compris texte + image) : copiées telles quelles. Le texte vectoriel, les polices et la recherche sont entièrement préservés.
  • Pages vides : copiées telles quelles.

Si votre numérisation comporte une couche de texte OCR (lue comme une page de « texte ») mais que l'image sous-jacente reste bruitée, activez « Rasteriser les pages de texte » pour forcer le traitement.

Modes de réduction de bruit (tous de vrais algorithmes) :

  • Auto : filtre médian 3x3 + suppression des taches isolées. Nettoyage équilibré qui préserve le ton et les contours — option recommandée.
  • Médian : filtre médian 3x3 par canal (1 à 3 passes). Le remède classique au bruit impulsionnel / poivre et sel.
  • Binariser : seuil adaptatif Otsu. Transforme les voiles d'arrière-plan en blanc pur et l'avant-plan en noir solide — idéal pour la lisibilité du texte numérisé.

Exemples de résultats

2 Exemples

Réduction automatique du bruit d'une numérisation

Nettoyage équilibré médian + suppression de taches sur les pages d'image numérisées bruitées, en préservant les pages de texte vectoriel

pdf_denoised.pdf Voir fichier
Voir paramètres d'entrée
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "auto", "strength": 2, "rasterizeText": "false", "pageRange": "" }

Binariser un scan pâle pour la lisibilité

Applique un seuil Otsu pour transformer un scan pâle et brumeux en texte noir et blanc net

pdf_denoised.pdf Voir fichier
Voir paramètres d'entrée
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "binarize", "rasterizeText": "false", "pageRange": "1-3" }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Auto : médian + suppression de taches équilibré (préserve le ton). Médian : idéal pour le bruit poivre et sel/impulsionnel. Binariser : le seuil Otsu blanchit les arrière-plans tenues et noircit le texte.

Nombre de passes du filtre médian 3x3 (1-3). Plus élevé = élimination plus forte du bruit mais plus de adoucissement. Ignoré en mode Binariser.

Par défaut, les pages de texte sont préservées en tant que contenu vectoriel consultable (non débruitées). Activez-le uniquement pour les numérisations OCR dont l'image sous-jacente est bruitée, en acceptant la perte de la sélection de texte.

Spécifier les pages à débruiter (ex. 1-3,5,7-9). Laisser vide pour toutes.

Points clés

Catégorie
Documents et PDF
Types d’entrée
file, select, number, text
Type de sortie
file
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

Cet outil en ligne permet de nettoyer et de réduire le bruit visuel des documents PDF numérisés en appliquant des algorithmes de traitement d'image performants, tout en préservant le texte vectoriel consultable des pages non numérisées.

Quand l’utiliser

  • Lorsque vous disposez de documents PDF numérisés contenant du bruit de type poivre et sel ou des grains aléatoires qui nuisent à la lecture.
  • Pour blanchir les arrière-plans grisâtres ou sombres de scans de mauvaise qualité afin d'améliorer le contraste du texte.
  • Avant de soumettre un PDF à un moteur d'OCR externe afin d'optimiser la précision de la reconnaissance de caractères.

Comment ça marche

  • Sélectionnez et téléchargez votre fichier PDF à traiter.
  • Choisissez le mode de réduction de bruit adapté : Auto pour un nettoyage équilibré, Filtre médian pour le bruit impulsionnel, ou Binariser pour un rendu noir et blanc net via le seuil d'Otsu.
  • Définissez si nécessaire l'intensité du filtre (nombre de passes) et la plage de pages spécifique à traiter.
  • L'outil applique les filtres d'image sur les pages rasterisées tout en conservant intactes les pages de texte vectoriel d'origine.

Cas d’usage

Nettoyage de contrats numérisés pour éliminer les taches de numérisation et les grains de papier.
Amélioration de la lisibilité de vieux documents d'archives numérisés en binarisant le texte.
Préparation de documents administratifs bruités avant archivage numérique ou envoi par courriel.

Exemples

1. Nettoyage automatique d'un rapport numérisé bruité

Archiviste
Contexte
Un archiviste doit intégrer un rapport numérisé dans une base de données, mais les pages d'images contiennent beaucoup de bruit de numérisation.
Problème
Le bruit visuel rend la lecture inconfortable et augmente inutilement la taille visuelle du fichier.
Comment l’utiliser
Téléchargez le PDF, sélectionnez le mode 'Auto' avec une intensité de 2 passes, et lancez le traitement.
Configuration d’exemple
mode: "auto", strength: 2, rasterizeText: "false"
Résultat
Les pages d'images sont nettoyées des taches isolées tandis que les pages de garde textuelles restent parfaitement nettes et consultables.

2. Binarisation d'un contrat pâle pour impression

Assistant juridique
Contexte
Un assistant juridique reçoit un scan de contrat très pâle avec un fond grisâtre difficile à lire et à imprimer proprement.
Problème
L'impression consomme trop d'encre à cause du fond gris et le texte manque de contraste.
Comment l’utiliser
Importez le document, choisissez le mode 'Binariser' (Otsu) pour les pages 1 à 3.
Configuration d’exemple
mode: "binarize", pageRange: "1-3", rasterizeText: "false"
Résultat
Le fond gris devient blanc pur et le texte devient noir uni, offrant un contraste maximal pour une impression économique et lisible.

Tester avec des échantillons

pdf, image, video

Hubs associés

FAQ

Est-ce que mes pages de texte consultables vont perdre leur qualité ?

Non, par défaut, les pages contenant du texte vectoriel sont copiées telles quelles sans modification pour préserver la recherche et les polices.

Comment forcer le nettoyage d'un PDF qui contient déjà une couche OCR ?

Activez l'option 'Rasteriser les pages de texte' pour forcer le traitement d'image sur l'ensemble du document.

Quelle est la différence entre le mode Médian et le mode Binariser ?

Le filtre médian atténue le bruit tout en préservant les nuances de gris, tandis que la binarisation transforme le document en noir et blanc pur.

Puis-je traiter uniquement certaines pages d'un long document ?

Oui, utilisez le champ 'Plage de pages' pour spécifier les pages exactes à débruiter (par exemple, '1-3,5').

Quelle intensité de filtre médian dois-je choisir ?

Une intensité de 2 passes est recommandée par défaut ; augmentez à 3 pour les bruits très prononcés, au risque d'adoucir légèrement l'image.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/pdf-denoise

Paramètres de la requête

Nom du paramètre Type Requis Description
sourceFile file (Téléchargement requis) Oui -
mode select Oui Auto : médian + suppression de taches équilibré (préserve le ton). Médian : idéal pour le bruit poivre et sel/impulsionnel. Binariser : le seuil Otsu blanchit les arrière-plans tenues et noircit le texte.
strength number Non Nombre de passes du filtre médian 3x3 (1-3). Plus élevé = élimination plus forte du bruit mais plus de adoucissement. Ignoré en mode Binariser.
rasterizeText select Non Par défaut, les pages de texte sont préservées en tant que contenu vectoriel consultable (non débruitées). Activez-le uniquement pour les numérisations OCR dont l'image sous-jacente est bruitée, en acceptant la perte de la sélection de texte.
pageRange text Non Spécifier les pages à débruiter (ex. 1-3,5,7-9). Laisser vide pour toutes.

Les paramètres de type fichier doivent être téléchargés d'abord via POST /upload/pdf-denoise pour obtenir filePath, puis filePath doit être passé au champ de fichier correspondant.

Format de réponse

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Fichier: Fichier

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-pdf-denoise": {
      "name": "pdf-denoise",
      "description": "Supprime le bruit visuel des pages PDF numérisées — bruit poivre et sel, grain aléatoire et voiles d'arrière-plan — à l'aide d'algorithmes réels de traitement d'image. Les pages de texte sont conservées en tant que contenu vectoriel consultable.",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-denoise",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Prend en charge les liens de fichiers URL ou la codification Base64 pour les paramètres de fichier.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]