PDF Entrauschen

Entfernt visuelles Rauschen aus eingescannten PDF-Seiten — Salz-und-Pfeffer-Flecken, zufälliges Korn und schwache Hintergrundschleier — mit echten Bildverarbeitungsalgorithmen. Textseiten bleiben als durchsuchbarer Vektorinhalt erhalten.

Bereinigt verrauschte eingescannte PDF-Seiten mit einer reinen JavaScript-Pipeline (keine externen Binärdateien) und echten Bildverarbeitungskernen.

Inhaltsadaptive Verarbeitung (wichtig):

  • Bildseiten (gescannte Dokumente): gerastert und entrauscht.
  • Textseiten (einschließlich Text + Bild): werden unverändert kopiert. Vektor-Text, Schriftarten und Durchsuchbarkeit bleiben vollständig erhalten.
  • Leere Seiten: werden unverändert kopiert.

Falls Ihr Scan eine OCR-Textebene enthält (als „Text"-seite gelesen), das eigentliche Bild aber verrauscht ist, aktivieren Sie „Textseiten rastern", um die Verarbeitung zu erzwingen.

Entrauschungsmodi (alles echte Algorithmen):

  • Auto: 3x3-Medianfilter + Entfernung isolierter Flecken. Ausgewogene Bereinigung, die Ton und Kanten erhält — empfohlene Standardeinstellung.
  • Median: 3x3-Medianfilter pro Kanal (1–3 Durchläufe). Das klassische Mittel gegen Salz-und-Pfeffer-/Impulsrauschen.
  • Binarisieren: Adaptiver Otsu-Schwellenwert. Macht schwache Hintergründe rein weiß und den Vordergrund massiv schwarz — ideal für die Lesbarkeit gescannten Textes.

Beispielergebnisse

2 Beispiele

Automatisches Entrauschen eines Scans

Ausgewogene Median- + Fleckenentfernung bei verrauschten eingescannten Bildseiten, unter Erhaltung der Vektor-Textseiten

pdf_denoised.pdf Datei anzeigen
Eingabeparameter anzeigen
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "auto", "strength": 2, "rasterizeText": "false", "pageRange": "" }

Binarisieren eines verblassten Scans für bessere Lesbarkeit

Wendet eine Otsu-Schwellenwert an, um einen blassen, verschleierten Scan in klaren schwarz-weißen Text umzuwandeln

pdf_denoised.pdf Datei anzeigen
Eingabeparameter anzeigen
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "binarize", "rasterizeText": "false", "pageRange": "1-3" }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Auto: ausgewogenes Median + Fleckentfernung (erhält den Ton). Median: am besten für Salz-und-Pfeffer-/Impulsrauschen. Binarisieren: Der Otsu-Schwellenwert macht blasse Hintergründe weiß und den Text massiv schwarz.

Anzahl der 3x3-Medianfilter-Durchläufe (1–3). Höher = stärkere Rauschentfernung, aber mehr Weichzeichnung. Im Modus Binarisieren ignoriert.

Standardmäßig bleiben Textseiten als durchsuchbarer Vektorinhalt erhalten (nicht entrauscht). Aktivieren Sie dies nur für OCR-Scans, deren zugrundeliegendes Bild verrauscht ist, unter Verlust der Textauswahl.

Seiten zum Entrauschen angeben (z. B. 1-3,5,7-9). Leer lassen für alle.

Wichtige Fakten

Kategorie
Dokumente & PDF
Eingabetypen
file, select, number, text
Ausgabetyp
file
Sample-Abdeckung
4
API verfügbar
Yes

Überblick

Das Online-Tool „PDF Entrauschen“ entfernt störendes visuelles Rauschen wie Salz-und-Pfeffer-Flecken, Bildkörnung und graue Hintergrundschleier aus eingescannten PDF-Dokumenten. Dank einer intelligenten, inhaltsadaptiven Verarbeitung werden reine Bildseiten mithilfe echter Bildverarbeitungsalgorithmen bereinigt, während durchsuchbare Vektortexte und Schriftarten standardmäßig unberührt und vollständig erhalten bleiben.

Wann verwenden

  • Wenn eingescannte Dokumente störende Flecken, Bildrauschen oder graue Schleier aufweisen, die die Lesbarkeit beeinträchtigen.
  • Wenn Sie die visuelle Qualität von Scans optimieren möchten, ohne die Durchsuchbarkeit von bereits vorhandenem Vektor-Text zu verlieren.
  • Vor einer Texterkennung (OCR), um durch Binarisierung den Kontrast zwischen Text und Hintergrund drastisch zu erhöhen.

So funktioniert es

  • Sie laden Ihre PDF-Datei hoch und wählen den gewünschten Entrauschungsmodus (Auto, Median oder Binarisieren) sowie optional den Seitenbereich aus.
  • Das Tool analysiert jede Seite: Reine Textseiten werden übersprungen, um Vektoren zu schützen, während Bildseiten gerastert werden.
  • Auf den Bildseiten entfernen mathematische Filter (wie der 3x3-Medianfilter oder der Otsu-Schwellenwert) Bildrauschen und Flecken direkt im Browser.
  • Die bereinigten Seiten werden wieder in ein neues, optimiertes PDF-Dokument zusammengeführt und zum Download bereitgestellt.

Anwendungsfälle

Bereinigen von alten, vergilbten oder schlecht eingescannten Verträgen und Dokumenten für eine bessere digitale Archivierung.
Vorbereitung von Dokumenten-Scans für OCR-Software, um die Erkennungsrate durch scharfe Schwarz-Weiß-Kontraste zu maximieren.
Entfernen von störendem Bildrauschen und Flecken aus digitalisierten Buchseiten oder Skripten vor dem Ausdrucken.

Beispiele

1. Automatische Bereinigung eines verrauschten Scans

Archivar
Hintergrund
Ein Archivmitarbeiter hat historische Dokumente eingescannt, die nun feine Flecken und ein störendes Rauschen aufweisen.
Problem
Die Flecken stören das Gesamtbild und machen das Lesen am Bildschirm anstrengend.
Verwendung
Die PDF-Datei hochladen, den Modus 'Auto (Median + Fleckentfernung)' wählen und die Stärke auf 2 belassen.
Beispielkonfiguration
mode: "auto", strength: 2, rasterizeText: "false"
Ergebnis
Das Rauschen und kleine Flecken werden entfernt, während die Lesbarkeit der Dokumente deutlich verbessert wird.

2. Kontrastoptimierung für OCR-Texterkennung

Student
Hintergrund
Ein Student hat Vorlesungsskripte mit dem Smartphone abfotografiert. Die Seiten haben graue Schatten und ungleichmäßige Belichtung.
Problem
Die OCR-Software kann den Text aufgrund des grauen Hintergrunds und der Schatten nicht fehlerfrei auslesen.
Verwendung
Das PDF hochladen, den Modus auf 'Binarisieren (Otsu)' stellen und die Verarbeitung starten.
Beispielkonfiguration
mode: "binarize", rasterizeText: "false"
Ergebnis
Der Hintergrund wird rein weiß und der Text tiefschwarz binarisiert, wodurch die OCR-Erkennungsrate maximiert wird.

Mit Samples testen

pdf, image, video

Verwandte Hubs

FAQ

Bleibt der Text in meinem PDF nach dem Entrauschen durchsuchbar?

Ja, standardmäßig werden echte Textseiten übersprungen, sodass Vektortexte und deren Durchsuchbarkeit vollständig erhalten bleiben.

Was bewirkt die Option „Textseiten rastern“?

Sie erzwingt das Entrauschen von Seiten, die zwar eine unsichtbare OCR-Textebene haben, deren Hintergrundbild jedoch stark verrauscht ist.

Welcher Modus eignet sich am besten für verblasste Scans?

Der Modus „Binarisieren“ (Otsu-Schwellenwert) eignet sich ideal, da er graue Hintergründe rein weiß und Textzeichen tiefschwarz färbt.

Werden meine Dokumente auf einen Server hochgeladen?

Nein, die Verarbeitung erfolgt über eine reine JavaScript-Pipeline direkt in Ihrem Browser, ohne dass Ihre Daten extern gespeichert werden.

Wie wirkt sich die Einstellung „Stärke“ aus?

Sie bestimmt die Anzahl der Durchläufe des 3x3-Medianfilters (1 bis 3). Mehr Durchläufe entfernen mehr Rauschen, können das Bild aber leicht weichzeichnen.

API-Dokumentation

Request-Endpunkt

POST /de/api/tools/pdf-denoise

Request-Parameter

Parameter-Name Typ Erforderlich Beschreibung
sourceFile file (Upload erforderlich) Ja -
mode select Ja Auto: ausgewogenes Median + Fleckentfernung (erhält den Ton). Median: am besten für Salz-und-Pfeffer-/Impulsrauschen. Binarisieren: Der Otsu-Schwellenwert macht blasse Hintergründe weiß und den Text massiv schwarz.
strength number Nein Anzahl der 3x3-Medianfilter-Durchläufe (1–3). Höher = stärkere Rauschentfernung, aber mehr Weichzeichnung. Im Modus Binarisieren ignoriert.
rasterizeText select Nein Standardmäßig bleiben Textseiten als durchsuchbarer Vektorinhalt erhalten (nicht entrauscht). Aktivieren Sie dies nur für OCR-Scans, deren zugrundeliegendes Bild verrauscht ist, unter Verlust der Textauswahl.
pageRange text Nein Seiten zum Entrauschen angeben (z. B. 1-3,5,7-9). Leer lassen für alle.

Dateitypparameter müssen erst über POST /upload/pdf-denoise hochgeladen werden, um filePath zu erhalten, dann filePath an das entsprechende Dateifeld übergeben.

Antwortformat

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Datei: Datei

MCP-Dokumentation

Fügen Sie dieses Tool zu Ihrer MCP-Server-Konfiguration hinzu:

{
  "mcpServers": {
    "elysiatools-pdf-denoise": {
      "name": "pdf-denoise",
      "description": "Entfernt visuelles Rauschen aus eingescannten PDF-Seiten — Salz-und-Pfeffer-Flecken, zufälliges Korn und schwache Hintergrundschleier — mit echten Bildverarbeitungsalgorithmen. Textseiten bleiben als durchsuchbarer Vektorinhalt erhalten.",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-denoise",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Sie können mehrere Tools verketten, z.B.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, maximal 20 Tools.

Unterstützt URL-Dateilinks oder Base64-Codierung für Dateiparameter.

Wenn Sie auf Probleme stoßen, kontaktieren Sie uns bitte bei [email protected]