PDF Entrauschen

Entfernt visuelles Rauschen aus eingescannten PDF-Seiten — Salz-und-Pfeffer-Flecken, zufälliges Korn und schwache Hintergrundschleier — mit echten Bildverarbeitungsalgorithmen. Textseiten bleiben als durchsuchbarer Vektorinhalt erhalten.

Bereinigt verrauschte eingescannte PDF-Seiten mit einer reinen JavaScript-Pipeline (keine externen Binärdateien) und echten Bildverarbeitungskernen.

Inhaltsadaptive Verarbeitung (wichtig):

Bildseiten (gescannte Dokumente): gerastert und entrauscht.
Textseiten (einschließlich Text + Bild): werden unverändert kopiert. Vektor-Text, Schriftarten und Durchsuchbarkeit bleiben vollständig erhalten.
Leere Seiten: werden unverändert kopiert.

Falls Ihr Scan eine OCR-Textebene enthält (als „Text"-seite gelesen), das eigentliche Bild aber verrauscht ist, aktivieren Sie „Textseiten rastern", um die Verarbeitung zu erzwingen.

Entrauschungsmodi (alles echte Algorithmen):

Auto: 3x3-Medianfilter + Entfernung isolierter Flecken. Ausgewogene Bereinigung, die Ton und Kanten erhält — empfohlene Standardeinstellung.
Median: 3x3-Medianfilter pro Kanal (1–3 Durchläufe). Das klassische Mittel gegen Salz-und-Pfeffer-/Impulsrauschen.
Binarisieren: Adaptiver Otsu-Schwellenwert. Macht schwache Hintergründe rein weiß und den Vordergrund massiv schwarz — ideal für die Lesbarkeit gescannten Textes.

Beispielergebnisse

2 Beispiele

Automatisches Entrauschen eines Scans

Ausgewogene Median- + Fleckenentfernung bei verrauschten eingescannten Bildseiten, unter Erhaltung der Vektor-Textseiten

pdf_denoised.pdf Datei anzeigen

Eingabeparameter anzeigen

{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "auto", "strength": 2, "rasterizeText": "false", "pageRange": "" }

Binarisieren eines verblassten Scans für bessere Lesbarkeit

Wendet eine Otsu-Schwellenwert an, um einen blassen, verschleierten Scan in klaren schwarz-weißen Text umzuwandeln

pdf_denoised.pdf Datei anzeigen

Eingabeparameter anzeigen

{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "mode": "binarize", "rasterizeText": "false", "pageRange": "1-3" }

PDF-Datei *

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Entrauschungsmodus *

Auto: ausgewogenes Median + Fleckentfernung (erhält den Ton). Median: am besten für Salz-und-Pfeffer-/Impulsrauschen. Binarisieren: Der Otsu-Schwellenwert macht blasse Hintergründe weiß und den Text massiv schwarz.

Stärke (Median-Durchläufe)

Anzahl der 3x3-Medianfilter-Durchläufe (1–3). Höher = stärkere Rauschentfernung, aber mehr Weichzeichnung. Im Modus Binarisieren ignoriert.

Textseiten rastern

Standardmäßig bleiben Textseiten als durchsuchbarer Vektorinhalt erhalten (nicht entrauscht). Aktivieren Sie dies nur für OCR-Scans, deren zugrundeliegendes Bild verrauscht ist, unter Verlust der Textauswahl.

Seitenbereich

Seiten zum Entrauschen angeben (z. B. 1-3,5,7-9). Leer lassen für alle.

Wichtige Fakten

Kategorie: Dokumente & PDF
Eingabetypen: file, select, number, text
Ausgabetyp: file
Sample-Abdeckung: 4
API verfügbar: Yes

Überblick

Das Online-Tool „PDF Entrauschen“ entfernt störendes visuelles Rauschen wie Salz-und-Pfeffer-Flecken, Bildkörnung und graue Hintergrundschleier aus eingescannten PDF-Dokumenten. Dank einer intelligenten, inhaltsadaptiven Verarbeitung werden reine Bildseiten mithilfe echter Bildverarbeitungsalgorithmen bereinigt, während durchsuchbare Vektortexte und Schriftarten standardmäßig unberührt und vollständig erhalten bleiben.

Wann verwenden

•Wenn eingescannte Dokumente störende Flecken, Bildrauschen oder graue Schleier aufweisen, die die Lesbarkeit beeinträchtigen.
•Wenn Sie die visuelle Qualität von Scans optimieren möchten, ohne die Durchsuchbarkeit von bereits vorhandenem Vektor-Text zu verlieren.
•Vor einer Texterkennung (OCR), um durch Binarisierung den Kontrast zwischen Text und Hintergrund drastisch zu erhöhen.

So funktioniert es

•Sie laden Ihre PDF-Datei hoch und wählen den gewünschten Entrauschungsmodus (Auto, Median oder Binarisieren) sowie optional den Seitenbereich aus.
•Das Tool analysiert jede Seite: Reine Textseiten werden übersprungen, um Vektoren zu schützen, während Bildseiten gerastert werden.
•Auf den Bildseiten entfernen mathematische Filter (wie der 3x3-Medianfilter oder der Otsu-Schwellenwert) Bildrauschen und Flecken direkt im Browser.
•Die bereinigten Seiten werden wieder in ein neues, optimiertes PDF-Dokument zusammengeführt und zum Download bereitgestellt.

Anwendungsfälle

Bereinigen von alten, vergilbten oder schlecht eingescannten Verträgen und Dokumenten für eine bessere digitale Archivierung.

Vorbereitung von Dokumenten-Scans für OCR-Software, um die Erkennungsrate durch scharfe Schwarz-Weiß-Kontraste zu maximieren.

Entfernen von störendem Bildrauschen und Flecken aus digitalisierten Buchseiten oder Skripten vor dem Ausdrucken.

Beispiele

1. Automatische Bereinigung eines verrauschten Scans

Archivar

Hintergrund: Ein Archivmitarbeiter hat historische Dokumente eingescannt, die nun feine Flecken und ein störendes Rauschen aufweisen.
Problem: Die Flecken stören das Gesamtbild und machen das Lesen am Bildschirm anstrengend.
Verwendung: Die PDF-Datei hochladen, den Modus 'Auto (Median + Fleckentfernung)' wählen und die Stärke auf 2 belassen.
Beispielkonfiguration: mode: "auto", strength: 2, rasterizeText: "false"
Ergebnis: Das Rauschen und kleine Flecken werden entfernt, während die Lesbarkeit der Dokumente deutlich verbessert wird.

2. Kontrastoptimierung für OCR-Texterkennung

Student

Hintergrund: Ein Student hat Vorlesungsskripte mit dem Smartphone abfotografiert. Die Seiten haben graue Schatten und ungleichmäßige Belichtung.
Problem: Die OCR-Software kann den Text aufgrund des grauen Hintergrunds und der Schatten nicht fehlerfrei auslesen.
Verwendung: Das PDF hochladen, den Modus auf 'Binarisieren (Otsu)' stellen und die Verarbeitung starten.
Beispielkonfiguration: mode: "binarize", rasterizeText: "false"
Ergebnis: Der Hintergrund wird rein weiß und der Text tiefschwarz binarisiert, wodurch die OCR-Erkennungsrate maximiert wird.

Mit Samples testen

pdf, image, video

PDF-Beispiele

Generierte PDF-Beispiele von Tools zwischen 2026-02-01 und 2026-02-10

title token pdf

pdf

Markdown Foliensatz Beispiele

Remark/Marp Markdown Decks zum Testen des PDF Exports

preferred input family pdf

pdf

SVG Beispiele

Beispiele für skalierbare Vektorgrafiken (SVG), die verschiedene SVG-Funktionen und -Techniken demonstrieren

matched family image,text

image, text

QR-Code-Beispiele

Beispiel-QR-Code-Bilder zum Testen von QR-Code-Lese- und Generierungswerkzeugen

matched family image,text

image, text

FAQ

Bleibt der Text in meinem PDF nach dem Entrauschen durchsuchbar?

Ja, standardmäßig werden echte Textseiten übersprungen, sodass Vektortexte und deren Durchsuchbarkeit vollständig erhalten bleiben.

Was bewirkt die Option „Textseiten rastern“?

Sie erzwingt das Entrauschen von Seiten, die zwar eine unsichtbare OCR-Textebene haben, deren Hintergrundbild jedoch stark verrauscht ist.

Welcher Modus eignet sich am besten für verblasste Scans?

Der Modus „Binarisieren“ (Otsu-Schwellenwert) eignet sich ideal, da er graue Hintergründe rein weiß und Textzeichen tiefschwarz färbt.

Werden meine Dokumente auf einen Server hochgeladen?

Nein, die Verarbeitung erfolgt über eine reine JavaScript-Pipeline direkt in Ihrem Browser, ohne dass Ihre Daten extern gespeichert werden.

Wie wirkt sich die Einstellung „Stärke“ aus?

Sie bestimmt die Anzahl der Durchläufe des 3x3-Medianfilters (1 bis 3). Mehr Durchläufe entfernen mehr Rauschen, können das Bild aber leicht weichzeichnen.

API-Dokumentation

Request-Endpunkt

POST /de/api/tools/pdf-denoise

Request-Parameter

Parameter-Name	Typ	Erforderlich	Beschreibung
sourceFile	file (Upload erforderlich)	Ja	-
mode	select	Ja	Auto: ausgewogenes Median + Fleckentfernung (erhält den Ton). Median: am besten für Salz-und-Pfeffer-/Impulsrauschen. Binarisieren: Der Otsu-Schwellenwert macht blasse Hintergründe weiß und den Text massiv schwarz.
strength	number	Nein	Anzahl der 3x3-Medianfilter-Durchläufe (1–3). Höher = stärkere Rauschentfernung, aber mehr Weichzeichnung. Im Modus Binarisieren ignoriert.
rasterizeText	select	Nein	Standardmäßig bleiben Textseiten als durchsuchbarer Vektorinhalt erhalten (nicht entrauscht). Aktivieren Sie dies nur für OCR-Scans, deren zugrundeliegendes Bild verrauscht ist, unter Verlust der Textauswahl.
pageRange	text	Nein	Seiten zum Entrauschen angeben (z. B. 1-3,5,7-9). Leer lassen für alle.

Dateitypparameter müssen erst über POST /upload/pdf-denoise hochgeladen werden, um filePath zu erhalten, dann filePath an das entsprechende Dateifeld übergeben.

Antwortformat

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}

Datei: Datei

MCP-Dokumentation

Fügen Sie dieses Tool zu Ihrer MCP-Server-Konfiguration hinzu:

{
  "mcpServers": {
    "elysiatools-pdf-denoise": {
      "name": "pdf-denoise",
      "description": "Entfernt visuelles Rauschen aus eingescannten PDF-Seiten — Salz-und-Pfeffer-Flecken, zufälliges Korn und schwache Hintergrundschleier — mit echten Bildverarbeitungsalgorithmen. Textseiten bleiben als durchsuchbarer Vektorinhalt erhalten.",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-denoise",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Sie können mehrere Tools verketten, z.B.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, maximal 20 Tools.

Unterstützt URL-Dateilinks oder Base64-Codierung für Dateiparameter.

Wenn Sie auf Probleme stoßen, kontaktieren Sie uns bitte bei [email protected]