PDF-Strikethrough-Review-Extraktor

Erkennt durchgestrichenen Text in Review-PDFs und erstellt Berichte fuer Vertrage und Revisionen

Nach dem Upload eines PDFs aktiviert das Tool die Strikethrough-Erkennung von OpenDataLoader und extrahiert geloeschten oder markierten Text aus JSON- und Markdown-Ausgaben, um Aenderungen schnell zu pruefen.

Beispielergebnisse

1 Beispiele

Gestrichene Klauseln aus einem Review-PDF extrahieren

Das reale Sample listet gestrichene Kandidaten fuer eine schnelle Pruefung.

pdf-strikethrough-review-extractor-example1.html Datei anzeigen
Eingabeparameter anzeigen
{ "pdfFile": "/public/samples/pdf/pdf-strikethrough-review-extractor-source-example1.pdf", "pages": "", "useStructTree": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Wichtige Fakten

Kategorie
Entwicklung & Web
Eingabetypen
file, text, checkbox
Ausgabetyp
html
Sample-Abdeckung
4
API verfügbar
Yes

Überblick

Der PDF-Strikethrough-Review-Extraktor erkennt automatisch durchgestrichenen Text in PDF-Dokumenten und erstellt übersichtliche Berichte für die Analyse von Vertragsänderungen, Richtlinien und Revisionen. Durch die Nutzung der OpenDataLoader-Technologie werden gelöschte oder markierte Textpassagen präzise extrahiert und in einem strukturierten HTML-Format aufbereitet, um manuelle Prüfaufwände zu minimieren.

Wann verwenden

  • Bei der Prüfung von Vertragsentwürfen, um gelöschte Klauseln ohne manuelles Suchen zu identifizieren.
  • Zur Qualitätssicherung in redaktionellen Prozessen, wenn Korrekturen direkt im PDF markiert wurden.
  • Für Compliance-Audits, um Änderungen in offiziellen Richtlinien und Revisionsdokumenten nachzuvollziehen.

So funktioniert es

  • Laden Sie die PDF-Datei hoch und geben Sie bei Bedarf spezifische Seitenbereiche wie '1, 3-5' an.
  • Aktivieren Sie die Option 'Strukturbaum verwenden', um die hierarchische Einordnung der Textelemente zu optimieren.
  • Das Tool nutzt die Strikethrough-Erkennung von OpenDataLoader, um visuell durchgestrichene Inhalte im Dokument zu lokalisieren.
  • Die extrahierten Textstellen werden in einem HTML-Bericht zusammengefasst, der die gelöschten Inhalte übersichtlich auflistet.

Anwendungsfälle

Identifizierung entfernter Rechtsklauseln in überarbeiteten Vertragswerken.
Extraktion von Korrekturanweisungen aus lektorierten Manuskripten und Dokumenten.
Dokumentation von Streichungen in behördlichen Revisionsberichten für die Archivierung.

Beispiele

1. Vertragsrevision prüfen

Rechtsanwalt
Hintergrund
Ein Mandant hat einen Vertragsentwurf zurückgesendet, in dem mehrere Absätze durchgestrichen wurden.
Problem
Die manuelle Suche nach allen Streichungen in einem 50-seitigen Dokument ist zeitaufwendig und fehleranfällig.
Verwendung
Laden Sie den Vertrag hoch und lassen Sie das Feld 'Seiten' leer, um das gesamte Dokument zu scannen.
Ergebnis
Ein HTML-Bericht, der alle gestrichenen Sätze und Klauseln chronologisch auflistet.

2. Redaktionelle Korrektur extrahieren

Lektor
Hintergrund
Ein Autor hat Korrekturen in einem PDF-Manuskript vorgenommen, indem er veraltete Passagen durchgestrichen hat.
Problem
Der Lektor muss eine Liste aller gelöschten Texte für die Setzerei erstellen.
Verwendung
PDF hochladen, 'Strukturbaum verwenden' aktivieren und die Analyse starten.
Ergebnis
Eine strukturierte Liste der gelöschten Textpassagen, die direkt in das Redaktionssystem übernommen werden kann.

Mit Samples testen

pdf, text, file

Verwandte Hubs

FAQ

Welche Dateiformate werden unterstützt?

Das Tool ist speziell für PDF-Dateien optimiert und unterstützt ausschließlich dieses Format.

Kann ich die Analyse auf bestimmte Seiten einschränken?

Ja, über das Feld 'Seiten' können Sie einzelne Seiten oder Bereiche wie '2, 4-6' definieren.

Was bewirkt die Option 'Strukturbaum verwenden'?

Diese Option nutzt die internen Metadaten des PDFs, um die logische Reihenfolge und Struktur der extrahierten Texte präziser abzubilden.

Erkennt das Tool auch farbige Hervorhebungen?

Nein, dieses Tool ist spezifisch auf die Erkennung von durchgestrichenem Text (Strikethrough) ausgerichtet.

In welchem Format wird der Bericht ausgegeben?

Das Ergebnis wird als HTML-Datei bereitgestellt, die im Browser angezeigt und einfach kopiert werden kann.

API-Dokumentation

Request-Endpunkt

POST /de/api/tools/pdf-strikethrough-review-extractor

Request-Parameter

Parameter-Name Typ Erforderlich Beschreibung
pdfFile file (Upload erforderlich) Ja -
pages text Nein -
useStructTree checkbox Nein -

Dateitypparameter müssen erst über POST /upload/pdf-strikethrough-review-extractor hochgeladen werden, um filePath zu erhalten, dann filePath an das entsprechende Dateifeld übergeben.

Antwortformat

{
  "result": "
Processed HTML content
", "error": "Error message (optional)", "message": "Notification message (optional)", "metadata": { "key": "value" } }
HTML: HTML

MCP-Dokumentation

Fügen Sie dieses Tool zu Ihrer MCP-Server-Konfiguration hinzu:

{
  "mcpServers": {
    "elysiatools-pdf-strikethrough-review-extractor": {
      "name": "pdf-strikethrough-review-extractor",
      "description": "Erkennt durchgestrichenen Text in Review-PDFs und erstellt Berichte fuer Vertrage und Revisionen",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-strikethrough-review-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Sie können mehrere Tools verketten, z.B.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, maximal 20 Tools.

Unterstützt URL-Dateilinks oder Base64-Codierung für Dateiparameter.

Wenn Sie auf Probleme stoßen, kontaktieren Sie uns bitte bei [email protected]