Welche Chunk-Modi stehen zur Verfügung?

Sie können zwischen 'Nach Überschriften gruppieren' (heading-aware) und 'Ein Element pro Chunk' wählen, je nachdem, wie viel Kontext Ihre Vektordatenbank für optimale Suchergebnisse benötigt.

Werden Tabellen im PDF unterstützt?

Ja, Sie können die Option 'Tabellen einbeziehen' aktivieren, um tabellarische Daten als strukturierte Elemente in die generierten Chunks aufzunehmen.

Was sind Bounding Boxes und wofür werden sie genutzt?

Bounding Boxes sind Koordinaten, die genau angeben, wo sich ein Textabschnitt auf der Original-PDF-Seite befindet. Dies ist ideal für Frontend-Anwendungen, die KI-Zitate im Originaldokument visuell hervorheben möchten.

Kann ich sensible Daten im PDF maskieren?

Ja, das Tool bietet eine Checkbox 'Sensible Daten maskieren', mit der vertrauliche Informationen unkenntlich gemacht werden können, bevor die Chunks für das RAG-System generiert werden.

In welchem Format wird das Ergebnis bereitgestellt?

Das Ergebnis ist eine strukturierte JSON-Datei. Dieses Format lässt sich direkt in gängige RAG-Pipelines, LLM-Frameworks und Vektordatenbanken importieren.

Elysia Tools

Mobile Navigation

AI Tools

PDF-RAG-Chunker mit Citation Pack

Wandelt ein PDF in RAG-Chunks mit Seitenzahl, Bounding Box und Zitiermetadaten um

Einzelheiten

Wobei dieses Tool hilft

Laden Sie ein PDF hoch. Das Tool fuehrt OpenDataLoader aus und erzeugt strukturiertes JSON. Anschliessend werden Absaetze, Listen, Tabellen und Ueberschriften zu RAG-Chunks mit Seitenzahl, Bounding Box und Abschnittskontext zusammengefasst.

Ausführung

Dieses Tool ausführen

Fülle das Formular aus, starte das Tool und prüfe das Ergebnis an einem Ort.

Vorbereitete Beispielausführungen

Klicken Sie auf ein Beispiel, um das Formular automatisch auszufüllen. Dateien müssen weiterhin hochgeladen werden.

1 Beispiele

Finanzbericht fuer RAG vorbereiten

Der reale Test erzeugte 2 Chunks und 57 semantische Knoten fuer praezise Zitate.

{
  "type": "file",
  "filePath": "/public/samples/json/pdf-rag-chunker-citation-pack-example1.json"
}

Eingaben

Fülle die erforderlichen Felder aus und starte das Tool.

6 Optionen

DateienQuelldateien für diesen Workflow hochladen.1

PDF-DateifilePflicht

Unterstützte Typen: application/pdf

EinstellungenFormate, Bereiche, Zahlen und Modi anpassen.2

Chunk-ModusselectOptionales FeldMaximale Zeichen pro ChunknumberOptionales Feld

SchalterOptionales Verhalten aktivieren oder deaktivieren.3

Strukturbaum verwendencheckboxOptionales FeldAktiviert, wenn ausgewähltSensible Daten maskierencheckboxOptionales FeldAktiviert, wenn ausgewähltTabellen einbeziehencheckboxOptionales FeldAktiviert, wenn ausgewählt

Ergebnis

Bereit zum Start

Nach dem Ausführen erscheinen hier Dateien, Text, strukturierte Daten oder Stream-Ausgaben.

Beispiele

Beispiele zu diesem Tool

Verwandt

PDF-RAG-Chunker mit Citation Pack

Wobei dieses Tool hilft

Dieses Tool ausführen

Vorbereitete Beispielausführungen

Eingaben

Ergebnis

Beispiele zu diesem Tool

Mit verwandten Tools und Themen fortfahren

Vorbereitete Beispielausführungen

Eingaben

Ergebnis

Erfahren Sie, wann dieses Tool passt, was es unterstützt und wie Nutzer es anwenden.

Wichtige Fakten

Überblick

Wann verwenden

So funktioniert es

Anwendungsfälle

Beispiele

1. Finanzbericht für RAG vorbereiten

2. Mitarbeiterhandbuch mit Datenmaskierung verarbeiten

FAQ

PDF-Beispiele

Markdown Foliensatz Beispiele

ICS-Beispiele fuer den Zeitzonen-Workflow-Planer

ASS-Untertitel-Beispiele

PDF zu sauberem Text fuer LLM

Markdown-zu-PDF-Theme-Paket

PDF/A-Konvertierung

PDF zu Excel

Dokumenten-OCR und strukturierte Extraktion

PDF-zu-LLM-und-RAG-Vorbereitungstools

Tools für RAG-Chunking, Korpusbereinigung und Retrieval-Vorbereitung

Tools fur PDF-Konvertierung und Dokumentexport