Quels types de métadonnées sont inclus dans les chunks ?

Chaque bloc généré inclut le texte, le numéro de page, les coordonnées spatiales (bounding box) et le chemin hiérarchique des titres.

Puis-je conserver les tableaux lors du découpage ?

Oui, l'option 'Inclure les tableaux' permet d'extraire et d'intégrer les données tabulaires dans les blocs générés.

Quelle est la différence entre les modes de découpage ?

Le mode 'Regrouper par titre' rassemble le contenu sous un même en-tête jusqu'à la limite de caractères, tandis que 'Un élément par bloc' isole chaque paragraphe ou liste individuellement.

Est-il possible de masquer les données sensibles ?

Oui, en activant l'option 'Assainir les données sensibles', l'outil tentera de nettoyer les informations confidentielles avant la génération du JSON.

Quel est le format du fichier de sortie ?

L'outil génère un fichier JSON structuré contenant un tableau d'objets, idéal pour l'intégration directe dans des systèmes d'IA.

Elysia Tools

Navigation mobile

AI Tools

Generateur de chunks RAG et citations PDF

Transforme un PDF en chunks RAG avec page, bounding box et metadonnees de citation

Détails

Ce que cet outil vous aide à faire

Chargez un PDF et loutil execute OpenDataLoader pour produire un JSON structure. Les paragraphes, listes, tableaux et titres sont ensuite regroupes en chunks RAG avec page, bounding box et contexte de section.

Exécution

Exécuter cet outil

Remplissez le formulaire, lancez l’outil et consultez le résultat au même endroit.

Exécutions d’exemple préparées

Cliquez sur un exemple pour remplir automatiquement le formulaire. Les fichiers doivent toujours être téléversés.

1 exemples

Preparer un rapport financier pour le RAG

Le test reel a produit 2 chunks et 57 noeuds semantiques pour des citations precises.

{
  "type": "file",
  "filePath": "/public/samples/json/pdf-rag-chunker-citation-pack-example1.json"
}

Entrées

Renseignez les champs nécessaires, puis lancez l’outil.

6 réglages

FichiersImportez les fichiers source du flux.1

Fichier PDFfileRequis

Types pris en charge : application/pdf

RéglagesAjustez formats, plages, nombres et modes.2

Mode de decoupageselectOptionnelCaracteres max par blocnumberOptionnel

OptionsActivez ou désactivez les comportements optionnels.3

Utiliser larbre de structurecheckboxOptionnelActivé si cochéAssainir les donnees sensiblescheckboxOptionnelActivé si cochéInclure les tableauxcheckboxOptionnelActivé si coché

Résultat

Prêt à exécuter

Après exécution, les fichiers, textes, données structurées ou sorties en flux apparaîtront ici.

Exemples

Exemples adaptés à cet outil

Associé

Generateur de chunks RAG et citations PDF

Ce que cet outil vous aide à faire

Exécuter cet outil

Exécutions d’exemple préparées

Entrées

Résultat

Exemples adaptés à cet outil

Continuer avec des outils et dossiers associés

Exécutions d’exemple préparées

Entrées

Résultat

Découvrez quand utiliser cet outil, ce qu'il prend en charge et comment les utilisateurs l'appliquent.

Points clés

Aperçu

Quand l’utiliser

Fonctionnement

Cas d’usage

Exemples

1. Préparer un rapport financier pour le RAG

2. Découpage de contrats juridiques

FAQ

Exemples PDF

Exemples de Slides Markdown

Exemples ICS du Planificateur Multi-Fuseaux

Exemples de sous-titres ASS

PDF vers texte propre pour LLM

Pack Thèmes Markdown vers PDF

Conversion PDF/A

PDF vers Excel

Outils OCR de documents et extraction structuree

Outils de Preparation PDF pour LLM et RAG

Outils de chunking RAG, nettoyage de corpus et préparation à la recherche

Outils de conversion PDF et d export documentaire