¿Qué formatos de archivo admite esta herramienta?

La herramienta admite exclusivamente archivos PDF.

¿Qué es el modo de fragmentación por encabezados (heading-aware)?

Es un modo que agrupa el contenido bajo su encabezado correspondiente, preservando el contexto jerárquico del documento original.

¿Se incluyen las tablas en los fragmentos generados?

Sí, puedes activar la opción de incluir tablas para que se extraigan y empaqueten junto con el texto.

¿Para qué sirven las coordenadas (bounding boxes) en el JSON?

Permiten a tu aplicación de IA resaltar visualmente la ubicación exacta de la información citada en el PDF original.

¿Puedo limitar el tamaño de los fragmentos?

Sí, puedes establecer un límite máximo de caracteres por bloque (entre 200 y 4000) para adaptarlo a los requisitos de tu modelo de lenguaje.

Elysia Tools

Navegación

AI Tools

Empaquetador RAG y citas para PDF

Convierte un PDF en chunks RAG con pagina, bounding box y metadatos de cita

Detalles

Qué te ayuda a hacer esta herramienta

Sube un PDF y la herramienta ejecuta OpenDataLoader para crear un JSON estructurado. Luego empaqueta parrafos, listas, tablas y encabezados en chunks listos para RAG con pagina, bounding box y contexto de seccion.

Ejecución

Ejecutar esta herramienta

Completa el formulario, ejecuta la herramienta y revisa el resultado en un solo lugar.

Ejecuciones de ejemplo preparadas

Haz clic en un ejemplo para completar el formulario automáticamente. Los archivos aún deben subirse.

1 ejemplos

Preparar un informe financiero para RAG

La prueba real genero 2 chunks y 57 nodos semanticos para citas precisas.

{
  "type": "file",
  "filePath": "/public/samples/json/pdf-rag-chunker-citation-pack-example1.json"
}

Entradas

Completa los campos necesarios y ejecuta la herramienta.

6 opciones

ArchivosSube los archivos fuente para este flujo.1

Archivo PDFfileObligatorio

Tipos admitidos: application/pdf

AjustesAjusta formatos, rangos, números y modos.2

Modo de fragmentacionselectOpcionalCaracteres maximos por bloquenumberOpcional

InterruptoresActiva o desactiva comportamientos opcionales.3

Usar arbol estructuralcheckboxOpcionalActivado si está marcadoSanitizar datos sensiblescheckboxOpcionalActivado si está marcadoIncluir tablascheckboxOpcionalActivado si está marcado

Resultado

Listo para ejecutar

Al ejecutar la herramienta, aquí verás archivos, texto, datos estructurados o salida en streaming.

Ejemplos

Ejemplos que encajan con esta herramienta

Relacionado

Empaquetador RAG y citas para PDF

Qué te ayuda a hacer esta herramienta

Ejecutar esta herramienta

Ejecuciones de ejemplo preparadas

Entradas

Resultado

Ejemplos que encajan con esta herramienta

Continuar con herramientas y temas relacionados

Ejecuciones de ejemplo preparadas

Entradas

Resultado

Conoce cuándo usar esta herramienta, qué admite y cómo la aplican los usuarios.

Datos clave

Resumen

Cuándo usarlo

Cómo funciona

Casos de uso

Ejemplos

1. Preparación de un informe financiero para RAG

2. Procesamiento de manuales técnicos con datos sensibles

Preguntas frecuentes

Muestras PDF

Ejemplos de Presentaciones Markdown

Muestras ICS del Planificador por Zona Horaria

Muestras de subtitulos ASS

PDF a texto limpio para LLM

Paquete de Temas Markdown a PDF

Conversión PDF/A

PDF a Excel

Herramientas de OCR documental y extraccion estructurada

Herramientas de Preparacion de PDF para LLM y RAG

Herramientas de chunking RAG, limpieza de corpus y preparación para retrieval

Herramientas de conversion PDF y exportacion documental