O que é o modo 'heading-aware'?

É uma fragmentação que agrupa o conteúdo respeitando a hierarquia de títulos para manter o contexto semântico de cada seção.

A ferramenta processa tabelas do PDF?

Sim, se a opção 'Incluir tabelas' estiver ativa, as tabelas são extraídas como nós estruturados dentro dos chunks gerados.

O que são as bounding boxes incluídas no JSON?

São as coordenadas geográficas que indicam a posição exata do texto na página do PDF original, permitindo o realce visual da fonte.

Posso limitar o tamanho dos blocos de texto?

Sim, você pode configurar o número máximo de caracteres por chunk, com um intervalo permitido entre 200 e 4000 caracteres.

A ferramenta remove dados sensíveis?

Existe uma opção de sanitização que, quando ativada, ajuda a ocultar informações sensíveis identificadas durante o processamento do documento.

Elysia Tools

Navegação

AI Tools

Gerador de chunks RAG e citation pack para PDF

Converte um PDF em chunks RAG com pagina, bounding box e metadados de citacao

Detalhes

O que esta ferramenta ajuda você a fazer

Envie um PDF e a ferramenta executa o OpenDataLoader para gerar JSON estruturado. Em seguida, paragrafos, listas, tabelas e titulos sao agrupados em chunks para RAG com pagina, bounding box e contexto de secao.

Execução

Executar esta ferramenta

Preencha o formulário, execute a ferramenta e veja o resultado no mesmo lugar.

Execuções de exemplo preparadas

Clique em um exemplo para preencher o formulário automaticamente. Arquivos ainda precisam ser enviados.

1 exemplos

Preparar um relatorio financeiro para RAG

O teste real gerou 2 chunks e 57 nos semanticos para citacoes precisas.

{
  "type": "file",
  "filePath": "/public/samples/json/pdf-rag-chunker-citation-pack-example1.json"
}

Entradas

Preencha os campos necessários e execute a ferramenta.

6 opções

ArquivosEnvie os arquivos de origem para este fluxo.1

Arquivo PDFfileObrigatório

Tipos aceitos: application/pdf

ConfiguraçõesAjuste formatos, intervalos, números e modos.2

Modo de fragmentacaoselectOpcionalCaracteres maximos por bloconumberOpcional

AlternânciasAtive ou desative comportamentos opcionais.3

Usar arvore estruturalcheckboxOpcionalAtivo quando marcadoSanitizar dados sensiveischeckboxOpcionalAtivo quando marcadoIncluir tabelascheckboxOpcionalAtivo quando marcado

Resultado

Pronto para executar

Depois de executar, arquivos, texto, dados estruturados ou saída em streaming aparecerão aqui.

Exemplos

Exemplos compatíveis com esta ferramenta

Relacionado

Gerador de chunks RAG e citation pack para PDF

O que esta ferramenta ajuda você a fazer

Executar esta ferramenta

Execuções de exemplo preparadas

Entradas

Resultado

Exemplos compatíveis com esta ferramenta

Continue com ferramentas e temas relacionados

Execuções de exemplo preparadas

Entradas

Resultado

Veja quando usar esta ferramenta, o que ela suporta e como os usuários a aplicam.

Fatos principais

Visão geral

Quando usar

Como funciona

Casos de uso

Exemplos

1. Preparação de Relatório Financeiro para RAG

2. Extração de Cláusulas com Localização Visual

Perguntas frequentes

Exemplos PDF

Exemplos de Apresentacoes Markdown

Amostras ICS do Agendador por Fuso Horario

Amostras de legendas ASS

PDF para texto limpo para LLM

Pacote de Temas Markdown para PDF

Conversão PDF/A

PDF para Excel

Ferramentas de OCR documental e extracao estruturada

Ferramentas de Preparacao de PDF para LLM e RAG

Ferramentas de chunking RAG, limpeza de corpus e preparo para retrieval

Ferramentas de conversao PDF e exportacao documental