Fatos principais
- Categoria
- Format Conversion
- Tipos de entrada
- file, text, number, select, checkbox
- Tipo de saída
- file
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Exportador XLSX Parquet é uma ferramenta eficiente para converter planilhas Excel em formatos de dados estruturados como Parquet e NDJSON, facilitando a integração direta com pipelines de dados e data warehouses.
Quando usar
- •Preparar dados de planilhas para ingestão em sistemas de Big Data.
- •Converter arquivos legados em formatos otimizados para consultas analíticas.
- •Automatizar a transformação de dados tabulares em fluxos de trabalho de ETL.
Como funciona
- •Carregue seu arquivo Excel e especifique a aba desejada.
- •Defina a linha de cabeçalho para garantir o mapeamento correto dos campos.
- •Escolha o modo de saída entre Parquet, NDJSON ou ambos em um pacote ZIP.
- •O sistema infere automaticamente os tipos de dados e aplica a sanitização de nomes de campos.
Casos de uso
Exemplos
1. Conversão de Vendas para Pipeline
Engenheiro de Dados- Contexto
- Uma equipe de vendas envia relatórios semanais em Excel que precisam ser carregados em um data warehouse.
- Problema
- O formato Excel não é otimizado para consultas rápidas em sistemas de Big Data.
- Como usar
- Upload do arquivo 'vendas_semanais.xlsx', selecionando o modo 'Parquet + NDJSON'.
- Configuração de exemplo
-
outputMode: 'both', useSanitizedFieldNames: true, nullForEmpty: true - Resultado
- Geração de um arquivo ZIP contendo os dados estruturados, prontos para serem carregados no pipeline de dados.
Testar com amostras
json, xml, xlsxHubs relacionados
FAQ
Quais formatos de saída são suportados?
Você pode exportar para Parquet, NDJSON ou ambos simultaneamente em um arquivo ZIP.
Como a ferramenta lida com células vazias?
A ferramenta possui uma opção para converter células vazias automaticamente em valores nulos, mantendo a integridade do esquema.
É possível definir qual linha contém os cabeçalhos?
Sim, você pode especificar o número da linha que contém os nomes das colunas através da configuração 'Cabecalho Linha'.
A ferramenta altera os nomes das colunas?
Sim, ao ativar a opção de sanitização, os nomes das colunas são ajustados para garantir compatibilidade com sistemas de banco de dados.
Existe limite de tamanho para o arquivo Excel?
O limite máximo para upload de arquivos é de 100 MB.