Categorias

Exportador XLSX Parquet

Exporta planilhas para Parquet/NDJSON em pipelines

Infere tipos automaticamente e exporta Parquet, NDJSON ou ambos.

Exemplos de resultados

1 Exemplos

Exportar Parquet e NDJSON

Gera ambos formatos para pipelines

xlsx-parquet-exporter-example1.zip Ver arquivo
Ver parâmetros de entrada
{ "excelFile": "/public/samples/xlsx/workbook-sales.xlsx", "outputMode": "both" }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet, application/vnd.ms-excel

Fatos principais

Categoria
Format Conversion
Tipos de entrada
file, text, number, select, checkbox
Tipo de saída
file
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Exportador XLSX Parquet é uma ferramenta eficiente para converter planilhas Excel em formatos de dados estruturados como Parquet e NDJSON, facilitando a integração direta com pipelines de dados e data warehouses.

Quando usar

  • Preparar dados de planilhas para ingestão em sistemas de Big Data.
  • Converter arquivos legados em formatos otimizados para consultas analíticas.
  • Automatizar a transformação de dados tabulares em fluxos de trabalho de ETL.

Como funciona

  • Carregue seu arquivo Excel e especifique a aba desejada.
  • Defina a linha de cabeçalho para garantir o mapeamento correto dos campos.
  • Escolha o modo de saída entre Parquet, NDJSON ou ambos em um pacote ZIP.
  • O sistema infere automaticamente os tipos de dados e aplica a sanitização de nomes de campos.

Casos de uso

Migração de dados de relatórios financeiros para data lakes.
Processamento de logs de vendas em formato tabular para análise em tempo real.
Padronização de esquemas de dados para ingestão em bancos de dados NoSQL.

Exemplos

1. Conversão de Vendas para Pipeline

Engenheiro de Dados
Contexto
Uma equipe de vendas envia relatórios semanais em Excel que precisam ser carregados em um data warehouse.
Problema
O formato Excel não é otimizado para consultas rápidas em sistemas de Big Data.
Como usar
Upload do arquivo 'vendas_semanais.xlsx', selecionando o modo 'Parquet + NDJSON'.
Configuração de exemplo
outputMode: 'both', useSanitizedFieldNames: true, nullForEmpty: true
Resultado
Geração de um arquivo ZIP contendo os dados estruturados, prontos para serem carregados no pipeline de dados.

Testar com amostras

json, xml, xlsx

Hubs relacionados

FAQ

Quais formatos de saída são suportados?

Você pode exportar para Parquet, NDJSON ou ambos simultaneamente em um arquivo ZIP.

Como a ferramenta lida com células vazias?

A ferramenta possui uma opção para converter células vazias automaticamente em valores nulos, mantendo a integridade do esquema.

É possível definir qual linha contém os cabeçalhos?

Sim, você pode especificar o número da linha que contém os nomes das colunas através da configuração 'Cabecalho Linha'.

A ferramenta altera os nomes das colunas?

Sim, ao ativar a opção de sanitização, os nomes das colunas são ajustados para garantir compatibilidade com sistemas de banco de dados.

Existe limite de tamanho para o arquivo Excel?

O limite máximo para upload de arquivos é de 100 MB.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/xlsx-parquet-exporter

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
excelFile file (Upload necessário) Sim -
sheetName text Não -
headerRow number Não -
outputMode select Não -
useSanitizedFieldNames checkbox Não -
nullForEmpty checkbox Não -

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/xlsx-parquet-exporter para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Arquivo: Arquivo

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-xlsx-parquet-exporter": {
      "name": "xlsx-parquet-exporter",
      "description": "Exporta planilhas para Parquet/NDJSON em pipelines",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=xlsx-parquet-exporter",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]