Fatos principais
- Categoria
- Data Processing
- Tipos de entrada
- textarea, checkbox, number
- Tipo de saída
- json
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Rastreador de linhagem de dados JSON é uma ferramenta essencial para engenheiros de dados e desenvolvedores que precisam mapear caminhos de campos, dependências derivadas e o histórico de transformações em estruturas JSON. Ideal para processos de ETL e análise de APIs, ele permite combinar o JSON de origem com regras de derivação personalizadas para gerar um grafo detalhado de linhagem de dados, facilitando a auditoria e a compreensão de mapeamentos complexos.
Quando usar
- •Ao documentar e auditar processos de ETL que transformam dados JSON brutos em formatos de negócios estruturados.
- •Para analisar respostas de APIs complexas e entender a hierarquia e os caminhos exatos (JSONPath) de cada campo.
- •Quando for necessário mapear dependências explícitas entre campos originais e campos derivados, como totais calculados ou strings concatenadas.
Como funciona
- •Insira o seu código JSON original no campo 'JSON de origem'.
- •Opcionalmente, adicione regras no campo 'JSON de regras de linhagem' para definir como novos campos são calculados a partir dos originais (ex: concatenação, cálculos matemáticos).
- •Ajuste as configurações, como a inclusão de nós de contêiner (objetos e arrays) e o limite máximo de campos na saída.
- •A ferramenta processa as entradas e gera um novo JSON contendo um resumo estrutural e o grafo completo de linhagem dos dados.
Casos de uso
Exemplos
1. Rastreamento de campos de uma resposta de API de e-commerce
Engenheiro de Dados- Contexto
- Um engenheiro precisa documentar como o valor total em dólares e o nome completo do cliente são gerados a partir do JSON bruto de um pedido que contém apenas centavos e nomes separados.
- Problema
- Mapear a origem exata dos campos derivados 'totalUsd' e 'customerLabel' para fins de auditoria de um pipeline ETL.
- Como usar
- Insira o JSON do pedido e defina as regras de transformação no segundo campo (divisão por 100 para o total e concatenação para o nome do cliente).
- Configuração de exemplo
-
includeContainerNodes: true, maxFields: 200 - Resultado
- A ferramenta gera um grafo JSON mostrando claramente que 'totalUsd' depende de 'totalCents' e 'customerLabel' depende de 'firstName' e 'lastName'.
2. Mapeamento de estrutura de configuração JSON
Desenvolvedor Backend- Contexto
- O desenvolvedor recebeu um arquivo de configuração JSON extenso e não documentado de um sistema legado.
- Problema
- Extrair todos os caminhos de campos absolutos (JSONPath) para criar uma nova interface de validação de dados.
- Como usar
- Cole o JSON de configuração no campo 'JSON de origem' e deixe as regras de linhagem em branco.
- Configuração de exemplo
-
includeContainerNodes: false - Resultado
- Um JSON limpo listando todos os caminhos de campos diretos, facilitando a criação imediata do esquema de validação.
Testar com amostras
jsonHubs relacionados
FAQ
O que é linhagem de dados JSON?
É o rastreamento do ciclo de vida dos dados dentro de um documento JSON, mostrando a origem de um campo, como ele foi transformado e suas dependências.
Como funcionam as regras de derivação?
Você fornece um JSON especificando o campo de destino, os campos de origem e as transformações aplicadas (como 'divide_by_100' ou 'concat') para mapear a dependência lógica entre eles.
Posso usar a ferramenta sem definir regras de linhagem?
Sim. Se você fornecer apenas o JSON de origem, a ferramenta mapeará todos os caminhos de campos e a estrutura hierárquica básica do documento.
O que a opção 'Incluir nós de objeto e array' faz?
Quando ativada, o grafo de saída incluirá não apenas os valores finais (nós folha), mas também os contêineres estruturais que os agrupam, oferecendo uma visão completa da árvore JSON.
Existe um limite de tamanho para o processamento do JSON?
Você pode configurar o limite máximo de campos na saída (entre 10 e 2000) para evitar a geração de grafos excessivamente grandes e difíceis de analisar.