Datos clave
- Categoría
- Data Processing
- Tipos de entrada
- textarea, checkbox, number
- Tipo de salida
- json
- Cobertura de muestras
- 4
- API disponible
- Yes
Resumen
El Trazador de linaje de datos JSON es una herramienta diseñada para ingenieros de datos y desarrolladores que necesitan mapear y documentar el origen de sus datos. Permite rastrear las rutas de los campos JSON, identificar dependencias derivadas y registrar el historial de transformaciones para construir un grafo de linaje estructurado. Es ideal para auditar procesos ETL, analizar respuestas de API complejas y comprender el mapeo de campos entre diferentes sistemas.
Cuándo usarlo
- •Al diseñar o auditar procesos ETL para comprender cómo se transforman los datos desde el origen hasta el destino.
- •Al analizar respuestas de API complejas para documentar la estructura jerárquica y las dependencias de los campos.
- •Cuando se necesita depurar errores de mapeo de datos y rastrear el origen exacto de un valor calculado o derivado.
Cómo funciona
- •Pega tu estructura de datos principal en el campo 'JSON fuente'.
- •Si tienes campos calculados, define las transformaciones en el 'JSON de reglas de linaje' especificando los orígenes, el destino y las operaciones.
- •Ajusta las preferencias, como la inclusión de nodos contenedores (objetos y arrays) y el límite máximo de campos a procesar.
- •La herramienta procesa las entradas y genera un nuevo JSON con el grafo de linaje detallado y un resumen de las dependencias.
Casos de uso
Ejemplos
1. Rastrear el linaje de campos de una respuesta API
Ingeniero de Datos- Contexto
- Un ingeniero necesita documentar cómo se calculan los valores finales en un panel de control a partir de la respuesta cruda de una API de ventas.
- Problema
- Identificar de dónde provienen los campos derivados como 'totalUsd' y 'customerLabel' que no existen en el JSON original.
- Cómo usarlo
- Ingresa el JSON de la orden en 'JSON fuente' y define las reglas de conversión de centavos a dólares y concatenación de nombres en 'JSON de reglas de linaje'.
- Configuración de ejemplo
-
includeContainerNodes: true, maxFields: 200 - Resultado
- Se genera un grafo de linaje en formato JSON que vincula explícitamente 'totalCents' con 'totalUsd' y muestra las transformaciones aplicadas.
2. Extracción de rutas base de un JSON de configuración
Desarrollador Backend- Contexto
- Un desarrollador recibe un archivo JSON masivo de configuración y necesita un mapa plano de todas las rutas disponibles para usarlas en su código.
- Problema
- Extraer todas las rutas de los campos sin aplicar reglas de transformación complejas y omitiendo los nodos agrupadores.
- Cómo usarlo
- Pega el JSON de configuración en 'JSON fuente', deja el campo de reglas vacío y desactiva la opción de incluir nodos contenedores.
- Configuración de ejemplo
-
includeContainerNodes: false - Resultado
- Un JSON estructurado que enumera todas las rutas absolutas de los campos finales (hojas), facilitando su referencia directa en el desarrollo.
Probar con muestras
jsonHubs relacionados
Preguntas frecuentes
¿Qué es el linaje de datos en JSON?
Es el proceso de rastrear el ciclo de vida de los datos dentro de una estructura JSON, identificando de dónde provienen los valores originales y cómo han sido transformados hasta su estado actual.
¿Es obligatorio usar el JSON de reglas de linaje?
No, es completamente opcional. Si solo proporcionas el JSON fuente, la herramienta extraerá las rutas base. Las reglas se utilizan para mapear campos derivados o calculados.
¿Qué formato deben tener las reglas de linaje?
Deben ser un objeto JSON que contenga un arreglo llamado 'rules'. Cada regla debe especificar un 'target' (destino), un arreglo de 'sources' (orígenes) y un arreglo de 'transforms' (transformaciones aplicadas).
¿Para qué sirve la opción de incluir nodos contenedores?
Permite que el grafo de linaje incluya no solo los valores finales (hojas), sino también los objetos y arreglos que los agrupan, ofreciendo una vista jerárquica completa de la estructura.
¿Existe un límite en la cantidad de campos que puedo procesar?
Sí, por defecto el límite es de 200 campos para garantizar un procesamiento rápido, pero puedes ajustarlo hasta un máximo de 2000 campos en la configuración de la herramienta.