Fatos principais
- Categoria
- Desenvolvimento e Web
- Tipos de entrada
- textarea, select, checkbox
- Tipo de saída
- html
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Decodificador de Trace Distribuído e Waterfall é uma ferramenta essencial para desenvolvedores backend, SREs e DevOps que precisam analisar a latência e o fluxo de requisições em arquiteturas de microsserviços. Ele converte arquivos JSON exportados do Jaeger, Zipkin ou OpenTelemetry em uma visualização interativa de cascata (waterfall), permitindo identificar rapidamente gargalos de desempenho, dependências lentas e falhas em spans específicos.
Quando usar
- •Quando precisar investigar gargalos de latência em chamadas de microsserviços.
- •Para visualizar a hierarquia e a duração de spans exportados de sistemas de telemetria.
- •Ao depurar falhas em requisições complexas, filtrando rapidamente os spans que retornaram erro.
Como funciona
- •Cole o JSON do trace gerado pelo Jaeger, Zipkin ou OpenTelemetry no campo de texto principal.
- •Selecione o formato do trace ou deixe em 'Auto Detect' para que a ferramenta identifique automaticamente.
- •Ajuste a unidade de tempo (microssegundos, milissegundos ou segundos) e marque a opção de exibir apenas erros, se necessário.
- •Visualize o gráfico de waterfall renderizado, detalhando a linha do tempo, a duração de cada serviço e os pontos de falha.
Casos de uso
Exemplos
1. Análise de lentidão no fluxo de checkout
Engenheiro de Backend- Contexto
- O endpoint de checkout está apresentando picos de latência, mas envolve chamadas para o gateway de API, serviço de pagamento e inventário.
- Problema
- Identificar qual microsserviço exato está causando a lentidão na requisição.
- Como usar
- Cole o JSON do Jaeger contendo o trace do checkout, selecione 'Jaeger JSON' e defina a unidade como 'Milliseconds'.
- Configuração de exemplo
-
Formato: Jaeger JSON | Unidade: ms | Mostrar apenas erros: false - Resultado
- O gráfico waterfall revela que o serviço de pagamento consumiu 180ms dos 320ms totais, indicando o gargalo exato.
2. Depuração de falhas em requisições distribuídas
Engenheiro de Confiabilidade (SRE)- Contexto
- Um alerta de erro 500 foi disparado em um serviço de busca que consulta múltiplos bancos de dados em paralelo.
- Problema
- Encontrar rapidamente qual das consultas paralelas falhou em um trace com mais de 50 spans.
- Como usar
- Insira o JSON do OpenTelemetry, ative a opção 'Mostrar apenas spans com erro' e gere a visualização.
- Configuração de exemplo
-
Formato: OpenTelemetry JSON | Mostrar apenas erros: true - Resultado
- A interface oculta todos os spans de sucesso e exibe apenas a chamada ao banco de dados de catálogo que retornou timeout, facilitando a resolução.
Testar com amostras
jsonHubs relacionados
FAQ
Quais formatos de trace são suportados?
A ferramenta suporta arquivos JSON exportados nativamente do Jaeger, Zipkin e OpenTelemetry.
Posso visualizar o tempo em segundos em vez de milissegundos?
Sim, você pode alterar a unidade de exibição para microssegundos, milissegundos ou segundos nas configurações.
Como encontro os erros mais rapidamente em um trace muito grande?
Basta marcar a opção 'Mostrar apenas spans com erro' para ocultar os spans bem-sucedidos e focar exclusivamente nas falhas.
A ferramenta envia meus dados de trace para algum servidor?
Não, todo o processamento e a renderização do gráfico waterfall ocorrem localmente no seu navegador.
O que é um gráfico waterfall de trace?
É uma representação visual em cascata que mostra a ordem cronológica, a duração e a relação pai-filho de cada operação (span) em uma requisição distribuída.