可观测性、日志分析与 Trace 排障工具
在一个专题里完成日志解析、Trace 检查、API 载荷漂移对比,以及把原始观测数据整理成时间线、时序图和结构化排障证据。
这个专题聚焦在事故响应和系统排障时常常连在一起的可观测性工作:解析访问日志、识别结构化字段、提取 IP 和重复模式、解码分布式 Trace、把服务交互转换成时序图、比较不同环境里的 API 响应漂移、追踪 JSON 字段流向,以及在需要复现问题时回放 webhook 或请求载荷。
专题信息
- 任务类型
- utility
- Families
- observability, logs, tracing
- 工具数
- 13
- 子簇
- 3
为什么会有这个专题
线上故障排查通常要在日志、trace、请求捕获和 payload 差异之间来回切换。把这些工具放在一起,更容易从原始证据一路走到可读的结论,而不是每次都临时拼流程。
可观测性工作并不只是看日志。很多团队还需要解析杂乱文本、检查结构化 JSONL、追踪跨服务时序、比较环境漂移,并回放进入系统的 webhook,才能真正解释故障发生在哪里。
这里附带的 Nginx、服务器日志、分布式追踪、OpenTelemetry、Datadog、Splunk、ELK、Sentry 和 LogRocket 样例,可以先在安全样本上演练排障流程,再迁移到真实事故。
精选工具
日志解析器 - Apache/Nginx访问日志解析
使用正则表达式解析Apache/Nginx访问日志并提取结构化数据
结构化日志解析器
自动识别常见日志格式,提取核心字段并推断字段类型,支持导出为 JSON、CSV 或 SQL。
分布式追踪解码与瀑布图可视化
解析 Jaeger、Zipkin 或 OpenTelemetry 的 trace JSON,并以瀑布图展示 span 时序与异常节点
日志转时序图转换器
把结构化服务日志转换成 Mermaid 或 PlantUML 时序图,并可叠加延迟和错误标注
Webhook 调试与中继工具
生成唯一的 Webhook 接收地址,查看请求详情、校验签名,并把捕获的请求回放到目标端点
API 响应差异与语义分析器
对比两个 API 响应 JSON,标出字段级差异,并区分真正的功能变更与无害的运行时漂移
JSON 数据血缘追踪器
追踪 JSON 字段路径、派生依赖关系和变换历史,生成字段级血缘图
JSON 路径可视化器
将 JSON 或 JSONL 以可展开树形结构展示,并为每个节点生成可复制的 JSONPath 表达式
JSONata 查询转换工作室
预览 JSONata 风格查询与转换,支持多数据对比,并导出 JSON、CSV、YAML 或 Markdown。
多规则批量匹配
一次性对文本执行多个正则表达式模式匹配
命名分组测试器
解析并显示正则表达式中的命名捕获组
文本模式统计
统计和分析文本中的模式频率(数字、邮箱、URL等)
IP地址提取器
从日志文件、服务器日志、网络跟踪或任何文本内容中提取IPv4和IPv6地址
用 Samples 测试
observability, logs, tracingNginx 日志解析示例
用于测试 log-parser 工具的综合 Nginx 日志样本,包括访问日志和错误日志的各种格式和场景
6 样例
服务器日志示例
包含IP地址的服务器日志文件,用于测试提取
6 样例
分布式追踪示例
使用 Jaeger、OpenTelemetry 和其他现代可观测性工具的综合分布式追踪示例,适用于微服务架构
6 样例
OpenTelemetry 示例
OpenTelemetry 可观测性标准示例,包括多种语言和框架的追踪、指标和日志
2 样例
Datadog 监控示例
全面的 Datadog 监控和可观测性配置示例,包括 APM、日志、指标和仪表板
4 样例
Splunk 日志分析示例
全面的 Splunk 配置和查询示例,用于日志分析、监控和运营智能
4 样例
Elastic Stack (ELK) 示例
全面的 Elastic Stack 配置,包括 Elasticsearch、Logstash、Kibana 和 Beats 的日志管理和分析设置
4 样例
ELK Stack 日志分析示例
全面的 ELK Stack(Elasticsearch、Logstash、Kibana)示例,用于分布式系统中的日志聚合、处理和可视化
5 样例
Sentry 错误追踪示例
全面的 Sentry 错误追踪和性能监控设置,包含各种平台的 SDK 集成
4 样例
LogRocket 前端监控
Logrocket 示例,包括会话回放、错误跟踪、性能监控和用户行为分析
4 样例
相关专题
常见问题
这个专题能做什么?
你可以解析日志、检查结构化事件、分析 trace、可视化服务交互、比较不同环境中的 payload 漂移,并在排障时回放 webhook 流量。
这个专题适合谁?
适合后端开发者、SRE、平台团队、支持工程师、QA,以及所有需要调查线上故障或不稳定集成的人。
应该从哪里开始?
先从最接近你手头证据的样例开始:访问日志就看 Nginx 或 server logs,延迟与链路问题就看 distributed tracing 或 OpenTelemetry,若要映射回监控平台,则看 Datadog、Splunk、ELK、Sentry 或 LogRocket。