我先分享下我们小厂是怎么玩的所有服务节点都接了 pinponit ,然后结合 kibana 收集的线上日志+traceid分享几张今天新鲜出炉的 bug 图今天发现根据这个 pp 的日志就很快定位到有查全表的场!
推荐之前看到的一篇文章 [线上故障应急处理:4 年多 on call 经验总结]( https://jt26wzz.com/posts/0007-online-firefighting-real-world-lessions-from-4-years-on-call/),虽然不是什么具体的工具,但感觉思路还是可以的。
我去,怎么多了个空格,[线上故障应急处理:4 年多 on call 经验总结]( https://jt26wzz.com/posts/0007-online-firefighting-real-world-lessions-from-4-years-on-call/)