基于业务链可观测性的根因定位实践

分论坛:效能创新

专题:运维效能


内容简介:

本主题演讲,涉及了一系列的故障监控和定位的落地方案。
首先,讨论了现有监控系统在故障发现上的现状和存在的问题,以及一些典型的故障案例。其中一大问题是告警系统的缺失,需要提高故障发现的效率并补全告警。 本主题演讲,提出了一个整体的落地方案,包括提出了一个新的逻辑架构,其目的是将各个运维指标、日志、链路串联起来,从而改善目前孤立的运维现状。这是基于业务链进行横向告警根因定位的重要原因。在这个云原生时代,运维面临的问题也随之变化,这就需要进行新的需求分析。 为了解决上述这些问题,本主题演讲详细介绍了构建新系统的步骤,例如,补全监控的关键指标,使用插码工具进行业务链路监控,验证故障定位的准确性等。同时,为了提高效率,后端采用了国产化架构产品"观察易"。 在监控方案实现后,内容展示了一系列实际效果,例如,展示横向端到端的监控,提供告警根因列表以实现故障定位等。这些效果是通过横向和纵向的告警根因定位实现的。 最后,通过调用链故障定位的实例,深入阐述了用户的收益、背景、痛点、实现思路以及落地场景,从而进一步证明了这个新方案的有效性和实用性。

演讲提纲:

1. 现状解析:云原生时代,现有监控系统存在的故障定位难点 2. 方案创新:构建新监控系统思路及步骤拆解 3. 案例展现:以调用链故障定位的实例,展现方案价值

听众收益:

1. 故障定位效率的提升 2. 故障发现能力的增强 3. 数据资产的积累 4. 运维自动化的推进 5. 分层监控能力的增强

联系我们
购票热线:4006-998-758
媒体合作:一竹
联系电话:18515447737 邮箱:sunyz@keylinking.com
赞助合作:Jessie 联系电话:13718715182 邮箱:lizj@keylinking.com
票务合作:Anny
联系电话:17778017751 邮箱:zhangp@keylinking.com
关注主办方