Google Dapper：大规模分布式系统的链路追踪解析

需积分: 2 5 浏览量更新于2024-07-14 收藏 4.07MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"微服务架构之链路追踪GoogleDapper论文概述了在大规模分布式集群中，理解和分析系统行为、性能问题的工具——Dapper的重要性。Dapper是一个低损耗、应用透明的分布式跟踪系统，旨在帮助开发者和运维团队解决复杂微服务架构中的监控难题。" 在微服务架构中，系统通常由大量不同团队开发、使用不同编程语言实现的软件模块组成，分布在全球多个数据中心的数千台服务器上。在这种背景下，定位和解决性能问题变得极其复杂。Google的Dapper系统就是为了解决这一问题而诞生的。它借鉴了Magpie和X-Trace的设计，并通过引入采样率和最小化代码植入来优化，使得Dapper能够在生产环境中高效运行。 Dapper的核心功能是提供链路追踪，即记录并跟踪请求在整个分布式系统中的传播路径。例如，在一个复杂的搜索场景中，前端服务可能会向众多查询服务器发起请求，涉及广告处理、拼写检查、特殊结果检索等多个子系统。Dapper能够追踪这些交互，帮助理解各个服务间的依赖关系和性能瓶颈，这对于优化“全局搜索”等复杂业务流程至关重要。 Dapper不仅是一个独立的监控工具，随着时间的推移，它还演变成一个监控平台，催生了更多针对不同需求的分析工具。这些工具在Google内部广泛使用，提供了丰富的统计数据和应用场景，对改进服务质量和提升用户体验起到了关键作用。 Dapper的成功在于其灵活性和可扩展性，使得第三方工具和开发者可以轻松地集成和扩展监控功能。通过Dapper，开发者可以获得深入的洞察，如服务调用的延迟分布、调用拓扑、故障定位等，从而快速定位和解决问题，保证微服务架构的稳定性和效率。总结起来，Dapper作为微服务架构中的链路追踪工具，对于理解和优化分布式系统的行为至关重要。其设计理念和实践经验对于其他类似系统具有很高的参考价值，尤其是在大型互联网公司中，Dapper已经成为不可或缺的监控基础设施。

资源详情

资源推荐

程序员倾向于使用特定应用程序的Annotation，无论是作为一种分布式调试日志文件，还是通过一些应

用程序特定的功能对跟踪进行分类。例如，所有的Bigtable的请求会把被访问的表名也记录到

Annotation中。目前，70％的Dapper span和90％的所有Dapper跟踪都至少有一个特殊应用的

Annotation。

41个Java应用和68个C++应用中都添加自定义的Annotation为了更好地理解应用程序中的span在他们

的服务中的行为。值得注意的是，迄今为止我们的Java开发者比C++开发者更多的在每一个跟踪span上

采用Annotation的API。这可能是因为我们的Java应用的作用域往往是更接近最终用户(C++偏底层);这些

类型的应用程序经常处理更广泛的请求组合，因此具有比较复杂的控制路径。

4. 处理跟踪损耗

跟踪系统的成本由两部分组成：1.正在被监控的系统在生成追踪和收集追踪数据的消耗导致系统性能下

降，2。需要使用一部分资源来存储和分析跟踪数据。虽然你可以说一个有价值的组件植入跟踪带来一

部分性能损耗是值得的，我们相信如果基本损耗能达到可以忽略的程度，那么对跟踪系统最初的推广会

有极大的帮助。

在本节中，我们会展现一下三个方面：Dapper组件操作的消耗，跟踪收集的消耗，以及Dapper对生产

环境负载的影响。我们还介绍了Dapper可调节的采样率机制如何帮我们处理低损耗和跟踪代表性之间

的平衡和取舍。

4.1 生成跟踪的损耗

生成跟踪的开销是Dapper性能影响中最关键的部分，因为收集和分析可以更容易在紧急情况下被关

闭。Dapper运行库中最重要的跟踪生成消耗在于创建和销毁span和annotation，并记录到本地磁盘供

后续的收集。根span的创建和销毁需要损耗平均204纳秒的时间，而同样的操作在其他span上需要消耗

176纳秒。时间上的差别主要在于需要在跟span上给这次跟踪分配一个全局唯一的ID。

如果一个span没有被采样的话，那么这个额外的span下创建annotation的成本几乎可以忽略不计，他

由在Dapper运行期对ThreadLocal查找操作构成，这平均只消耗9纳秒。如果这个span被计入采样的

话，会用一个用字符串进行标注--在图4中有展现--平均需要消耗40纳秒。这些数据都是在2.2GHz的x86

服务器上采集的。

在Dapper运行期写入到本地磁盘是最昂贵的操作，但是他们的可见损耗大大减少，因为写入日志文件

和操作相对于被跟踪的应用系统来说都是异步的。不过，日志写入的操作如果在大流量的情况，尤其是

每一个请求都被跟踪的情况下就会变得可以察觉到。我们记录了在4.3节展示了一次Web搜索的负载下

的性能消耗。

4.2 跟踪收集的消耗

读出跟踪数据也会对正在被监控的负载产生干扰。表1展示的是最坏情况下，Dapper收集日志的守护进

程在高于实际情况的负载基准下进行测试时的cpu使用率。在生产环境下，跟踪数据处理中，这个守护

进程从来没有超过0.3%的单核cpu使用率，而且只有很少量的内存使用（以及堆碎片的噪音）。我们还

限制了Dapper守护进程为内核scheduler最低的优先级，以防在一台高负载的服务器上发生cpu竞争。

Dapper也是一个带宽资源的轻量级的消费者，每一个span在我们的仓库中传输只占用了平均426的

byte。作为网络行为中的极小部分，Dapper的数据收集在Google的生产环境中的只占用了0.01%的网

络资源。

表1：Dapper守护进程在负载测试时的CPU资源使用率

4.3 在生产环境下对负载的影响

每个请求都会利用到大量的服务器的高吞吐量的线上服务，这是对有效跟踪最主要的需求之一；这种情

况需要生成大量的跟踪数据，并且他们对性能的影响是最敏感的。在表2中我们用集群下的网络搜索服

务作为例子，我们通过调整采样率，来衡量Dapper在延迟和吞吐量方面对性能的影响。

表2：网络搜索集群中，对不同采样率对网络延迟和吞吐的影响。延迟和吞吐的实验误差分别是2.5%和

0.15%。

我们看到，虽然对吞吐量的影响不是很明显，但为了避免明显的延迟，跟踪的采样还是必要的。然而，

延迟和吞吐量的带来的损失在把采样率调整到小于1/16之后就全部在实验误差范围内。在实践中，我们

发现即便采样率调整到1/1024仍然是有足够量的跟踪数据的用来跟踪大量的服务。保持Dapper的性能

损耗基线在一个非常低的水平是很重要的，因为它为那些应用提供了一个宽松的环境使用完整的

Annotation API而无惧性能损失。使用较低的采样率还有额外的好处，可以让持久化到硬盘中的跟踪数

据在垃圾回收机制处理之前保留更长的时间，这样为Dapper的收集组件给了更多的灵活性。

4.4 可变采样

任何给定进程的Dapper的消耗和每个进程单位时间的跟踪的采样率成正比。Dapper的第一个生产版本

在Google内部的所有进程上使用统一的采样率，为1/1024。这个简单的方案是对我们的高吞吐量的线

上服务来说是非常有用，因为那些感兴趣的事件(在大吞吐量的情况下)仍然很有可能经常出现，并且通

常足以被捕捉到。

然而，在较低的采样率和较低的传输负载下可能会导致错过重要事件，而想用较高的采样率就需要能接

受的性能损耗。对于这样的系统的解决方案就是覆盖默认的采样率，这需要手动干预的，这种情况是我

们试图避免在dapper中出现的。

剩余41页未读，继续阅读

八五年的湘哥

粉丝: 2w+
资源: 22

Google Dapper：大规模分布式系统的链路追踪解析

最新资源