"中通快递:优化实践中的Spark Shuffle Service源码探究"
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
中通快递是一家综合物流服务企业,其业务范围涵盖跨境、快运、商业、云仓、航空、金融、智能、传媒和冷链等生态版块。2021年,中通快递的业务量突破了170亿件,同比增长超过40%。随着业务量不断增长,数据时效性的需求也不断提高,传统的基于hive mapreduce的离线计算已经无法满足需求。因此,中通快递于2021年底开始尝试将hive计算迁移到spark 2.3.2上加速离线计算,以满足对数据处理的更高要求。 随着hive计算迁移到spark计算的进行,夜间ETL任务的总耗时不断减少,同时yarn资源占用也开始降低。然而,这一过程也暴露出了一些问题。其中一个问题是关于spark shuffle service的优化需求。Spark根据算子之间的宽窄依赖划分stage,同一个stage由多个task并行执行,而stage与stage之间的数据传输通过task写入本地文件来实现。上一个stage的task执行完成后,将结果数据写入executor所在机器的本地磁盘。这一过程中,shuffle过程的性能对整体计算性能有很大的影响,因此需要针对spark shuffle service进行优化。 为了解决这一问题,我们进行了一系列的优化实践。首先,我们对spark shuffle service的源码进行了深入的研究,分析了其在中通快递业务中的实际应用情况。在对源码进行全面的了解后,我们提出了一系列的优化方案,包括对shuffle read和shuffle write进行性能调优,优化shuffle数据的传输和存储方式,以及改进shuffle service的并发处理能力。 在优化实践的过程中,我们充分考虑了中通快递业务的特点和实际需求,并在实际应用中进行了有效验证。通过优化spark shuffle service,我们取得了显著的成效。夜间ETL任务的总耗时进一步减少,yarn资源占用也得到了进一步的优化,整体计算性能得到了显著提升。同时,优化后的spark shuffle service也更加稳定可靠,为中通快递的数据处理提供了更加可靠的支持。 总的来说,通过对spark shuffle service进行深入的优化实践,我们成功地解决了中通快递业务中遇到的性能瓶颈和稳定性问题,为业务的持续发展提供了可靠的数据处理支持。我们将继续致力于对大数据计算框架的优化实践,不断提升系统性能和稳定性,为中通快递的未来发展打下坚实的基础。
![](https://csdnimg.cn/release/download_crawler_static/40467526/bg4.jpg)
剩余17页未读,继续阅读
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
- 粉丝: 0
- 资源: 7万+
![](https://csdnimg.cn/release/wenkucmsfe/public/img/vip-rights-1.c8e153b4.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/vip-rights-2.8b825a4e.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/vip-rights-3.fc5e5fb6.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/vip-rights-4.320a6894.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/vip-rights-icon.fe0226a8.png)
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 京瓷TASKalfa系列维修手册:安全与操作指南
- 小波变换在视频压缩中的应用
- Microsoft OfficeXP详解:WordXP、ExcelXP和PowerPointXP
- 雀巢在线媒介投放策划:门户网站与广告效果分析
- 用友NC-V56供应链功能升级详解(84页)
- 计算机病毒与防御策略探索
- 企业网NAT技术实践:2022年部署互联网出口策略
- 软件测试面试必备:概念、原则与常见问题解析
- 2022年Windows IIS服务器内外网配置详解与Serv-U FTP服务器安装
- 中国联通:企业级ICT转型与创新实践
- C#图形图像编程深入解析:GDI+与多媒体应用
- Xilinx AXI Interconnect v2.1用户指南
- DIY编程电缆全攻略:接口类型与自制指南
- 电脑维护与硬盘数据恢复指南
- 计算机网络技术专业剖析:人才培养与改革
- 量化多因子指数增强策略:微观视角的实证分析
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)