京东大数据:EC技术在HDFS中的实战应用与优化
毛宝龙是一位京东大数据平台架构师,他在演讲中探讨了如何将Erasure Coding(EC)技术融入到京东的分布式文件系统Hadoop Distributed File System (HDFS)中,以应对快速增长的数据存储需求。随着京东业务的扩张,数据已成为公司的重要战略资产,尤其是对于温冷数据(访问频率低但长期保存的数据),其存储占据了总量的80%以上,因此降低存储成本和提高效率显得尤为重要。 背景介绍部分,毛宝龙阐述了存储量线性增长的情况,指出京东的大数据平台在2018年期间存储量显著增加,预计到2019年中期将达到EB级别的存储需求。同时,由于业务发展导致的温冷数据占比高,传统的存储解决方案已无法满足性能和成本效益的要求。EC,作为一种数据冗余备份技术,通过将数据分割并以分散的方式存储,可以提供更高的数据完整性并减少存储需求。 在方案介绍中,毛宝龙详细讲解了如何设计和实施EC融入HDFS的过程。这包括如何在系统中平滑地引入EC算法,确保数据迁移和读写性能不受影响,以及如何处理可能遇到的技术挑战和优化策略。他分享了京东团队在实际操作中如何避免常见问题,比如数据一致性问题、网络延迟影响和资源管理等。 演讲内容还包括了京东在将EC应用于HDFS过程中所积累的经验教训,以及如何通过这些经验推动京东Hadoop生态系统的发展,使之更加高效和可靠。毛宝龙强调了EC技术对京东大数据平台转型的重要性,它不仅帮助降低了存储成本,还促进了京东Hadoop项目的升级和创新。 总结部分,毛宝龙回顾了整个项目的实施过程,强调了EC技术与HDFS结合的成果,以及它在京东大数据战略中的核心地位。他还可能会提到未来可能的扩展和优化方向,以适应京东不断变化的业务需求和技术趋势。 这场演讲深入剖析了EC融入HDFS的实际应用案例,提供了丰富的技术细节和实践经验,对于企业和IT专业人员理解和应用分布式存储解决方案具有很高的参考价值。
剩余42页未读,继续阅读
- 粉丝: 223
- 资源: 10
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 多模态联合稀疏表示在视频目标跟踪中的应用
- Kubernetes资源管控与Gardener开源软件实践解析
- MPI集群监控与负载平衡策略
- 自动化PHP安全漏洞检测:静态代码分析与数据流方法
- 青苔数据CEO程永:技术生态与阿里云开放创新
- 制造业转型: HyperX引领企业上云策略
- 赵维五分享:航空工业电子采购上云实战与运维策略
- 单片机控制的LED点阵显示屏设计及其实现
- 驻云科技李俊涛:AI驱动的云上服务新趋势与挑战
- 6LoWPAN物联网边界路由器:设计与实现
- 猩便利工程师仲小玉:Terraform云资源管理最佳实践与团队协作
- 类差分度改进的互信息特征选择提升文本分类性能
- VERITAS与阿里云合作的混合云转型与数据保护方案
- 云制造中的生产线仿真模型设计与虚拟化研究
- 汪洋在PostgresChina2018分享:高可用 PostgreSQL 工具与架构设计
- 2018 PostgresChina大会:阿里云时空引擎Ganos在PostgreSQL中的创新应用与多模型存储