淘宝网陈吉平:2009年高可用分布式数据库架构实践揭秘

需积分: 9 99 下载量 115 浏览量 更新于2024-08-02 收藏 2.51MB PDF 举报
在2009年的系统架构师大会上,陈吉平分享了其关于高可用分布式数据库系统架构的实践经验。作为Oracle ACE Director和《构建oracle高可用环境》一书的作者,他深入探讨了淘宝网的发展历程和数据库策略的演变。 在早期的淘宝网(V1.0),创建于2003年非典时期,采用了流行的开源技术组合LAMP架构,即Linux、Apache、MySQL和PHP,数据库仅包含少量的用户、交易和商品等简单数据,能满足当时的业务需求。随着淘宝的快速发展,用户量和交易规模大幅增长,V2.0阶段引入了集中式的数据库架构,采用IBM小型机与EMC存储以及Oracle数据库,通过Scaleup方式扩展,但这种架构存在单点故障风险且扩展性有限。 随着业务的不断壮大,淘宝网面临海量非结构化数据存储的问题,如图片等。为此,他们引入了分布式存储技术,如TFS(可能是Tokyo Cabinet或类似的键值存储系统),解决了存储压力。同时,引入分布式缓存机制,如Tair,利用PC服务器作为存储媒介,优化了数据访问性能。 为了提高系统的高可用性,淘宝采用了双机房架构,结合Oracle的DataGuard和RedoMirror功能,实现数据冗余和实时同步,确保即使在一处发生故障时,服务仍能继续运行。这种设计极大地增强了系统的可靠性,为淘宝网在2008年达到交易额999.6亿人民币、注册用户9800万以及众多商品和服务的销售奠定了基础。 陈吉平的演讲不仅揭示了淘宝网在数据库架构上的决策过程,还展示了如何随着业务需求的变化,逐步采用分布式系统和高可用技术来应对挑战。他的分享对于理解和设计大型互联网企业的数据库架构具有重要的参考价值。