淘宝交易数据演进:从MySQL到Oracle,再到Mysql+SSD

需积分: 0 0 下载量 141 浏览量 更新于2024-07-28 收藏 2.19MB PPTX 举报
“淘宝在线数据演变PPT,涵盖了淘宝交易系统的演进历程,从MySQL到Oracle,再到后来的优化策略,以及交易数据库的结构和角色介绍。” 淘宝作为中国最大的电商平台之一,其在线交易数据的演变过程反映了电商行业的快速发展和技术变迁。从2003年至2012年,淘宝交易系统经历了多次重大变革,以应对日益增长的业务需求。 在早期,淘宝的数据库体系主要基于MySQL,但随着交易量的爆炸性增长,系统逐渐转向Oracle和小型机。到了2008年,交易日均订单达到200万,原有的架构无法满足需求,于是2009年交易库被拆分为买家库和卖家库,进一步优化了查询效率。卖家库独立出来,专门处理卖家的查询,而买家库则进行交易和已买到的商品查询。这一拆分使得系统能够更好地处理高并发的买家和卖家操作。 2010年,面对卖家库持续增加的压力,淘宝进行了优化,将部分查询功能如累计售出、销售列表和卖家提醒等迁移到Tair,这是一种分布式内存数据库,能够提高查询速度。同时,买家库也进行了“一拆二”的操作,以减轻单个数据库的压力。 2011年,淘宝继续推进技术升级,卖家库从Oracle迁回MySQL,并采用了SSD硬盘,买家库则使用FusionIO技术,提升了存储性能。交易复制系统通过消息中间件实现订单数据的实时同步,确保数据的一致性和可用性。 淘宝交易数据库的系统结构包括买家库和卖家库,以及Hbase集群和历史库。买家库由多个部分组成,负责处理买家的下单、付款、确认收货等操作。卖家库则处理卖家的订单、发货和查询等事务。此外,淘宝交易流程涉及多种交易类型,如普通宝贝交易、直充交易、酒店和机票预订等。 淘宝交易的角色主要包括买家和卖家。买家负责浏览、选择商品,加入购物车,支付订单;卖家则负责上架商品、处理订单、发货和售后服务。整个交易过程中,消息中间件起到了关键作用,它在交易复制系统中传递订单更改通知,实时更新卖家库数据。 在系统架构的优化过程中,淘宝还引入了流控和监控措施,以防止HSF服务前端请求过载,确保系统的稳定运行。 淘宝在线数据演变的过程是一个不断适应业务增长、优化系统性能和技术迭代的过程,体现了电商平台在大数据处理、分布式系统设计和数据库管理等方面的先进实践。