阿里巴巴中文站:从Perl到Hadoop的架构演进实践

需积分: 50 165 下载量 59 浏览量 更新于2024-07-22 2 收藏 2.47MB PDF 举报
《【Hadoop与大数据14】阿里巴巴中文站架构设计实践(何崚)》一文详细介绍了阿里巴巴中文站从创立到发展的架构演变历程,以及作者何崚在其中的重要角色。阿里巴巴中文站成立于1999年,作为阿里巴巴B2B集团内的核心站点,它拥有庞大的用户基础,包括国内最大的网上批发市场、供应商的旺铺、会员工作平台、诚信商人社区等多种业务模块。 早期阶段,网站采用Perl和CGI技术,随后进入Java和Servlet的时代,紧接着是EJB的应用,涉及服务层(SLSB)、实体 beans(CMP)、消息驱动构件(MDB)等设计模式。2005年至2007年,进行了去EJB重构,引入Spring、iBatis、Webx等轻量级框架,并构建了底层架构如iSearch、MQ+ESB,以及数据挖掘和内容管理系统。 随着业务的迅速扩张,2008-2009年,面对海量数据的挑战,采用了Memcached集群进行缓存、Mysql+数据切分策略(Cobar)、分布式存储(Hadoop)和KV存储,以及CDN加速技术来提升性能。同时,这一阶段也开始引入NoSql和SSD技术以优化数据处理。 2010年,安全性和镜像站成为关注重点,通过升级应用服务器、实现秒杀功能、以及探索非关系型数据库(NoSql)来强化系统的安全性。此时的第五代网站架构不仅解决了性能瓶颈,还有效应对了海量数据的挑战,同时确保了灾备能力。 何崚作为阿里巴巴中文站的架构师,不仅负责技术选型和架构设计,还是B2B网站优化领域的关键人物,他关注的领域包括Java、SOA、性能调优、Erlang等。文章提供了深入理解阿里巴巴中文站如何适应不断变化的技术环境和业务需求,以及如何通过Hadoop等大数据技术来支撑其业务发展的重要视角。