基于 Hadoop 的大数据平台——整体架构设计
大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星。我们
暂不去讨论大数据到底是否适用于您的组织,至少在互联网上已经被吹嘘成无所不能
的超级战舰。好像一夜之间我们就从互联网时代跳跃进了大数据时代!关于到底什么
是大数据,说真的,到目前为止就和云计算一样,让我总觉得像是在看电影《云图》
——云里雾里的感觉。或许那些正在向你推销大数据产品的公司会对您描绘一幅乌托
邦似的美丽画面,但是您至少要保持清醒的头脑,认真仔细的慎问一下自己,我们公
司真的需要大数据吗?
做为一家第三方支付公司,数据的确是公司最最重要的核心资产。由于公司成立不久 ,
随着业务的迅速发展,交易数据呈几何级增加,随之而来的是系统的不堪重负。业务
部门、领导、甚至是集团老总整天嚷嚷的要报表、要分析、要提升竞争力。而研发部
门能做的唯一事情就是执行一条一条复杂到自己都难以想象的 SQL 语句,紧接着系统
开始罢工,内存溢出,宕机........简直就是噩梦。OMG!please release me!!!
其实数据部门的压力可以说是常人难以想象的,为了把所有离散的数据汇总成有价值
的报告,可能会需要几个星期的时间或是更长。这显然和业务部门要求的快速响应理
念是格格不入的。俗话说,工欲善其事,必先利其器。我们也改鸟枪换炮了......。
网上有一大堆文章描述着大数据的种种好处,也有一大群人不厌其烦的说着自己对大
数据的种种体验,不过我想问一句,到底有多少人多少组织真的在做大数据?实际的
效果又如何?真的给公司带来价值了?是否可以将价值量化?关于这些问题,好像没
看到有多少评论会涉及,可能是大数据太新了(其实底层的概念并非新事物,老酒装
新瓶罢了),以至于人们还沉浸在各种美妙的 YY 中。
做为一名严谨的技术人员,在经过短暂盲目的崇拜之后,应该快速的进入落地应用的
研究中,这也是踩着“云彩”的架构师和骑着自行车的架构师的本质区别。说了一些牢骚
话,当做发泄也好,博眼球也好,总之,我想表达的其实很简单:不要被新事物所迷
惑,也不要盲目的崇拜任何一样新事物,更不要人云亦云,这是我们做研究的人绝对
要不得。
说了很多也是时候进入正题了。公司高层决定,正式在集团范围内实施大数据平台
(还特地邀请了一些社区的高手,很期待.......),做为第三方支付公司实施大数据平
台也无可厚非,因此也积极的参与到这个项目中来。正好之前关于 OSGi 的企业级框
架的研究也告一段落,所以想利用 CSDN 这个平台将这次大数据平台实施过程记录下
来。我想一定能为其它有类似想法的个人或公司提供很好的参考资料!