大数据BI发展:开源与商业生态揭秘

需积分: 10 2 下载量 4 浏览量 更新于2024-07-24 收藏 1.63MB PDF 举报
本次分享的主题是"Yonghong业界大数据BI发展分享",主要围绕大数据的背景、开源与商用大数据生态圈以及大数据BI系统的构建进行深入探讨。首先,会议强调了大数据的四个基本特性:数据量大(Volume)、处理速度快(Velocity)、数据类型多样(Variety)和价值密度低(Veracity),这反映了大数据处理的核心挑战和机遇。 分享中提到,谷歌的数据观念是推动大数据时代的关键因素,其产品研发总监Peter Norvig的观点认为,更多的数据比更优秀的算法更为重要,这一理念推动了大数据技术的发展。接着,讨论了开源大数据生态圈的起源,以谷歌为例,其在2003年发布的论文如《The Google File System》、《MapReduce》和《Bigtable》标志着大数据时代的开启。Hadoop生态系统随之兴起,包括HDFS、Hadoop MapReduce、HBase和Hive等组件逐渐成为主流,它们共同构建了早期的大数据基础设施。 除了Hadoop,Hypertable作为一种独立于Hadoop生态系统的存储系统,虽然规模较小但也有一定的用户基础。这个分享还提到了业界对大数据BI的关注,着重于如何利用这些技术来构建和优化商业智能系统。建设大数据BI系统需要深入思考如何整合海量数据、提升分析速度、并确保数据的准确性和可靠性。 最后,活动的形式是每月一次的面对面草根交流,旨在通过实际交流与分享,促进业界同仁的工作、学习和发展。参与者可以访问www.eeqee.com和www.yonghongtech.com获取更多信息。此外,永洪科技通过其官方微博@永洪科技BI保持最新的动态更新,日期为2013年12月7日。 总结来说,这次分享不仅回顾了大数据的起源和发展,还探讨了如何将其应用于BI领域,并提供了参与专业交流的平台,对于理解当前和未来业界大数据技术趋势具有重要意义。