"后Hadoop时代的大数据架构演进与应用2015-04-29"

版权申诉

27 浏览量更新于2024-02-25 收藏 1.34MB PDF 举报

随着大数据时代的到来，Hadoop系统作为开源的数据分析平台，在过去十多年中发生了许多变化。从0.x版本进化到目前的2.6版本，Hadoop已成为处理可靠存储和处理大数据的解决方案。然而，随着技术的不断发展和应用场景的多样化，人们开始意识到Hadoop并非唯一的选择，类似于NoSQL（Not Only SQL）的概念，大数据架构也需要更多的选型和补充。在2012年后，被定义为后Hadoop时代，这并不意味着放弃Hadoop，而是意味着在Hadoop的基础上引入其他新的技术和工具，以满足不同的需求和挑战。腾讯大数据提到了大数据分析平台的重要性，Hadoop仍然扮演着核心的角色，但其他技术的引入也变得至关重要。 Hadoop系统的基本组件包括HDFS和MapReduce。HDFS作为一种跨服务器的弹性数据存储系统，为大数据的存储提供了可靠性和扩展性。而MapReduce技术则提供了一种标准化的数据处理流程，包括读取数据，进行数据映射（Map），数据重排，并最终进行数据化简（Reduce）。这些基本组件构成了Hadoop系统的核心，为大数据处理提供了重要的支持。除了Hadoop系统本身，还有像Amazon Elastic Map Reduce（EMR）这样的托管解决方案，可以运行在Amazon Elastic Compute Cloud（EC2）和Simple Storage Service（S3）平台上。这些解决方案为用户提供了便捷和灵活的大数据处理工具，使得大数据分析更加高效和便捷。在后Hadoop时代，人们开始意识到单一的技术架构无法完全满足大数据处理的需求，因此需要引入其他新的技术和工具。比如像Apache Spark、Apache Flink等分布式计算框架，以及HBase、Cassandra等NoSQL数据库，都成为了大数据架构中的重要组成部分。这些新的技术和工具不仅提供了更多选择和灵活性，还能够更好地满足不同场景下的需求。总的来说，后Hadoop时代的大数据架构不是放弃Hadoop，而是在Hadoop的基础上引入更多新的技术和工具，以构建更加强大和多样化的大数据处理平台。随着技术的不断发展和创新，大数据架构也将不断演进，为用户提供更好的数据处理和分析体验。

Hortonworks：使用了 100%开源 Apache Hadoop 提供商。

开发了很多增强特性并提交至核心主干，这使得 Hadoop 能

够在包括 Windows Server 和 Azure 在内平台上本地运行。

MapR：获取更好的性能和易用性而支持本地 Unix 文件

系统而不是 HDFS。提供诸如快照、镜像或有状态的故障恢复

等高可用性特性。领导着 Apache Drill 项目，是 Google 的

Dremel 的开源实现，目的是执行类似 SQL 的查询以提供实时

处理。

原理篇

数据存储

我们的目标是做一个可靠的，支持大规模扩展和容易维

护的系统。计算机里面有个 locality（局部性定律），如图

所示。从下到上访问速度越来越快，但存储代价更大。

剩余14页未读，继续阅读

xxpr_ybgg

粉丝: 6760
资源: 3万+

"后Hadoop时代的大数据架构演进与应用2015-04-29"

后Hadoop时代的大数据架构.pdf

04-29 后Hadoop时代的大数据架构.docx

把Hadoop大数据系统架构讲明白了.pdf

ZKPK-Hadoop2.0大数据课程-SZ.pdf

2019全球未来科技大会--5G时代云边协同下的大数据应用--广东移动云计算和大数据公司.rar

hadoop开发案例 hadoop视频教程-Greenplum Hadoop大数据应用案例剖析.pdf

运营商的大数据架构.pdf

基于云平台的大数据架构.pdf

福建师范大学精品大数据导论课程系列 (5.2.1)--4.1.2 hadoop简介之二.rar

藏经阁-企业大数据平台下数仓架构.pdf

最新资源