大数据从入门到实战 - 第2章 分布式文件系统hdfs
时间: 2023-04-28 14:06:12 浏览: 204
第2讲_分布式文件系统HDFS.pdf
5星 · 资源好评率100%
HDFS(Hadoop分布式文件系统)是一种高容错的分布式文件系统,是Hadoop生态系统中的核心组件之一。它支持高容错性、高可靠性和高性能的数据存储和管理。HDFS通过将大文件分成小块存储在多台机器上来实现数据分布式存储,并通过主节点和从节点之间的协调来实现高可用性。 HDFS通常与MapReduce结合使用,用于分布式数据处理和分析。
阅读全文