Google与IBM云计算平台技术详解

4星 · 超过85%的资源 需积分: 10 41 下载量 98 浏览量 更新于2024-08-01 收藏 974KB PPT 举报
"该资源是南京大学的一次关于云计算架构的讲座或课程,涵盖了云计算的基本概念,技术原理,以及Google和IBM的云计算平台的应用。主要讲解了云计算的定义,涉及虚拟化技术、服务化思想,重点阐述了Google的分布式文件系统(Google File System, GFS),MapReduce编程模型,分布式锁机制Chubby以及分布式数据库BigTable,同时也提到了IBM蓝云计算平台中的虚拟机使用和存储结构。" 云计算是一种将IT资源、数据和应用作为服务通过网络提供的计算模式,它强调资源的高度虚拟化和统一管理,提供安全、快速、便捷的数据存储和计算服务。IBM提出云计算不仅是一种计算模式,也是一种基础架构管理方法论。虚拟化技术在云计算中扮演关键角色,实现了资源的抽象、分配和监控,支持动态扩展资源池。服务化思想包括软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)。 Google的云计算平台是为特定网络应用定制的,基于分布式并行集群,能应对节点失效。其核心组件包括: 1. **分布式文件系统(Google File System, GFS)**:设计用于处理大规模数据,集成容错和自动恢复功能,适合大文件和大量小文件的存储,支持文件追加操作以优化性能。文件操作的某些方面需要应用程序配合完成。 2. **MapReduce编程模式**:用于处理大数据集的并行计算框架,由Map和Reduce两个阶段组成。Map将原始数据转换为键值对,Reduce则聚合这些键值对,提供最终结果。例如,MapReduce可以用于统计文本中的单词数量。 3. **分布式锁机制Chubby**:提供一致性和锁服务,是Google内部的关键组件,用于协调分布式系统中的并发操作。 4. **分布式数据库BigTable**:是Google的NoSQL数据库,用于存储海量半结构化数据,被许多Google服务如Google搜索、Gmail等依赖。 IBM蓝云计算平台侧重于虚拟机的使用和存储结构,虚拟机允许在单一物理硬件上运行多个独立操作系统和应用,优化资源利用率。存储结构则关乎数据的高效管理和访问。 这个资源深入介绍了云计算的核心技术和两大业界巨头的实践经验,对于理解云计算的原理及其在实际中的应用具有重要价值。