2016年Hadoop Summit：基于Docker的Hadoop/Spark集群规模优化框架

需积分: 9 65 浏览量更新于2024-07-17 收藏 1.78MB PDF 举报

在2016年的Hadoop Summit会议上，Akiyoshi Sugiki和Phyo Thandar Thant，来自日本北海道大学的信息倡议中心，提出了一项名为"A Container-based Sizing Framework for Apache Hadoop/Spark Clusters"的研究。他们的报告聚焦于北海道大学的学术云基础设施及其在Hadoop和Spark集群规模化的关键应用。首先，他们介绍了北海道大学的信息倡议中心，这是一所拥有悠久历史的国家超级计算机中心，隶属于HPCI（高性能计算基础设施）和JHPCN（跨学科大型信息基础设施联合使用/研究中心）两个组织。该中心致力于超级计算机和云计算等领域的研究，运营着双子星系统：一台性能强大的超级计算机（172万亿次浮点运算每秒，176个节点），以及一个学术云计算系统（43万亿次浮点运算每秒，约2000个虚拟机）。北海道大学的学术云是日本最大的教育研究云平台，提供超过43万亿次浮点运算能力，支持大规模数据处理。该云系统由两部分组成：一部分是超级计算机系统，搭载了高性能的SR16000 M1和BS2000服务器，以及大容量的存储设备；另一部分是专门的数据科学云系统，配备有AMS2500文件系统和不同类型的硬盘配置。报告的核心是他们开发的基于Docker的Hadoop规模化框架。Docker容器技术在此处发挥了关键作用，它允许在不同环境中高效地部署和管理Hadoop集群，确保资源利用率最大化，同时保持应用的隔离性和一致性。通过容器化，可以简化集群的部署，减少配置复杂性，并且能够适应不断变化的工作负载需求。此外，演讲者还探讨了Hadoop的多目标优化问题。在实际应用中，Hadoop集群需要同时考虑多个目标，如性能、成本、可用性等，这就需要一种动态的决策支持系统来平衡这些目标。通过采用多目标优化方法，他们旨在实现资源的最优分配，提升整个系统的效率和灵活性。这项研究提供了将容器技术应用于Hadoop和Spark集群规模化的重要实践案例，展示了如何通过自动化和标准化的手段来应对大数据处理中的挑战，以及如何通过多目标优化策略实现集群性能和成本的协同优化。这对于云计算环境下的Hadoop集群管理和扩展具有重要的参考价值。

Going Next

A new system will be installed in April, 2018

– x2 CPU cores, x5 storage space

– Bare-metal, accelerating performance at every layer

– Supports both interclouds and hybrid clouds

Still supports Hadoop as well as Spark

– Cluster templates

– Build user community

Supercomputer

System

Hokkaido U.

Regions

(Tokyo,

Osaka,

Okinawa)

Cloud

Systems

(In other universities

and public clouds)

Cluster Templates (Hadoop, Spark, …)

剩余35页未读，继续阅读

weixin_38743506

粉丝: 352

2016年Hadoop Summit：基于Docker的Hadoop/Spark集群规模优化框架

AI从头到脚详解如何创建部署Azure Web App的OpenAI项目源码

人脸识别_卷积神经网络_CNN_ORL数据库_身份验证_1741779511.zip

人工智能-人脸识别代码

汽车配件制造业企业信息化整体解决方案.pptx

短期风速预测模型，IDBO-BiTCN-BiGRU-Multihead-Attention IDBO是，网上复现 评价指标：R方、MAE、MAPE、RMSE 附带测试数据集运行（风速数据） 提示：在

手势识别_数据融合_运动融合帧_Pytorch实现_1741857761.zip

智慧园区IBMS可视化管理系统建设方案PPT(61页).pptx

相亲交友系统源码 V10.5支持婚恋相亲M红娘系统.zip

单片机也能玩双核之你想不到c技巧系列-嵌入式实战（资料+视频教程）

计算机视觉_OpenCV_人脸识别_成本节约检测方案_1741779495.zip

最新资源

短期风速预测模型，IDBO-BiTCN-BiGRU-Multihead-Attention IDBO是，网上复现评价指标：R方、MAE、MAPE、RMSE 附带测试数据集运行（风速数据）提示：在