异构Hadoop集群落伍者管理：最新技术综述与挑战

155 浏览量更新于2024-06-17 收藏 2.19MB PDF 举报

本文是一篇由Kamalakant Laxman Bawankulea, Rupesh Kumar Dewanga, 和 Anil Kumar Singha 合著的综述论文，发表在沙特国王大学学报上，由Elsevier主办。标题为“异构Hadoop集群中的落伍者缓解和管理的最新综述”。Hadoop作为大数据处理的主流软件框架，因其经济性和处理大规模数据的能力而广受欢迎，主要通过Hadoop分布式文件系统（HDFS）和MapReduce模型实现。在异构环境下，Hadoop的性能可能会受到硬件不一致性和负载分布不均衡的影响。论文首先介绍了Hadoop的基础概念，包括HDFS的分布式存储和MapReduce的并行处理原理。接着，作者探讨了在异构Hadoop集群中遇到的问题，如负载分配的不平等和资源调度中的挑战。论文将现有的落伍者（stragglers，指在分布式计算中性能较慢的任务节点）管理和缓解技术划分为两大类：主动方法和被动方法。主动方法包括通过任务回避和预测来减少落伍者的影响，如避开性能较差的节点进行任务分配或提前预测可能成为落伍者的节点。被动方法则是侧重于在问题发生后进行检测和响应，如故障检测和资源调整。作者深入分析了这两种方法的优缺点，指出现有研究在某些情况下存在局限性，例如对硬件性能动态变化的适应性不足。在讨论部分，论文列举了尚未解决的问题，如如何更有效地动态调整策略以应对异构环境的不确定性，以及未来研究可能的发展方向。值得注意的是，该论文是在2021年接收初步提交，经过多次修订和审阅后，于2022年3月在网上发布。文章遵循CCBY-NC-ND许可证，表示作者对其享有版权，且允许在特定条件下非商业性地使用和分享。这篇综述为理解异构Hadoop集群中的落伍者问题提供了全面的视角，并为后续的研究者提供了宝贵的参考和问题启示，尤其是在寻求提高异构环境下Hadoop性能和效率方面。

Kamalakant Laxman Bawankule

、

Rupesh Kumar Dewang

和

Anil Kumar Singh

沙特国王大学学报

7626

用户使用单个

Hadoop

集群，其中每个用户都有自己的一组资源，并

保留了一些优先级来执行作业。不同的用户提交不同的任务，例如

CPU

限制或

I/O

限制，这会导致工作负载异构性（

Tuli

等人，

2021

年）。在现实世界中，每台机器的硬件配置都是不同的，这最终会

导致硬件异构性（

Wang et al.

，

2019

年）。异构环境几年前，

Hadoop

在所有上述因素中都是同质的（

Gao

和

Huang

，

2021

）。

Hadoop

的需求在数据中心的大规模数据计算中不断增长，并且已经

变得流行起来。然而，由于其在数据放置和任务调度期间的同质性假

设，其性能在异构环境中下降（

Wang

等人，

2021

年）。异构环境中

的平均任务分布会造成集群中的负载不平衡。异构环境中的节点由于

负载不平衡和节点间数据传输而成为掉队者。

掉队者可能是由于软件错误、硬件故障和资源争用。在异构环境

中，了解离散子的确切原因是一个具有挑战性的问题。掉队者更容易

适应不同的环境。提出了各种但是这些方法和技术还没有得到全面的

分类和研究。我们的研究为异构

Hadoop

环境提出了新的分类法，以

减轻图中的落伍者。

，它将现有的方法分为两种不同的方法：主动

和被动。此外，这些方法分为离散避免，离散检测和离散预测技

术。提出了各种方法来避免、检测和预测异构

Hadoop

环境中的落伍

者，下面将详细研究

提出了副本管理、负载均衡、提高数据局部性、任务克隆等方法来

避免分散攻击。提出了推测执行和节点黑名单等方法来检测掉队节点。

今天，主要是通过使用现代机器学习技术来预测落后者。两种方法，如

离散预测和离散避免，反应之前的离散出现。掉队者检测在掉队者事件

之后作出反应。这些途径，技术和方法进一步详细讨论。

4.1.

积极主动的做法

这种方法避免了在异构Hadoop集群中出现掉队者之前出现掉队者。

Hadoop被广泛用于避免异构Hadoop集群中的掉队者。该方法可能会由

于用于克隆任务或减少节点（黑名单）的过多资源而造成资源争用。尽

管如此，这种方法仍然可以在异构Hadoop集群中出现落伍者之前对其

进行处理。

4.1.1.

掉队者回避

Hadoop中的一些异常值会显著延长作业完成时间。需要尽早采取行

动，释放任务可以使用的资源。克隆任务是在发现掉队者之前采取行动

的一种方法。许多基于处理能力方法的数据放置技术被提出。在所提出

的方法中，所有节点同时完成它们的工作（Bawankule等人，2021，

2022; Lee等人，2014年; Xie等人，2010; Xu和Lau，2016）。更多的

方法，如副本管理（Cheng et al.，2012）和负载平衡（Chen等人，

2014年）基于数据流行度和处理能力，提出了在Hadoop中避免掉队

者。

异构环境中大量的数据传输降低了其性能，并产生了落伍者。许

多提出的技术通过基于节点处理能力和磁盘空间可用性放置数据来避

免异构集群中的节点间数据传输这种有效的数据放置策略将帮助

Hadoop

防止掉队者。许多算法在检测到掉队者之前就采取行动在这

些技术中，作者试图通过在发现掉队者之前采取一些预防措施来避免

掉队者。

Hadoop

的性能在所有环境中并不相同，其实现在同构、异构和模

拟环境中也各不相同。对于落伍者避免、预测和检测技术，测试环境

在评估

Hadoop

性能方面起着非常重要的

Hadoop

集群中更多的节点

有助于提高作业的性能，因为集群有足够的资源，作业在早期阶段就

完成了。性能指标在每种技术中可能有所不同，但总体而言，它们改

善了作业执行时间。

Hadoop

有两个版本

Hadoop 1.x

和

Hadoop 2.x

，

现在，为了更好地跨集群管理资源，

见图4。用于异构Hadoop集群中落伍者缓解和管理的分类框架。

剩余26页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

异构Hadoop集群落伍者管理：最新技术综述与挑战

Hadoop集群pdf文档

论文研究-基于和声算法异构Hadoop集群资源分配优化.pdf

Hadoop集群中影响应用性能的因素分析

大数据技术基础实验报告-Hadoop集群的使用和管理.doc

hadoop 集群部署操作

利用ansible 自动 安装Hadoop 集群

部署全分布模式Hadoop集群 实验报告

细细品味Hadoop_Hadoop集群（第2期）_机器信息分布表

非常领先的分布式数据库Oceanbase OBCP 3.0培训教材

GCN海面目标检测.zip

最新资源

利用ansible 自动安装Hadoop 集群

部署全分布模式Hadoop集群实验报告