没有合适的资源?快使用搜索试试~ 我知道了~
制作和主办:Elsevier沙特国王大学学报对云雾系统中可持续和节能AI和大数据实施的最新影响:一项有新闻价值的调查Hamzaoui Ikhlassea,b,c,Duthil Benjaminc,d,Courboulay Vincentd,Medromi Hichama,b,a科学和工程发展与创新研究基金会,16469卡萨布兰卡,摩洛哥b摩洛哥卡萨布兰卡8118哈桑二世大学国家电力和机械高等学校工程研究实验室系统架构小组(EAS)cEIGSI,拉罗谢尔,法国d法国拉罗谢尔大学信息技术、图像、交互实验室(L3I)阿提奇莱因福奥文章历史记录:收到2021年2021年10月13日修订2021年11月3日接受2021年11月12日网上发售保留字:能源指标和测量工具高能效实施分布式大数据处理深度神经网络多模式云雾交通A B S T R A C T基于云雾的行业今天需要贪婪的能源成本,因为他们的AI模型和分布式BD框架实现的广泛增加。本文进行了一项有新闻价值的调查,旨在研究IT社区在多大程度上意识到其硬件和软件实现的能源评估,以及它们是否符合高效AI和BD部署的可持续影响。通过对第一个调查问题的响应进行分析,我们能够解决AI模型、分布式BD框架和云-雾系统之间的互操作性。不幸的是,只有10%的受访者在评估其实施时采用了能源指标更糟糕的是,多层次的能源消耗测量技术对大多数受访者来说并不明显。相应地,我们提供了一个有用的指导方针,各种多层次的能量和功率估计方法。此后,我们致力于根据调查和文献结果分析新兴的高效DNN和分布式BD实现的一些重要部分这些努力主要体现在基于内存处理和近内存处理架构的高效可重构加速器设计中。为了最终通过其他切实的解决方案服务于IT社区,我们提出了两个路线图,为投资涵盖硬件、软件和数据层面的可持续行动提供了可能性。版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。内容1.导言88682.研究方法88692.1.询价介绍88692.2.采样和验证源88693.AI、BD、云雾系统互通后台88693.1.对云-雾架构内部和内部的一般见解88693.2.穿越云雾系统的多式联运88723.3.支持云雾系统的人工智能服务88743.4.支持云雾系统的BD技术88744.可持续AI和BD系统实施路线图88764.1.计算机体系结构社区中的能量和功率分析指标8876*通讯作者。电子邮件地址:ikhlasse. ensem.ac.ma(H. Ikhlasse),hmedromi@yahoo.com(M. Hicham)。沙特国王大学负责同行审查https://doi.org/10.1016/j.jksuci.2021.11.0021319-1578/©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个在CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comH. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报88684.2.对高效DNN实现的可持续影响。...................................................................................................................................................................................................88774.2.1.高效的硬件算法协同设计88774.2.2.高效节能促进剂8880的合成4.2.3.能源效率DNN实现的拟议路线图88804.3.对高效分布式BD部署的可持续影响88804.3.1.高效的分布式流处理解决方案88804.3.2.高效的分布式图形处理解决方案88824.3.3.高效分布式和并行计算部署的拟议路线图5.讨论和结论8884竞争利益声明确认8885参考文献88851. 介绍无论是云计算还是雾计算,这两种系统现在都成为存储,管理和处理各种数据的无可争议的选择。 虽然大多数读者可能熟悉这两个概念,但最后的边缘或雾计算(Barik等人,2018)术语是指通过微计算机和微控制器直接驻留在极端边缘网络内的基本计算设计。这些概念背后的差异主要是基于(Yousefpour等人,2019年),根据位置接近度、工作负载密度和服务流量,fic nature.在具有各种响应反应性以及事务和处理类型的多模式工作负载流量中,决策支持系统(DSS)数据流是在云和雾计算环境中操作当涉及到云雾后端(BE)决策支持时,大量的大数据(BD)业务分析(Duan和Xiong,2015)主要依靠BD技术以及各种人工智能(AI)服务。实际上,为了保持与云BE决策和在线工作负载需要被处理的快速速率同步,分布式和并行BD技术变得与云雾平台紧密耦合(Singh等人,命名法AI人工智能是应用运行时间环境酸原子性、一致性、隔离性、持久性基地基本可用软状态最终一致性BD大数据Mac乘法累加机器人任务袋SPM便笺式存储器帽一致性、可用性和分区个gpu图形处理单元ConvNet 卷积网络PMC性能计数器DAG向无环图NFCA纳米级闪存计算阵列DBN/s深度信念网络Asics专用集成电路DC/s数据中心EDP能量延迟积DNN/s深度神经网络NPEs神经处理元件DSS决策支持系统SMC智能内存立方体F/BE前端/后端SIMD单指令多数据FNN/s前馈神经网络CNN卷积神经网络Gans生成对抗网络RAPL运行平均功率限制IDE集成开发环境/的adc模数转换器LNU自然对数单位EW元素智慧LRU最近最少使用VMM向量矩阵乘法个lsb最小有效位CSR压缩稀疏行LSTM长短期记忆FPGAs现场可编程门阵列NFV网络功能虚拟化NOC片上网络NLP自然语言处理LoB逻辑库OLAP联机分析处理LUT查找表OLTP联机事务处理ReRAM电阻式随机存取存储器PES处理元件SRAM静态随机存取存储器PIM内存处理DRAM动态随机存取存储器RBN/s受限玻尔兹曼网络SNNs尖峰神经网络RDBMS 关系数据库管理系统MRAM磁性随机存取存储器RL强化学习EXPU指数单位Sdn软件定义网络PCM相变存储器SMT同步多线程DMA动态存储器存取索姆自组织映射Mac乘法累加Tor架顶式DACs数模转换器VM/s虚拟机/sEPR能量精度比VNs / VNE虚拟网络/虚拟网络嵌入RISC-V精简指令集计算机-五H. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报88692018年)。这些结合的概念最终与AI服务完美契合,以实现更灵活,更早期和更智能的BE业务分析决策。同样,流行的云雾服务提供商在计算实例丰富度方面的竞争速度数据中心(DC)的总存储容量已从2015年的382 EB增长到2020年的1.8 ZB(思科,2016年)。在同一时期,BD占总存储数据的27%,到2020年达到247 EB(Cisco,2016)。从那时起,云计算公司已经寻求深入的BD管理和分发软件,以确保增加的parallelism范式以获得前所未有的处理速度(Tsai等人, 2016年)。这种高级云基础设施的可用性还通过强大的VM GPU实现了为多向FE和BE云 雾 应 用 部 署 的 有 前 途 的 AI 即 服 务 2014 年 , 谷 歌 应 用DeepMind2018年,DeepMind从那时起,谷歌和DeepMind团队之间的合作努力带来了大量项目。然而,当每个人都在争论云雾系统中分布式BD技术和AI模型本文件着手讨论通过一个发达的调查,在实现硬件和软件AI和BD处理模型时,正在进行的利益对贪婪功耗的意识有多远受此目标的激励,本文的贡献按以下层次表示:- 作为一个起点,我们对我们的主题调查的第一个问题的回答进行了分析,研究了三个主要参与者之间的现有互操作性:云雾系统,AI服务和分布式BD技术。另外,在人工智能服务和分布式BD技术的支持下,研究了现代云-雾架构及其相关多模式流量的当前配置。- 在评估已实现的基于AI和BD的模型时,仅捕获了与能量分析技术的微小交互,因此开发了许多高级计算领域中的能量和功率测量工具的详尽指南,以增强IT社区对这一持续困境的认识。- 仍然作为这种前瞻性调查的一部分,本文强调了对节能DNN和BD实现解决方案的主导努力,这些解决方案主要表现为高效的可重构加速器设计的形式- 最后,本文总结了两个路线图,包括其他可持续的和有效的AI和BD系统的生命周期管理,在硬件,软件和数据水平的有形检查技术为了更清楚地了解论文概况,下面(图1)展示了处理过的章节2. 研究方法2.1. 询价介绍在准确、快速和可扩展的AI和BD系统以及高能效硬件和软件之间找到协同效应为了实现这些目标,我们进行了一项专题调查,如表1所示,重点关注以下主要目的:- 确定当前对人工智能服务和分布式BD服务管理支持下的现代云雾系统的看法。- 获取当前IT社区对现有计算机架构中的能源和功率分析技术的认识,特别是AI和分布式BD处理基础架构模型。- 制定相关途径,以实现AI和分布式BD处理模型的2.2. 取样和验证来源为了获得决定性的结果,该调查被提交给该领域的专业IT社区(图2a)。第一个社区最初包括谷歌DeepMind科学家,他们已经对谷歌产品进行了尖端研究。然后,嵌入式系统工程师,软件系统工程师和云数据工程师专门从事云硬件和流程运营管理。最后一个类别包括BD和AI开发人员,高级认证数据科学家和Kaggle专家,在AI模型开发和分布式数据库处理方面拥有丰富的经验。为了进一步证明,所获得的200个调查结果已经根据目前的文献进展进行了证明,这些文献是从(图1)中提供的来源收集的。 2 b)。3. AI、BD、云雾系统互通后台为了定义AI和BD模型的有效生命周期管理,深入了解AI,BD和云雾系统互操作性是一个先决条件。在以下各小节中,我们将介绍每一个行为体在与其他利益攸关方的关系方面所做的连续贡献。3.1. 对云-雾体系结构云计算将其传统的基础设施、平台和软件即服务(IaaS、PaaS、SaaS)三大服务扩展到一切即服务(SaaS)概念,提供广泛的按需服务(Deshpande,2020),包括:AI即服务、区块链即服务、数据库即服务、传感即服务等一些特殊的服务不仅不仅面向客户,而且作为所有云层(基础架构、平台和软件)的管理BE实施。遵循PaaS Marketplace目录来实现这种大规模的数据服务,PaaS模型可以处理:使用许多IDE和ARE编程语言进行必要的部署,版本更新和同步,应用程序扩展,然后是数据恢复,隔离和复制(图3)。最后一种模型的一个示例是Red Hat OpenShift云(Revuri等人,2021),使用PHP编程和Apache数据库管理技术执行整个平台任务。内在联系的平台和服务必须在大型计算和存储基础设施的顶部执行,并将虚拟化和容器化作为核心技术。Google(Verma等人,2015)是纯容器化资源的提供商之一,而亚马逊云提供混合VM和容器实例。云计算行业(Revuri等人,2021年)已经在NVIDIA GPU计算方面取得了进展,到2025年将提升到1000倍。现在,许多云行业都提供了功能强大的虚拟机。作为一个实例,AWS云提供了超过223个计算实例(AWS,n.d. ),其中45个GPU实例具有最高96 vCPU、最高786 GiB内存和最高150 GiB网络性能。H. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报8870Fig. 1.纸部分路线图。然而,云内资源不仅仅是服务器,还涉及各种各样的内部DC网络资源。如图3所示,云内网络资源由许多ToR交换机组成,根据许多采用的网络拓扑,ToR交换机可以形成电子交换层或混合电子/光交换层。 传统的三层拓扑(Barroso等人, 2013)、DCell(Guo等人,2008)、BCube(Guo等人, 2009)、Spine-leaf(Alizadeh和Edsall,2013)、VL 2(Greenberg等人, 2009)和无线电收发器(Baccour等人, 2015)是电子开关拓扑的示例。虽然,c-Though( Wang 等 人 , 2010 ) 、 Helios ( Farrington 等 人 , 2010 ) 、Mordia(Porter等人,2013)、光交换架构(OSA)(Chen等人, 2014)和Proteus(Singla等人, 2010)是混合组合的电子和光学开关拓扑的示例。使用上述拓扑之一,整个云内网络资源除了日志引擎管理器之外还需要适当的路由编排和自动化管理虽然每个云内层都需要相应的管理(图1)。 3),云间网络作为一个单独的架构出现,如图所示。 4).分类到云间架构(图 4)传统网络的僵化架构对于云网络中的服务提供变得不灵活。软件定义网络(SDN)和网络功能虚拟化(NFV)也在这个方向上提出了新的观点来应对这一挑战。实际上,将集中式控制平面与整个数据平面(SDN)分离的可靠性提高了在多租户网络基础设施和云提供商中动态路由应用特定波长的能力(Hamzaoui等人, 2021年)。SDN网络中的战略控制平面层可以以集中式或分布式方式构造(图1A)。 4). 此外,许多控制平面功能的灵活性可以随着NFV的出现在后一个概念中,虚拟网络功能( VNF ) 在 软 件 级 别 而 不 是 物 理 设 备 级 别 被 利 用 ( Eramo 和Lavacca,2019),因此资源供应独立于特定的硬件设备。至于数据平面,在多域网络之间流动的应用数据利用经由虚拟网络嵌入(VNE)技术提供的虚拟网络(VN)(Hamzaoui等人,2020年)。为了更好地理解这两个层是如何通信的,开放网络基金会(ONF)(ONF,n. d. )定义了标识数据和 控 制 平 面 如 何 通 过 OpenFlow 协 议 进 行 通 信 的 许 多 SDN 标 准( Tourrilhes 等 人 , 2014 年 ) 。 2014 年 , 开 放 式 网 络 操 作 系 统(ONOS)被设计为SDN操作系统(OS),提供简化的编程接口以灵活地部署动态网络服务。SDN架构中的API通常被称为南接口和北接口。应用和控制器之间的连接由北向接口定义,而物理联网设备和控制器之间的连接由南向接口定义(Tourrilhes等人,2014年)。构成数据平面的地理分布式BD应用通常根据以下三种方式之一来第一种传输类型是批量BD传输(Jin等人, 2016)将单独的作业分配给具有隔离框架的地理分布的DC,以实现更快的处理时间。爆裂(Sadasivarao等人,2013)是另一种BD转移,其中私有云中的计算作业可以迁移或突发到公共云中以增加资源容量。第三个广泛采用的类别涉及BD地理分布框架(例如,MapReduce框架)(Tsai等人,2016年)。后一种传送类别可以在各种布置场景下执行第一种情况(Jayalath等人,2014)将单个云位置的Map任务传输到地理分布的Map任务,然后将中间结果混洗到单个云位置以进行最终的Reduce任务处理。这种安排更适合于中间混洗数据大小,并需要复杂的分布式控制。第二种布置(Jayalath等人, 2014)包括处理地理分布的 MapReduceH. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报8871表1询问/调查问题。调查/询问问题相关部分Q1:人工智能是云雾服务可持续发展的双刃剑- 是/否第4Q2:在云雾系统中部署的最常见的AI应用领域是什么- 计算机视觉和识别第3.3- 业务分析- 自然语言处理- 时间序列预测- 异常检测- 推荐计划- 客户Q3:在以下选择中,最耗能的AI模型是什么- 深度神经网络第3.3- 机器学习模型- 联邦学习模型- Meta学习模型Q4:哪种深度学习模型最有可能部署在云雾系统应用程序中?- ConvNet第3.3- 时间DNN(LSTM/RNN)- GANs- 无监督DNN(SOM/RBN/DBN)- FNNQ5:在评估您的AI模型时,您最感兴趣的指标是什么- 准确度第4.1- 灵活性和可扩展性- 吞吐量和延迟- 能源和电力成本Q6:如果在评估您的AI模型时使用能耗/功耗指标,您最常用的工具或框架是第4.2节Q7:由于人工智能服务的可持续部署和实施是企业和云提供商当前的主要目标,因此这些建议中最具前景的解决方案是什么- 高效加速器设计第4.2- 内存(PIM)处理技术- 参数修剪和模型大小压缩- 高效数据压缩&提高并行度- 处理元件(PE)缩减技术- 高效随机计算推理框架- 高效的容器化部署- 基于高效批处理计算的实时功率控制- 位宽缩减技术Q8:这些流量类型中,哪一种更容易通过云系统和/或雾系统?- 数据密集型工作量第3.2- HPC工作负载- OLAP workload- OLTP工作负载- 批量工作量- 上下文感知交互式工作负载- 高度事务性工作负载- IoT应用工作负载- 任务袋工作负载- 多威胁工作负载Q9:以下哪一个并行BD计算领域最受欢迎?- 分布式内存处理(PIM)- 分布式流处理- 分布式存储系统- 分布式图处理第3.4Q10:要运行上述字段,通常使用哪些分布式编程语言- Hadoop/MapReduce框架第3.4- 火花- 基于云的数据流- Dryad问题11:以下是内存框架的非详尽列表,哪些是最常用的- RAMcloud第3.4- SAP HANA- Apache Ignite- RedisQ12:以下是分布式图处理框架的非详尽列表,哪些是最常用的?- PowerGraph第3.4- Pregel(Google)- GraphLab- GraphX- Giraph- 三一Q13:在这个列表中,哪些是最常见的分布式流处理框架?- Yahoo S4第3.4- Apache Flink- 风暴- Spark Streaming- MiilWheel(Google)(接下页)H. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报8872表1(续)调查/查询问题集相关部分Q14:您认为哪种解决方案在提高分布式(图形/流/内存)处理效率方面最有效- 高效和可重构的加速器设计- 高效内存(PIM)设计- 高效的分布式框架设计- 数据或缓存预取技术- 高效的分布式数据划分和映射- 数据局部性和异构性感知第4.3图二、a)调查IT社区样本,b)验证来源。图三. 通用云内雾架构。任务,然后在单个云位置启动最终结果聚合。这种实现减轻了对先例安排的细粒度控制,但仍然代价高昂。在下面的小节中,我们将重点介绍跨云内和云间环境的多模式流量集。3.2. 穿越云雾系统的在研究了云内和云间架构的最相关组件之后,在本小节中,我们将描述通过云雾系统的一些关键流量特性。(图5)illustrated-H. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报8873见图4。关于云间架构的一般见解。图五. 云和雾系统中的主要多式联运业务(Q8)。对分类结果进行分类,指示每个性质的云和雾系统中的流量百分比。从上面(图5),我们清楚地注意到,一些流量更专用于云计算,一些流量存在于两个系统的几乎相等的工作负载百分比水平,而另一些流量则更专用于雾计算系统。然后我们可以推断,雾系统接收更具体的高度 事 务 性 、 上 下 文 感 知 的 工 作 负 载 , 然 后 是 物 联 网 工 作 负 载(Abualigah等人,2021; Abd Elaziz等人,2021),考虑到它们所要求的快速完成时间,该快速完成时间要求分布式外围处理节点。这些流量类型的大小较小,可以在较短的响应时间内临时处理,而无需购买远程云服务。联机事务处理(OLTP)在两个计算系统中几乎都占相当的比例,因为它是负责维护数据库ACID特性的工作负载类型。事务操作指的是不可分割的任务,例如读和写数据库操作.OLTP事务99%的执行时间都花在服务器线程上。Shore-MT(Ailamaki等人,2013)是传统的基于磁盘的OLTP系统,而VoltDB(VoltDB,2021)和HyperPer(Kemper等人,2011)都是内存中的OLTP系统。使用以下命令比较这三个OLTP数据库上的停顿周期数基于 缓存 未命 中的 方法 (CBM )和 自上 而下 的微 架构 分析 方法(TMAM)(分析和工作负载,2021年),最近部署的英特尔TMAM方法充分代表了所有暂停,其中指令和数据缓存消耗了广泛的FE和BE暂停周期。最近的努力尝试使用一些专用聚类技术来动态地划分事务,例如Strife(Prasaad等人,2020年),以确保可序列化的交易执行。另一方面,任务袋(BoT)是另一种工作负载类型,在云和雾计算系统中几乎以公平的比例存在(Tychalas和Karatza,2020)(图5)。后一种工作流类型(Sun等人,2019)出现在分布式计算平台,如MapReduce,Pegasus和Spark,作为并行系统中工作负载行为的例子。此外,(图。 5)显示了一些主要专用于云系统的工作负载类型的存在。与OLTP系统不同,联机分析处理(OLAP)工作负载由只读和复杂的分析处理查询组成,旨在从数据中提取有价值的信息(分析和工作负载,2021),因此更有可能存在于云系统中。由于传统的OLAP查询偶尔会执行繁重的负载和提取H. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报8874操作,最近的应用,如跟踪系统和欺诈检测(Cuzzocrea等人,n.d. )要求实时分析处理。OLAP工作负载和云DSS的混合形式是调用者批处理工作负 载。这种类型的 工作负载(Taherizadeh和Grobelnik ,2020)指的是作业组(批次),计划在高CPU的同时以非连续的方式进行处理,这与流工作负载不同。与此相适应,批处理计算需要多线程、多进程的数据流。虽然多处理流量会穿过多个处理器,但同时多线程(SMT)或超线程(HT)是一种工作流类型,它跨越在一个处理器中并行运行的多个线程(代码段),从而导致中等的执行时间。大多数云基础设施提供商(例如,Amazon)(Jia等人,2021),主要在x86处理器上启用SMT,许多vCPU虚拟实例在专用硬件线程上运行。HPC和数据密集型流量是两种不同的工作负载类型,主要专用于云系统,并且分别需要高性能的超级计算机和高I/O网络性能吞吐量。最近的出版物强调了支持HPC应用程序的容器化基础设施的需求。作为实例,Charliecloud容器解决方案(Abraham等人,2020年)在HPC Luster并行文件系统下进行测试时,证明了宝贵的启动时间和I/O吞吐量。3.3. 云-雾系统云雾系统和人工智能服务的融合有助于进行有价值的智能云决策提取。(图6a)的分类结果表明,最耗能的AI应用分别是计算机视觉和识别、商业分析、自然语言处理、时间流量预测、异常检测、推荐规划和客户行为预测。计算机视觉是一个AI领域,更精确地使用一些ConvNet DNN(Zhang et al.,(2020年) 6 c),分析许多云视频和图像周围的动作,姿势和笔画。业务分析是另一个基于云的领域,不断发展基于AI的策略,用于分析异构BD业务信息时代。一个最流行的云业务分析用例是BD客户流失预测,通常需要数据融合(Zdravevski等人,2020)和语义(Hussain等人,2021)预处理阶段。另一个基于云的AI子领域是自然语言处理(NLP)。NLP旨在理解自然语言数据,如文档内容,语言和单词知识。这项工作(Qiu et al.,2020)提供了一个专门用于NLP的预训练模型(PTM)的分类,并概述了一些重要的观点,以提高其上限,其中最突出的是超越微调的知识转移。时间DNN(图6 c)也主要用于预测时间帧内(Sudhakar等人,2018)和inter(Miao et al.,2020; Shi和Wang,2018)云流量。在我们之前对五百个主动云调度研究的统计工作中(Ikhlasse等人,2020年),得出的结论是,DNN和Meta学习模型不仅是最能源密集型(图6 b),但也占据了最大的采用比例。异常检测是另一种基于云的AI服务,主要发生在云间级别(Hsu等人,2019),用于实时入侵预测和云安全。该字段提供了一种自动分组结构分段的方法(Kozik和Choras,2015),并在恶意分组到达目标主机之前在网络级别拦截恶意分组(Suga等人,2019年)的报告。根据该统计分析(Ikhlasse等人,2020),推断出云推荐系统主要部署基于相似性的AI技术,通过考虑其与先前请求的相似性或/调查VM和物理主机之间的相似性来估计正在进行的请求的服务可用性以创建迁移图。基于结构相似性的人工智能方法(Nwanganga和Chawla,2019),即使不经常研究,也被用于通过识别类似的工作负载候选来预测未来的云系统行为。然而,云客户行为预测领域仍然是最少征求,从结果(图6 a)和我们以前的统计分析(Ikhlasse等人,2020年)。作为实例,CloudSOC系统(Symantec,n. d. )的开发是为了提供关于各种应用程序、上下文、时间、访问方法等中的每个用户行为模式的基线。考虑到困难,这种系统在许多云-雾环境中仍然很复杂用可行的信息来解释极端变化的交通模式。除了上述人工智能的好处外,基于人工智能的企业和服务还可以通过减少设备和基础设施支出来节省大量资本成本。在所有受关注的人工智能技术中,DNN是目前最受关注的人工智能技术之一。这是无数当代基于云的应用程序的基础(图6b,c)。然而,DNN的准确性提高是有代价的。虽然通用DNN处理引擎一直是许多GPU单元处理的支柱,但它们的能源密集型实现呢它是否在文学作品中得到了类似的关注,或者以某种方式被忽视了?在第4节中,我们探讨了这一困境背后的主要原因,并提供了一些新兴的解决方案。3.4. 支持云雾系统的通过对调研结果的分析,讨论了BD编程模型和框架如何支持云-雾系统中的并行计算。(图7)突出显示了与最受请求的分布式BD计算领域(图7)上获得的百分比分类相关的主要结果。 7 a),大多数部署的BD编程语言(图。 7 b)、最常用的内存中框架(图7c)、最受请求的分布式图处理框架(图7 d)以及最终最受请求的流处理框架(图7 c)。 7 e)。为了提供并行计算,许多BD编程语言可以部署在cloud-fog平台中。根据(图7b)中提到的调查结果,部署最多的BD编程语言分别是:Spark、基于云的数据流、Hadoop/Mapreduce框架和Dyrad。取决于所需的计算速度,这些编程语言的输入数据通常被分类为批处理模式,在该批处理模式中,数据见图6。 能源密集度最高的调查结果:a)人工智能服务应用(第二季度),b)部署的人工智能领域(第三季度)和c)部署的DNN技术(第四季度)。H. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报8875图7.第一次会议。最受欢迎的调查结果:a)分布式BD计算领域(Q9),b)分布式BD编程语言(Q10),c)分布式PIM框架(Q11),d)分布式图处理框架(Q12)和e)分布式流处理框架(Q13)。通常是聚合和有界的,或流模式,其中连续的无界数据流。Apachespark已经成为分布式BD处理的主要选择框架之一,因为它的速度快,并且具有调动大量计算能力的巨大潜力。Spark的核心是在Scala中实现的,并建立在RDD(弹性分布式数据集)的抽象之上,RDD是一个分区的只读记录集合,提供并行和容错的数据结构(Zaharia et al.,2012年)。执行Spark应用程序涉及以下五个关键实体:驱动程序,集群管理器,执行器,任务和工作者(Salloum et al.,2016年)。虽然Spark集群管理一些DevOps管理工作,但Google基于云的数据流是一个统一的自我管理服务,具有独立的负载平衡器和成本控制器。 云数据流中的数据(Akidau等人,2015)作为键、值、事件时间和所需处理时间窗口的元组操作,从而满足复杂的用户需求。因此,Dataflow的核心原语是(Akidau等人,2015):通用ParDo并行处理,然后是GroupByKey 和 GroupByKeyandWindow 聚 合 操 作 。 专 用 于MapReduce的第三个排名(图7b)被云数据流的实时数据处理所超越,因为MapReduce主要专用于批处理。 根据调查结果,Dryad是最不受欢迎的,因为它是最新发布的Microsoft编程语言,专用于学术目的,并使用有向无环图(DAG)实现。 将DryadLINQ、Hadoop和CGL-MapReduce版本应用于具有类似要求的许多数据/计算密集型应用程 序 ( Ekanayake 等 人 , 2009 ) , 已 经 表 明 DryadLINQ 和 CGL-MapReduce技术具有相当的性能,并且对于具有简单通信拓扑的应用程序表现良好。然而,CGL-MapReduce在大多数应用程序用例中表现稍好。上面讨论的BD编程语言用于许多BD并行计算领域,其中根据所获得的结果,最受关注的分别是(图7a):分布式内存处理(PIM)、分布式流处理、分布式图以及最终的分布式存储处理。考虑到现有磁盘系统的相对慢的处理,迭代、分布式和交互式PIM系统被广泛地优先考虑。为了克服缓慢的盘I/O操作并确保快速的数据访问,PIM系统利用快速的动态随机存取存储器(DRAM)和高速缓存单元(Liu等人,2021年)。由于存储单元是易失性的,PIM系统必须采用先进的框架来确保数据的持久性和容错性。因此,我们认为,根据调查结果(图7c),请求最多的框架分别是:Redis(Choi等人,2016 ) 、 SAP HANA ( Lemke 等 人 , 2017 ) , Apach 钙 钛 矿(Tapekhin等人,2019)和最后的RAMCloud(Tinnefeld等人,2013年)。Redis(Zhang等人,2015)是一个轻量级系统的例子,用于缓存具有严格的最近最少使用(LRU)预防机制的键值对象。另外,HANA是一个内存数据库,在同一个数据管理系统中结合了OLAP和为了确保数据存储耐久性和内存中能力的折衷,HANA(Lemke等人,2017)由对非易失性存储设备的预写重做日志记录驱动,其支持慢速块数据传输。分布式流处理排在第二位,因为云-雾系统的输入数据不断增加(图7a)。根据思科白皮书(公开版,2015年),在2015年至2020年期间,流媒体流量占整个云DC工作负载的32%。由于将流转换为批处理分区仍然是低效和潜在的,流系统应该采用先进的流处理框架。根据调查,部署最多的流处理框架结果(图7e)分别是:Apache Flink(Carbone等人,2015)、Spark流(Salloum等人,2016)、YahooS4(Xhafa等人, 2015)、Storm(Chintapalli等人,2016),最后是MillWheel(Akidau等人,2013年)。在微批处理中,Spark流应用DStream作为基本编程抽象(Salloum等人,2016年)。流式传输上下文中的关键参数之一涉及批处理间隔,其应根据目标应用程序的延迟要求来定义。虽然spark流已经是支持许多BD流要求的参考工具,但是Apache Flink(Carbone等人,2015)是另一个最近出现的开源框架,具有较少的配置和中间缓冲池,以确保最佳的延迟和吞吐量。然而,使用相关的机器学习库比较Spark流和Apache Flink的可扩展性(García-Gil等人,2017),实验结果证明Spark MLlib比Flink具有更好的性能和更低的整体运行时间。另一项研究也证明了Storm(Twitter)(Chintapalli等人,2016)和Flink表现为具有较低延迟的真实流媒体系统,而Spark流媒体能够以较高的延迟处理较高的吞吐量。排名第三的是Yahoo Simple Scalable Streaming System(S4)(图7e)。S4(Xhafa等人,2015)是执行相同的处理元件(PE)的分布式通用流处理引擎,由“ZooKeeper”协调并且逻辑上托管在各种处理节点(PN)上。排在最后的MillWheel(Google)(图7e)显示了其持久的容错能力H. Ikhlasse,D.本杰明角Vincent等沙特国王大学学报8876基于BigTable和Spanner的策略,并且被证明更适用于需要保持其一致性和完整性的应用程序(Leon et al., 2014年)。在分布式存储环境中(图7a),cloud-fog基础设施主要需要分区容差特性。根据一致性、可用性和分区容限(CAP)定理(Diack等人,NoSQL分布式存储系统只能满足这个定理的两个特征。这表明NoSQL系统可能被归类为一致和分区容忍(CP)或可用和分区容忍(AP),其 中 可 用 性 或 一 致 性 应 该 放 松 。 与 传 统 的 关 系 数 据 库 管 理 系统(RDBMS)不同,NoSQL系统专注于基本可用的软状态最终一致性(BASE)功能保证(Ganesh Chandra,2015)而不是ACID功能。最后,图处理和划分(图7a)描述了诸如社交网络之类的图应用如何通过连接边(关系)来映射数十亿个实体(顶点)。根据调查结果(图7 d),请求最多的图处理框架分别是:Pregel(Han et al.,2014)、GraphLab(Han等人,2014)、PowerGraph(Gonzalez等人,2012)、GraphX(Salloum等人,2016)、Giovanni(Han等人,2014)和Trinity(Shao等人,2013年)。比较Pregel类系统上的五个数据集上的四种算法,如GPS、Mizan、Giffin和GraphLab(Han等人,2014年),发现GraphLab和Gibrant的同步模式在计算、设置、内存、网络和总时间方面具有良好的整体性能。在流行的图形并行计算平台(PowerGraph、Giragh和GPS)上,在三个真实世界的社交网络图形数据集上使用另外三种算法(Yoshigoe等人,2014年),发现PowerGraph表现出比其他图形并行计算平台更好的处理速率和资源利用率。然而,Spark GraphX(Yoshigoe等人,2014; Salloum等人,2016)与具有大图形尺寸的图形并行系统相比,导致更少的进入时间。关于可伸缩性性能(Yoshigoe等人,2014年),GitHub的表现优于其他平台,因为它在多台机器上的通信开销相对较低,但代价是较低的计算速率。 在本小节中,我们强调了一些关于最受欢迎的调查结果:分布式BD字段,BD编程语言和分布式BD并行计算框架。我们进一步分析了它们与云雾环境的相互作用。为了提供额外的确认,我们已经证明了调查结果在很大程度上与许多文献评估研究相一致。由于在上述分析的评估中使用的大多数指标涉及:响应时间,计算速率,然后是内存网络带宽,我们注意到对消耗的功率和能量指标的显著忽视。 因此,在以下章节中,我们从能源效率和可持续性的角度概述了整个剩余的调查答案。4. 可持续AI和BD系统实施在上面的部分中,我们提供了关于AI领域和分布式BD利益相关者如何为云雾系统做出重大贡献的见解在研究了这些利益相关者之间的健壮组合和互操作性之后,是时候披露他们贪婪的实现消耗和放弃这一挑战的最新尝试了4.1. 计算机体系结构社区中的能量和功率剖析度量为了
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功