没有合适的资源?快使用搜索试试~ 我知道了~
云FPGA高效应用程序调度研究
将应用程序高效调度到云FPGA上马特奥·贝尔托利诺引用此版本:马特奥·贝托利诺将应用程序高效调度到云FPGA上。建模与仿真。巴黎综合理工学院,2021年。英语NNT:2021IPPAT001。电话:03276708HAL Id:tel-03276708https://theses.hal.science/tel-032767082021年7月2日提交HAL是一个多学科的开放获取档案馆,用于存放和传播科学研究文件,无论它们是否已这些文件可能来自法国或国外的教学和研究机构,或来自公共或私人研究中心。L’archive ouverte pluridisciplinaire626将应用程序高效调度到云FPGA上巴黎综合理工学院博士论文巴黎电信筹备巴黎综合理工学院(IPP)Spécialité de doctorat:InformatiqueThèse présentée et soutenue à Sophia Antipolis,le 22/01/2021,parMATTEO BERTOLINO评审团组成:罗伯特·德西蒙尼INRIA Sophia Antipolis总统利利亚纳·库库-格罗斯让INRIA de Paris特别报告员弗雷德里克·卢梭格勒诺布尔-阿尔卑斯大学特别报告员弗雷塞圣艾蒂安大学卢多维奇·阿普夫里列巴黎电信公司雷诺·帕卡莱特Télécom Paris安德里亚·恩里奇诺基亚贝尔实验室法国Co-encadrant de thèseNNT:1简历Cette recherche doctorale a été réalisée en collaboration avec les laboratoiresNokia Bell Labs France et a été aussi financée par eux. 贝尔实验室与电信领域的研 究 密 切 相 关 。 Le domaine de recherche de cette thèse is une étude desalgorithmes de programmation pour FPGA. Cela est motivé par : CPU , 库 存量)。Nous traitons les applications dont les tâches ne peuvent pas correspondreà la fois à la zone FPGA:因为FPGA可以在执行整个应用程序之前重新配置。我们所选择的是重新配置的阶段,这将影响全球的潜在时间这些具有最小延迟时间的平面化算法,对于四位开发者(对于FPGA的更好利用)的使用非常重要正如在第3章中所看到的,大量现有工作的基础是算法和精确度,或者是快速的算法,质量不是最佳在此基础上,提出了一种新的编程解决方案,其质量并不好,因为这些编程人员认为执行时间与这些编程人员相似(对于应用程 序 来 说 , 毫 秒 级 Il existe diffèrent ouvrages connexes qui capturent lesapplications et les architectures en utilisant des modèles trop abstraits pourtrouver de bons ( en ter- mes de temps de latence ) ou décisions valides deprogrammation.(ex:dans第3章我们将介绍FPGA如何代表一个唯一的数字,该数字表示逻辑可重新配置的数量)。为了这个理由,我们将在我们的贡献中,对一个或多个具体的应用程序和架构模式进行计算En raison de lanéciliité croissante pour exécuter des tâches de calcul intensif(ex.:自动识别、信号处理、密码学等)为了使软件的执行不提供足够的性能,云计算架构和CPU的配置也不足够Une solution serait celle d'intégrer l'accélérateur de hard-ware,lequel inclut FPGA et CPU.事实上,它们之间存在着差异,因此它们并不完全相同。此外,一个FPGA可以再加上适应执行一个应用程序donnée,etréciproquement. Pour- tains types de processsus , FPGA ont été détre capabled'assurer une meilleure efficacité énergétique que que le GPU. Dans cedocument,les auxiliary com- parent2在微软Catapult的云系统中的GPU中。 实际上,该实验证明了FPGA执行过程中的一种能量效率Les applications pour lesquelles FPGA sont le plus pratiques includes les appli-cations hautement parallèles et/ou avec des opérations élémentaires whi neconvi- ennent pas bien dans le modèles de programmation CPU or GPUS ,parexemple,le changement de bit,les données personnalisés avec de largeurs debits non-standard,etc. Les canaux qui codent et décodent les algorithms dans latélécommunication sont de bons applications.在这些情况下,自动分类和深度分类算法也可以用于好的候选人,特别是用于非标准表示的分类器和数据类型 Un autre applle est montré dans le chapitre 3 , optimle temps etLesapplications sliding-window sont une typologie spéciale de treitement de sig-naux numérique qui consiste à glisser un signal plus petit , appelée window(fenêtre),à travers différentes positions dans un signal plus grand.(ex一个图像)。窗户的位置(fenêtre),它也是一个执行计算的工具。GPU是用于并行计算的专用处理器,在SIMD操作或浮点运算方面,FPGA也是一个重要的浮点运算名称Le rendu graphe is un applicable d'application dans laquelle le GPU isun adjustement naturel en raison du treitement à virgule flottante avementparallèle. Les autres traiffic de signal , Les accéléração jouent un rolefundamental dans le cloud computing.在这一点上,我们关注FPGA。就像我们所看到的,FPGA云就像其他信息资源或存储一样,通过云计算的最终利用率也会下降,因此,它将成为虚拟化的一部分。根据软件即服务(SaaS)的范例,通过FPGA(或通过FPGAs)提供的服务不能通过APIs访问。FPGA peuventêtre partagé et leurs usages est multiplexé entre les usagers de plusieursmanière:synchronization,espacement etc.在最大限度地减少应用程序执行时间(延迟时间)的过程中,所提出的编程解决方案是按用户付费的一个优势。实际上,再加上延迟时间的执行是最佳的,而且延迟时间对资源材料(硬件)的影响最小。在现代数据中心的云计算中,FPGAs不是架构3organisés en groupes]. Les applications qui sont l'objectif de cette thèse contien- nentun grand nombre de tâches dépendantes et potentiellement parallèles.Un autreapplicable est例如, Spark 将批次的延迟时间流到最后的时间。Les solutionsexistantes pour la programmation des applica- tions peuvent être divisées en macro-familles. 在 此 之 前 , 我 们 avons des solutions qui se basent sur des formulationsmathématiques exactes(ex.:programmation MILP)。Elles assurent des solutionsexactes au prix d'un temps d'exécutions po- tentiellement haut(jusqu 'à heures,jours oecumannées en accord avec la grandeur du problème).这是一个解决方案的巨大空间,它体现了我们所面临的方案编制问题。影响问题严重性的参数包括但不限于:各环节的依赖性、执行时间、资源需求数量、重构时间、FPGA特性一个很好的家庭代表了这些企业家。我们对清单上的清单感兴趣。在基于列表的数据库中,不要在一个优先级和分配列表中尝试单独的tâches sont triées,enséquence,à la première unité disponible que correspond à extensive demande deresources 。Les priorités peuvent être assignées de façon statique ou dynamiqueselon le différents caractéristiques , ex. : le temps d'exécution ococcupation desresources. 基于列表的方法在这一命题上有两个优点,即(i)它们在具有可实现的对雇员的认识的执行工作中同样有效,(ii)它们在执行时间上更快。在第三章中,数学家们计算出了一种编程解决方案,这种解决方案主要是通过我们的方法计算延迟时间。基于元启发式算法的研究包括遗传算法、模拟退火算法、禁忌搜索算法等。一般而言,MHs在解决方案空间的一个整体迭代中开始了一个初始解决方案,并探索了一个问题。Leur使用一种特殊意义上的解决方案的空间是非常大的探索,就像FPGA上的tâches的静态平面化问题一样。MHS可以应用于各种各样的问题。相反,我们的解决方案,就像在第三章中明确说明FPGA和与之相关的假设一样。 此外,他们四人都知道高质量的解决方案,但计算的时间比我们的贡献还要长。对于简历,这些解决方案MH提供了一个好的解决方案,它需要大量的时间来计算,而基于列表的计算方法并不提供快速的好的解决方案。就像 我 们 所 看 到 的 那 样 , Slot effectué de manière rapide et troove une solutionmeilleure que les list-based economistiques.在这一点上,我们强调4在FPGA上的应用。我们假设这些应用程序不是由独立的(可扩展的)DAGs组成。 Ainsi nous supposons que la somme des matérielles pour chaque tâche àexécuter dans le FPGA excède les matérielles de le FPGA.相应地,我们的应用程序需要执行两个阶段的重新配置。Chaque stage de reconfiguration est ainsicomposé重新配置的各个阶段是按顺序执行的,而重新配置的各个阶段的顺序取决于DAG的供应情况。在其他情况下,如果tâche B依赖于tâche A,则tâche A不能参与重构阶段,因为重构阶段适合于包括tâche B的如果tâche A和tâche B在重新配置的同一阶段,则A在B开始执行之前完全执行。此外,重新配置阶段的建设影响了因此,编程的主要问题在于快速识别重新FPGA上的编程与CPU上的编程不同。En effet,:memoires,registres,noyaux etc.另外,les resources hardware du CPU et des FPGA ne sont pas suffisantes pour exé-cuter toutes les tâches d'une application. Néanmoins,passer d'une tâche à uneautre dans les CPU est souvent plus rapide que reconfigurer un FPGA.因此,重新配置一个FPGA可以引入一个可以与HET进行比较的因此,在重新配置阶段,必须执行的执行程序的选择对FPGAs产生了重大影响,因为选择的FPGAs对转换器来说是相似的。此外,由于这一额外费用,FPGAs上的重新配置变得更加频繁,因为处理器上的上下文发生了变化。我们在这些问题中遇到的编程问题类似于资源约束调度问题(Resource-Constrained Scheduling向区域社会保障方案通报有关资源和活动的情况。联合国区域社会保障方案也提出了有关资源的需求,这些需求来自于现有的关系。Un RCSP consiste à finding aschedule of minimum duration en assignant un temps de départ à chaque activitéainsi les relations précédentes et les resources disponibles sont respectées.RCSP经典的第三章中的城市工作是一个NP难的大问题。此外,RCSP classique的研究存在显著差异,因为重新配置的FPGA在解决方案空间中提供了一个新变量,而附加费对总延迟时间的贡献不高。在考虑到不同的问题时,我们可以提出以下几点:(一)5meilleure solution n'est toujours celle qui possède un plus petit nombre dereconfiguration- urations et(ii)la mesure clé est la quantité de temps utilisé pourexécuter les tâches de façon parallèle et qui peuvent être aussi maximisés. 在这样做之后,消费和时间的关系可能会被认为是非常重要的,因为它们是潜在的优势和优势。Notre solution essaye de minimiser le temps de latenceComme montré dansles sections précédentes,le parallélisme entre tâches et tâche dominant(ex.:tâches qui ont des HET plus élevés)sont les points clé des problèmes qui sonttraités par nos solutions.实际上,我们的解决办法是选择主导的环节,我们也要把主导的环节与一个可以并行执行的环节的小组平行地安排。在选择与主塔平行的塔时,我们考虑了所有的图表,而不是确定主塔与平行塔之间的平行度。此外,我们的决定考虑了所需的资源和测试的HET、对测试的依赖性、FPGA的特性和重新配置的时间。Parmi toutes les tâches possibles whi peuventêtre mises en parvec la tâche dominante,nous definissons,dans ce travail,unapproche de base quUne fois que la tâche dominante et les tâches mises en parallèle ont été sélec-tionnées grâce au service de notation(ex.:la creation d'un stage de reconfigura-tion ) , le graphe a été remanié pour fusionner toutes les tâches qui ont étésélection- nées dans cette itération dans un nÜud unique.通过迭代,它创建了一个新的重新配置阶段,并且这些tâches在一个新的图表中融合在一起。L'input dugraphe devient une séquence de stages de reconfigura- tion.这一系列试验表明了选择 方 案 的 可 行 性 。 Pour rappel , un stage de reconfiguration consient lareconfiguration totale du FPGA suivi par 如 同 第 4 章 中 的 montre le chapitre 4 unprocessusd'optimizationfinaleessaiedeCharterdavantagelesstagesdereconfiguration afin de continuer à réduire le temps de latence. Notre apache mire àidentifier,très probablement,une bonne solution,que va minimiser le temps delatence,parce que au lieur de considerer seulement une partie donnée du graphecomme quand begin de la tâche initiale , nous préférons considerer la tâchedominante(quelle que soit son emplacement dans le graphe)et le parallelisme pluspowissant du graphe pour mieux exploiter la capacité de parallelisme des FPGA.第四章中出现了这一现象,而第五章中出现了这一现象的有效性。Les FPGA modernesne sont pas simplement un récipient de hardware reconfigurable mais ils peuventaussi incorporerL’un des pionniers de ce type hétérogène de hardware reconfigurablepar un software est le dispositif 从现在开始,6有不同的改进。同时,Stellarton的产品在同一块板上分布有一个处理器IntelAtom E6XX 和 一 个 FPGA Intel 。 La dernière tendance pour le calculLe calculintensif n'est pas le acoustic domaine dans lequel les processeurs et lesaccélérastic travaillent ensemble , parce qu'il est très commun dans lesinfrastructures cloud.我们在这类问题中遇到的编程问题与资源约束调度问题(RCSP)类似。Les RCSP sont des problèmes programmés dont la programma-tion est influencée par la disponibilité ou le manque de resources.这意味着,由于资源限制的原因,必须在一定时间内加以应用。第3章定义了RCSP的通用性,并介绍了FPGA专用编程的方法。剩下的工作由两个不同的方面组成。Onanalyze comme chaque chaque(ex.:application et architecture)est modeléeavec la contribution du programme FPGA.此外,还介绍了FPGAs应用程序计算所需的输入、输出、假设、模型和参数。Les modèles sont utilisés pour décrireles applications et aussi l'architecture.关于应用程序,我们着重于提出模型化的假设,以便捕获与程序设计有关的输入Les modèles utilisés dans les problèmesde la programmation ont généralement beaucoup plus de paramètres grossièresque les modèles utilisés par les travaux dont它可以把同样的话语用于建筑:comme nous verrons,les FPGA sont caractérisés par une architecture这些细节与方案编 制无关。 Les stratégies de programmation peuvent , eneffet,faire une abstraction des parametres avec un- pact négigable sur le temps首先,第3章阐述了FPGA架构的改进工作。Les modèles imprécis(ex.:lesmodèles whi ne considèrent pas les details pertinents à la programmation )pourraientmeneràdessolutionsdeprogrammationsous-optimalesorprogrammations.Modelerestimportantmaissinousfaisonsunecomparaisonaveclaprogrammation-tion , l'algorithmeutilisépourrésoudreleproblèmedeprogrammation est également important. 在这种情况下,我们将设计类似于“编程策略”的解决方案的算法。此外,还将说明方案编制战略的主要内容,并将其作为一个大部分。我们根据战略对原则性7程序设计。一般而言,方案拟订战略可以基于元哲学或哲学。此外,我们还将最后 的 问 题 分 为 基 于 列 表 的 问 题 和 基 于 包 装 的 问 题 。 Nous préférons nousconcentrer seulement sur certaines de ces catégories pour les solutions d'hautequalité qu'elles fournissent ( ex. : meta-acquistiques , formulations exactes ) oupour le temps d'exécution très rapide ( ex. : 基 于 列 表 的 编 程 算 法 ) 。 Lacontribution de cette thèse peut être placée dans la catégorie“packing-based”(ex.:les algorithmes qui prennent des décisions considérant les groupes des tâches. Celapermet d'atteindre des résultats qui peuvent se- parer avec les meta-economistiquesen termes de qualité tandis que maintenir le temps d'exécution peut être comparableaux list-based economistiques. Pour ne pas être in-complète , les formulationsmathématiques exactes peuvent être utilisées comme specification du problemégalement par les exactes non exactes.Afin d'évaluer la qualité du planning calculé par le Slot,we devons comparer得到的潜伏期时间绝对是最佳的。 因此,在此之前,我们将对FPGA编程问题进行建模,并利用这些方法解决这些问题。Nous choisissons d'utiliser le Mixed LinearProgramming ( MILP ) parce qu'il mixed adapté pour ces types de problèmesd'optimization. Puis nous désignons un générateur d'instance aléatoire pour générerun problème de programmation du FPGA. Nous résoudrons ces instances avec unsolveur MILP pour obtenir un temps de latence mineur et le- parer avec le temps delatence trouvé par le Slot dans les mêmes cas.我们还要比较两种方法的执行时间。恩芬, 我们将Slot的质量和执行时间与HEFT-NF的性能进行了比较。我们最熟悉的HEFT-NF是一个可与Slot相媲美的合理的提议。在估值的第一章中,我们认为不可能对计算的时间点进行精确的分析。而且,我们也会评论我们捕获的硬件资源和应用程序。我们将讲述Slot的原理,并讨论复杂的理论。我们认为,Slot算法是对FPGA并行化重构阶段的智能计算。Lechapitre suivant vous montrera l'évaluation d'un Slot sur un indice de rérence syn-thétique composé par différentes instances générées de manière pseudo-aléatoire.特别是,我们将通过插槽和执行时间来评估编程产品解决方案的质量Nous comptons sur le fait que le Slot pourrait être également intéressant pour ledesign du système intégré pour. 此外,在这个章节中,我们将Slot应用于云计算中心的不同背景中,就像模型驱动工程一样。Model-Driven Engineering(hautniveau)模型驱动工程8intégré en offrant des modèles dédiés pour capturer des composants hétérogènes dehardware/software.这些模型可以代表一个应用程序,一个印版,并且在一个应用程序中可以在印版上映射。此外,这些模型还可以转换成可执行模型生成器(用于验证模型或用于仿真鳍)和高级模型的可执行代码。Grâce à leurs abstractionsinternes , les modèles devraient aider à se concentrer sur les aspects les plusimportants du système.考虑到FPGA,我们认为这两个重要的特性在考虑:硬件的并行性和动态重新配置为了更好地支持集成系统的设计,我们在一个叫做TTool的模型驱动工程( MDE ) 框架中集成了一个Slot 。 TTool est un instrument gratuit et open-source qui acquitte différents stages de décement- ment avec UML/SysML(ex.:determinations des besoins,analyses,partitioning hardware/software et designsoftware(intégré).通过MDE、TTool等不同工具的选择,TTool可以有效地支持信号治疗应用。Nous avons intégré le Slot aux TTool/DIPLODOCUS à travers unplugin. TTool/DIPLODOCUS能够代表FPGAs和动态重建,以实现FPGA上的tâchesmappés仿真。再来一次,主要是FPGA的编程。Étant donné une applicationmappée sur le FPGA,le Slot peut être appliqué pour determiner les stages dereconfiguration de la programmation.Cet information de programmation peutêtre translation au moteur de simulation未来的工作将在7号礼拜堂的不同建筑中进行。 实际上,我们希望将Slot的原理应用于其他类型的情况,这些情况在相关项目中得到验证我们向演讲者报告,Slot的主要阶段是:(一)优先考虑主导阶段,(二)从 主 导 阶 段 开 始 产 生一 个 整 体 的 重 新 配 置 阶 段 ,㈢对重组阶段的评估,并提高全球潜在时间(pour cela nous utilisons un système de notation)et(iv)optimizer davantage lasolution en acceptant les stages de reconfiguration sélectionnés. Grâce àAinsi nous proposons les six directions suivantes:Pour résoudre les problèmes9我们认为,Slot不适合重组候选阶段的名称,即使捐助者的依赖性和可用资源有限,也不适合重组候选阶段的名称。Cela pouut affecter le tempsLa programmation des tâches que peut requêter des resources programméesdependantes:nous avons classifié les resources en deux typologies:appelé programming-independent et programming-dependent resources.一个独立的资源是一个资源,qu安西,我有一个请求一种特殊的独立于系统的资源(tels que LE),如果没有重新配置的阶段,可以简单地调整两个系统。一个依赖于能量的资源是一个可以分配给一个tâche的资源,用于整个tâche期间。最后一天是重新配置阶段的整个生命的最后一天。Lestâches qui enquêtent une hacking-dependent resource excèdent la limite physiquepour un FPGA spé- cifique qui faire partie du même stage de reconfiguration comme一个有趣的讨论是,当所有组成不同应用程序图形的控件时,插槽工作量最大。实际上,在应用程序图表的情况下,在不同的图表方中存在多个相同的实例,我们认为,重新配置阶段的计算方法非常明确 此外,在Slot future中,应考虑多次实施,以便同时进行,并决定是否可以通过延迟时间的减少来实现。Le Slot courant est appliqué à une ou plusieurs applications qui sont exécutéessur un fixel FPGA.In future , nous planifions deSi nous supposons que cettelatence est vraabolishbasse au regard du HET des tâches et au regard de lareconfiguration du FPGA,une solution pourrait simplement être celle最后,我们的目标是在云计算中心的背景下适应动态变化。特别是,我们可以将新应用程序分配给一个FPGA来执行一个应用程序。Ce t presente la programmation des applications sur les FPGAs. Nous avonssupposé que les applications sont composées par des tâches dépendantes et lesFPGAs soient totalement reconfigurés.但这是为了最大限度地减少应用程序的延迟时间我们将为这些中心作出贡献10你是云。我们的蒙特罗斯评论了云计算中心的架构,集成了硬件的加速,就像FPGA一样,以支持计算能力方面的应用程序。Le travail connexe montre quetoutes ces approaches existantes ne peuvent pas respondre de façon efficace à notreproblématique.我们认为,Slot、Laquelle提供了一个解决方案质量(延迟时间)和执行时间之间的公正折衷,以便识别该解决方案。插槽是基于一个迭代过程。首先,我们要考虑所有的图形和图形的主要部分。 Dès les stages de reconfigura-tion qui pe
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功