片上网络拥塞避免与QoS的增强路由器架构设计及性能分析

73 浏览量更新于2024-01-14 收藏 1019KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

Journalof King Saud University沙特国王大学沙特国王大学学报www.ksu.edu.sawww.sciencedirect.com片上网络中缓冲器和无缓冲器数据流控制方案的拥塞避免效率Ahmed Aldammas*，Adel Soudani，Abdullah Al-Dhelaan沙特阿拉伯沙特国王大学计算机和信息科学学院接收日期：2015年5月27日;修订日期：2015年11月24日;接受日期：2015年2015年12月15日在线发布摘要片上多处理器系统中高效通信架构的设计涉及到片上网络（NoC）基础设施中使用的内部路由器功能的许多挑战。片上路由器应设计为提供具有增强粒度的per-acquisit处理。实际上，在应用程序级别体验的服务质量取决于路由器避免拥塞和确保有效数据流控制的能力。因此，需要增强的路由器架构来实现所要求的QoS。本文提出了一种内部路由器架构，片上通信，实现拥塞避免与QoS的考虑的拥塞控制机制。它描述了这种路由器的内部功能，最佳输出的调度和它的能力，以适用于入站数据流的每类服务。本文主要集中在描述和性能分析的两个建议方案的数据流控制，可用于拟议的路由器架构。本文所示的结果证明，这些建议的方案在NoC中的应用实现了一个有趣的增强测量端到端的QoS。我们进行了广泛的比较，所提出的解决方案与文献中公布的现有方案，以表明所提出的解决方案优于这些，保持一个有趣的权衡与硬件特性时，设计与45纳米集成技术。©2015作者。制作和主办由爱思唯尔B.V.代表沙特国王大学。这是CC BY-NC-ND许可下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。*通讯作者。电子邮件地址：bindammas@student.ksu.edu.sa（A.Aldammas），asoudani@ksu.edu.sa（A.Soudani），dhelaan@ksu.edu.sa（A.Al-Dhelaan）。沙特国王大学负责同行审查1. 介绍多处理器片上系统（MP-SoC）的通信问题是新一代嵌入式系统面临的最大挑战之一许多积极的研究都致力于为这些系统设计一个有效的通信架构。从深度上讲，片上网络（Networks-on-Chip，NoC）用于多核互连，其特点是路由器之间的高带宽链路，这是由于高频率http://dx.doi.org/10.1016/j.jksuci.2015.11.0021319-1578© 2015作者。制作和主办由爱思唯尔B.V.代表沙特国王大学。这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier关键词片上网络;拥塞控制;数据流控制;飞行器服务质量（QoS）保险缓冲器和无缓冲器数据流控制方案的效率185的芯片。然而，集成电路的存储器部分的面积成本极大地限制了路由器的存储器容量，这限制了其吸收大量流量突发的能力。这些路由器内存的缺乏使网络面临拥塞问题。它会导致大量的带宽损失和开销延迟，严重影响应用程序的感知服务质量。这些系统的有效设计需要考虑并结合不同的约束。特别地，嵌入式硬件约束必须与联网约束同时考虑，以便演进NoC以满足端到端QoS（例如，端到端QoS）的要求。以结束延迟、抖动变化、丢失的字节数、吞吐量在接收层等）。在这方面，为面向计算机网络的路由器设计的数据流和拥塞控制机制在我们的上下文中不适用最近，超大规模集成（VLSI）技术为数字电路的设计者提供了一个灵活而强大的环境（Chen等人，2009年）。实际上，它允许在所使用的算法的复杂性和所设计的电路的成本之间保持折衷。因此，在NoC路由器中管理QoS的附加任务有了这种解释，主要的挑战在于，在规范和实施适用于片上通信的拥塞控制的有效方案。NoC路由器中的高突发到达率需要用于传入突发的内部排队的增强方案，该增强方案有助于根据它们的QoS约束同时考虑路由器瞬时负载来处理和转发它们。为了实现这一目标，应该根据所传输的数据包的有效载荷数据类型本文的主要贡献是，然后，提出了一种新的体系结构的NoC路由器与拥塞控制的综合机制。它提出了两种方案的拥塞控制方面的端到端的QoS要求。第一个提出的方案是基于输出缓冲的缓存，它们被注入到下一跳，正在经历拥塞。第二种方案称为反馈信令机制，它是一种无缓冲区的方法，基于拥塞时源和路由器之间的相互作用来通知源减小其发送窗口大小。本文通过比较两种拥塞控制方案在QoS方面的性能，评估了所提出的拥塞控制方案在不同业务负载下的效率。本文的其余部分分为以下几节。我们首先调查了芯片上网络中拥塞和数据流控制领域的主要现有贡献。其次，我们提出了建议的路由器结构和建议的方案，数据流和拥塞控制。然后，我们将集中在QoS和拥塞控制方面的QoS控制机制的评估。最后，我们讨论了我们提出的路由器的硬件特点，结束之前的结论和未来的工作方向。2. 相关工作NoC通信以其高带宽的特点成为近年来的研究热点，主要研究数据流控制和拥塞管理主要目标是提高带宽分配的效率，同时避免路由器饱和。基于业务感知的自适应路由过程的流量平衡是实现负载公平性的一种有趣方法（Wang等人，2012年）。这种解决方案通常涉及邻居之间的负载状态和链路利用率的交换，根据这些交换的数据优化路由过程Lot fi-Kamran等人（2010）的作者研究了一种基于动态XY路由（DyXY）的拥塞避免新解决方案。在他们的方法中，称为增强型动态XY（EDXY）路由，每个路由器通过一个两位总线向其邻居发送拥塞信号。所提出的解决方案使所有数据流避免尝试共享同一路径，从而减少数据流量拥塞。此解决方案的性能分析表明，这些路由器上的数据包延迟效果良好，优于直接XY路由方法。然而，该方案没有将拥塞问题作为一种普遍现象来解决，即使有交通分布，拥塞也可能影响网络。在Wang等人（2013）中，提出了一种使用能量和缓冲器感知的自适应路由算法（EBAR）的方案来在NoC中分配热能。其主要思想是共享数据流量，以实现整个NoC的最佳热分布，同时保持公平的通信性能。为此，路由器的路由是基于下一跳的热状态，避免高温路由器在通信path.Thermal 管理是一个关键问题，在集成系统芯片（SoC）的设计，但从通信的角度来看，所提出的方法并没有解决拥塞问题。已经提出了基于信令的拥塞感知技术作为本地共享路由器缓冲区状态的有效方法（Aci和Akay，2010; Kaddachi等人，2008;Daneshtalab等人，2012年）。其目的是为了避免通信路径中的拥塞区域。应用这种方法需要使用额外的总线或由多路复用器携带的附加数据来广播拥塞信息。我们认为这一方法很有意义;然而，我们认为，应通过采用适当的流量控制机制来加强这一方法Ebrahimi等人（2012）研究了一种使用本地和非本地网络信息的路由过程的新算法。所提出的方案，称为拥塞感知梯形路由算法（CATRA），定义了一组节点，这些节点可能会参与数据通信路径的基础上，他们的拥塞状态。拥塞信息通过一条额外的总线进行传播，该总线允许在不增加流量的情况下实时更新。文中讨论了该方案的硬件实现，从电路面积和功耗两方面论证了实现该方案所需的额外成本是合理的。虽然这种方法似乎对NoC实现有吸引力，但该论文没有显示出在应用级别对端到端QoS的任何增强，这将是证明其采用的主要论据。Becker等人提出了一种气流控制方法。（2012年）。所提出的解决方案旨在控制每个数据流的输入缓冲器占用。所提出的方案determi- nes信用允许每个虚拟信道的基础上的性能观察。作者证明了这种方法的有效性，但他们没有研究其功耗。186A. Aldammas等人Peh和Dally（2000）中的作者提出了一种数据流控制过程，其使用为数据流保留缓冲器空间和链路带宽的预留机制。预留机制提高了缓冲区空间利用率。实际上，保留的缓冲器空间是动态改变的，这意味着缓冲器将对于另一数据流的下一次传输是空闲的。此方法最大限度地减少了在执行事务时的延迟。在van den Brand等人（2007）中已经提出了用于NoC中的通信的切换控制方法。建议的方法是基于使用一个新的服务定义的策略称为拥塞控制的最佳努力（CCBE）。CCBE使用链路利用率作为拥塞度量来控制带宽使用，以提供具有恒定延迟和减少延迟的带宽。事实上，集中式预测算法（模型预测控制器或MPC）不断地监督链路利用率作为拥塞度量，以确定连接的负载。由硬件分析探测器获得的测量结果被发送到MPC，MPC基于它使用该信息做出的预测来决定CCBE负载。另外的研究已经解决了NoC中的拥塞避免和负载共享的问题（Mishra等人，2 0 1 1 ;Ascia等人，2006; Kumar和Mahapatra，2005;Rijpkema等人，2003年）。然而，我们认为，一些贡献涉及到可能有效地管理拥塞，同时保持最佳的QoS粒度的每一个QoS管理方案。我们认为，然后，有必要设计一个增强的路由器架构，实现一个适当的数据流控制方法，以及一个合适的内部处理方案，为每一跳事务。本文的剩余部分介绍了我们在这方面的贡献，解决了一个芯片上路由器的微架构的设计，具有增强的能力，以避免和解决拥塞。同时考虑端到端QoS。3. 建议的路由器架构图1给出了用于片上通信的拟议路由器的一般内部架构。它是Adel等人（2014）研究的架构的增强版本。主要的新贡献涉及到一个QoS控制机制的集成和架构的有效端到端QoS的充分性。建议的架构是一个模块化的，可扩展的系统，集成了新的控制和数据流管理功能。它针对数据流的特点进行个性化处理，是一种新颖的方法。微片布局包括一组字段，可以执行粒度路由，允许路由器根据其约束处理传递的微片。在这种架构中，通信数据流根据其服务类别进行处理，并将分类作为路由器内部存储器中的数据流队列进行检查。调度路由过程中的拥塞以及与拥塞避免相关的机制当检测到拥塞时，一种特定的机制会根据拥塞的重要性然后将标签与分组中的优先级有效载荷的重要性相此外，遇到拥塞的路由器会指示其邻居更新路由表。这种方法赋予路由器更多的自主权，使其能够做出有关拥塞管理的本地决策，从而优化网络资源的使用，以实现有效的数据传输。特定的架构包括不同的块，每个块都实现一个内部任务，用于处理遍历跳的数据包。所有这些内部元件都由外部时钟信号同步。输入FIFO：这些输入队列用于保持来自相邻路由器的异步传入队列。它们的深度定义了路由器吸收突发传入干扰的能力。在结构方面，输入FIFO在物理上是独立的，并单独管理。flit classifier ：这个模块负责根据服务类标识符（id_serv）识别flit。在每个时钟周期，它都会从连接路由器与其邻居的输入FIFO中提取缓存。然后，id_serv用于将接收到的数据排入队列，以将其相应的虚拟排入队列，该虚拟排入队列位于用于此目的的公共服务类存储器中。这种分类有助于稍后根据服务约束执行可扩展输出交付。中央存储器：此存储器在不同的服务类别中排队（参见图1）。用于转发到其目的地的优先级的提取由输出调度过程执行，与其服务类别的权重成比例。存储器占用管理器永久地控制存储器中的入队列的深度，图1路由器的内部硬件架构调度器南港东港西港北港本地港输入端口FIFOOut_Ports数据流量控制信号流量控制信号邻居信号和数据控制表路由流量控制过程签名块内存占用管理器（类似WRED）类服务存储器路由过程微片分类器●●●缓冲器和无缓冲器数据流控制方案的效率187XX估计存储器占用状态。超过一定的占用阈值，内存被认为是满载的，并且该过程开始从队列尾部中选择来自每个通信过程的要丢弃的不太重要的字节，以避免路由器拥塞。调度进程：这个块将内存与路由进程连接起来。它从存储器输出中提取数据并将其转发给路由过程。它基于加权轮循（WRR）类算法。事实上，它为每个服务类别i关联权重（ Wi ）。从四类服务中按比例提取权重（Wi）。其思想是根据服务质量约束来处理传入的数据流，同时最大化路由器在所提出的架构中，在每个时钟周期中，路由块能够处理最多五个具有不同目的地址的字节。调度机制旨在最大化在每个时钟周期中处理的时钟的数量。优化路由器的输出传递将减少内存负载。在每个时钟周期中，输出调度器从存储器中提取具有不同目的地地址的最高数量的字节，这些字节可以在一个时钟周期中转发到路由器的不同输出端口。如果我们考虑，在输出调度周期中，排队进入服务类别（i）的具有不同目的地的微流的数量由Flit_class_i（等式2）定义。（1））：MaxClassi虚拟电路的概念，其通过时分多址概念改进了带宽分配（Ascia等人，2006; Palesi等人， 2006年）。通信过程开始于头数据微片的传输，其中包含有关进程标识符（id_proc）、源地址和目的地址的信息。该数据包中的信息用于为其余数据包建立虚拟电路。每个路由器都有一个所有相邻路由器流量负载的内部表示。然后，路由算法将倾向于应用直接X-Y当前路由器将使用这两条信息（id_proc、output_port）更新路由表。以下所有具有相同id_proc的传入数据包将使用路由表中的更新信息通过同一通道转发。在接收到end_data_flit之后，终止所创建的虚拟信道。信令块：该块实现与网络中的信令过程相关的一些任务。它生成并广播来自异步路由器的信令，以便用新的流量负载状态更新相邻路由器。该块分析新接收到的信令报文，以便用相邻路由更新内部路由表。Flit class i¼j¼0flitj1路由器 states. 的信息存储在这表需要在路径建立过程期间管理报头。这个区块会与这个等式表示了调度程序可以从一个服务类中提取。方程式中的MaxClassi（1）由分配给服务(i) 当执行WRR类算法时。MaxClassi¼xi;其中i2 f1：： 4g2在这个建议的路由器架构中，路由块触发输出调度过程。当调度器被触发时，在一个调度周期期间它将传送到路由块的字节数由等式（1）表示（3）和（4）。所有选定的端口都应分配不同的输出端口：4MaxClassi存储器控制器，以便获得存储器的更新状态。内存占用管理器块：该块使用基于加权随机早期检测的方法，在需要时丢弃低重要性传入的缓存，以避免内存拥塞。当内存占用率高于最大阈值时，它开始从内存中删除低重要性字节，并根据其服务类（id_serv）和重要性标签（pr_tag）从字节分类器的输出中删除低重要性字节。所有服务类别的优先级均按比例从四个扩展，并按IP核（智能属性）。NbrFlit¼1/1Xj¼0flitzh内存占用管理器通过丢弃具有最低优先级（pr_tag=0）的缓存来启动。如果所有具有最低优先级的路由器都被丢弃，并且路由器仍处于连接状态，NbrFlit65英寸4英寸如该等式所示，在一个输出调度周期中，可能涉及所有类别的服务。因此，虽然这种基于WRR类机制的方法允许路由器根据它们的权重（Wi）从不同的服务类别发送出可变数量的多个比特因此，它最大限度地减少了内存中等待的队列长度，从而减少了事务时间并避免了拥塞。路由块：这是NoC路由器中的主要块。它基于虫洞技术路由不同的传入数据，并允许使用在获得之后，开始丢弃下一个最高优先级的传入拥塞，以减少解决拥塞所需的时间。4. 一般协议结构和协议类型在所提出的通信协议中，我们定义了两种类型的数据包：数据包和信令包。为了保持可扩展性，并匹配硬件数据总线和内部路由器缓冲区的限制，我们选择了一个固定的32位字节大小为所有的字节类型。数据微片专用于IP之间的数据传输。在通信过程中，需要三种类型的数据传输：●●●●188A. Aldammas等人头数据微片：虫洞交换技术基于源IP和目的IP之间的路由建立（具有物理复用信道）（ Ni 和 McKinley ，1993）。在所提出的架构中，路由建立考虑了与预期过程相关的一些信息，例如服务标识符类（Id- serv）。此外，路由建立主要是通过研究预期的路径中NoC路由器的物理状态来增强。通过相邻路由器之间的信令过程来提供该信息，该信息量化了可用的存储器空间和所考虑的服务类别中的队列中等待队列的长度图2描述了我们的方法中使用的头部数据的处理连续数据微片：在数据包传输期间，在源和目的地之间建立通信路径之后，处理这种微片类型。它传输数据负载。在这个例子中，进程标识符Id_proc用于识别连接的路由器的输出端口，使用必须在每个进程开始和结束时更新的本地交换表。End-data flit：这与data flit具有相同的结构，但是它的到达触发了为当前通信过程保留的资源的释放。信令微片由路由器在状态改变时生成。它们在相邻路由器之间携带有用的信息，以便为每个路由器提供其邻居的虚拟表示。5. 流量控制和拥塞避免方法在多处理器片上系统中，端到端QoS（例如，端到端延迟、抖动和丢失的字节数）在很大程度上取决于路由器以所需粒度处理通信过程的字节数的能力（Bolotin等人，2004年）。在每跳转换期间，与网络管理相关的内部任务会影响延迟和抖动。等待时间的深度与输入和输出吞吐量之间的差距直接相关。因此，避免路由器瓶颈的第一个策略是尽可能地减少每个节点的处理时间。尽管SoC的处理时间由于其高频率而非常短，但是多媒体应用对带宽的要求非常高。高，这要求内部处理任务足够有效，以实现短响应。NoC中的QoS保证要求在路由器的设计中从不同的层次考虑。它不仅涉及硬件资源的规模，而且还需要一个完整的通信策略来进行流量控制和避免拥塞。通信期间的每跳存储器占用率高度依赖于基于通信路径状态来平衡数据流量负载所应用的策略。我们的方法适用于一个服务差异化的计划，适合调度的输出根据应用程序的要求，随着一个队列控制机制。为此，根据应用程序定义的QoS约束，将所提出的MP-SoC架构中的服务分为四类。表1详细说明了服务差异和相关的产出权重。将流量分成不同的服务类别允许调度器应用通用的输出调度策略来控制输出速率。这种方法适用于与类相关的QoS约束的内部处理。在通信过程中，路由器根据其服务类别将其存储在路由器内部存储器中。当它们到达路由器时，服务类分类器按照所选的循环方法从路由器的输入端口读取注入的数据包。基于服务标识符字段（id_serv），服务器在内部存储器中的适当服务类中排队，内部存储器被组织成四个等待排队，使用特定指针和索引进行管理。对于排队的传出队列，调度器使用相应的权重（Wi）来处理每个服务类别，以便应用WRR策略。表1概述了为这种方法定义的服务类别，以及它们在输出调度过程中的权重。NoC中的拥塞控制基本上依赖于路由器避免其内部存储器的过流的能力。在所提出的方案中，内存占用管理器控制内存负载。当达到较低的阈值时，该过程将内存的状态解释为过载，并开始基于传入的缓存的重要性来选择性地丢弃它们。此外，还生成并发送一个信令块来警告其邻居其过载状态，数据头微片结构连续数据微片结构信令微片结构Nat：Flit typeId_proc：进程标识符Id_serv：类服务标识符Nb_flit：微片号pr_tag：优先级标签Seq_num：微片序列号Mem_stat：存储器的状态Nb_inqueue：活动队列中的数量Nb_process：活动进程的数量Data：有效载荷数据图2所提出的通信架构中的微片结构32-位微片大小●●●Nat@s@dID_procID_servNb_flitpr_tag保留NatID_procID_Servpr_tag序号数据NatID_SW内存状态Nb_inqueue铌工艺任择缓冲器和无缓冲器数据流控制方案的效率189ðð Þ拥塞路由器与数据源核之间的反馈控制方案，以减小发送窗口大小。5.1. 基于使用输出缓冲区的流量控制避免将其用作通信路径的一部分。使用WRED类算法丢弃低重要性的节点（Barbera等人，2008; David等人，2011年）。丢弃过程根据嵌入在字节（pr_tag）中的信息选择低重要性字节，该字节由应用基于有效载荷的重要性生成。图3说明了在并行处理期间内部过程的一般组织。所提出的机制，丢弃低优先级的缓存，帮助路由器遇到拥塞卸载其内存，对QoS的影响较小。事实上，这种选择性的数据包丢弃过程有助于减少每单位事务时间，同时保留对接收方应用程序有用的重要数据。然而，我们认为使用拥塞路由器作为数据通信路径中的下一跳的相邻路由器也应该降低其上行数据速率，以避免突发。本文提出了两种有助于避免和解决拥塞的NoC流控制机制。第一个提出的用于流控制的方案是基于使用输出缓冲器，当下一跳遇到拥塞问题时减慢输出流。第二种方案是一种无缓冲的方法，基于在输出缓冲区的上行流控制方法中，当下一个路由器拥塞时，输出级的缓冲区有助于降低上行数据的频率（图4）。为此，我们定义了三个级别来量化路由器的负载：欠载，负载或拥塞。因此，在接收到一个signaling的，naling的，表明在下一个路由器加载的内存状态，路由器激活输出缓冲区，以控制输出流速率。然后将来自index_1或index_2的微片注入到下行控制缓冲器中，表示输出缓冲器中的两个位置。当下一个路由器过载（拥塞）时，微片被注入到index_1，而当index_2处于加载状态时，使用index_2。在时钟信号的每个正沿，如果未激活下行控制机制，则在index_3处注入伪迹。这个想法是在发送数据之前引入一些时钟周期，希望给下一个路由器更多的时间从其存储器向其目的地转发数据集将避免或解决拥塞。5.2. 使用到源核心在这种方法中，拥塞事件被发送到数据源，以减少其吞吐量。发生拥塞的路由器首先从所有承载的通信过程中确定哪一个正在注入最大量的数据。然后，它将其拥塞状态通知其邻居，以帮助避免更多新路由的拥塞到达。该方案中的信令信息被携带在额外的频带中;事实上，特定的总线将该信息携带到路由器的邻居，从而也识别出导致拥塞的进程Pc在它的邻居中，发送通信进程IP IP的信令的路由器R n-1将信令事件发送回路由器R0，然后发送到数据源IP source;见图10。 5）。遇到拥塞的路由器计算拥塞Flit图3内存管理的一般方法内存占用管理器路由过程WRED算法RN存储器结构服务类低优先级微片丢弃InteServ_class1alServ_class2服务类S3strServ_class4本地端口北港东港西港南港表1服务分类及其在输出调度器上的相关权重。类服务描述关联服务识别器服务权重输出调度程序（Wi）信令分类_1控制和4埃拉奇管理网络IP核实时第二类时间敏感3埃拉奇应用如多媒体应用短数据第三类用于短距离2埃拉奇信息，如寄存器内容块4类大型流媒体1存储器的数据转移IP核埃拉奇190A. Aldammas等人输出端口输出缓冲控制器路由块ð Þ¼ð¼ Þclk首页1首页2图4输出缓冲器流水线控制结构。所提出的算法有利于最大限度地提高带宽分配的路由器的行为尽力而为的模式。然而，当检测到拥塞时，所提出的方案迫使该拥塞的主要来源大幅降低其注入速率（当前注入速率的一半），该注入速率将保持到拥塞结束。解决拥塞后，源开始增加，周期性地，其输入注入率与一个单位每T时钟周期，直到达到初始测量的拥塞_注入_速率。该阶段避免了网络再次快速饱和，旨在最大化吞吐量。超过该阈值，源应用拥塞避免模式以平滑地增加其输入注入速率，如前一段所述所提出的两种用于片上网络拥塞控制的方案的特性输出缓冲区机制是一种在拥塞路由器和它的邻居之间运行的本地机制.它使用一个带宽内的信号-被检测到。它定位具有最高输入注入率的流，并通知它减少其流量负载。在我们的方法中，通信过程由数据流Fi定义，并由（proc_id）标识。路由器维护一个内部表，其结构如表2所示，其中输入注入速率针对每个通信进程不断更新。让我们用Fi来表示通信过程的数据流（i）。我们定义注入速率Proc_InjRat（i），如等式（1）所示。（五）：一种基于交换携带拥塞信息的信令的拥塞控制机制。另一方面，第二种流量控制机制涉及与源核的相互作用，以降低其注入速率。表3总结了这两种流量控制模式的主要特征和区别。在本文的以下部分中，我们评估的性能与appli- cation这两个提出的拥塞控制方案，以避免在片上网络拥塞的多媒体应用程序传输。Proc InjRatiInjflits时钟周期ð5Þ6. 性能分析对于进程I，微片的数量表示在最后一段时间（T时钟周期）内注入路由器的微片的数量。如图5所示，拥塞总线一直传送信号，直到它到达IP源的硬件接口。然后，IP源接口减少其注入，根据图中所示的算法，7.第一次会议。IP源接口持续检查conges- tion_bus，以检测其是否为拥塞源对于通信路径中的路由器（图6）。当这种情况发生时，接口根据图7中的控制算法调整其输入。源IP接口首先将注入速率降低一半（图7，第3行）。在T时钟周期的一段时间之后，如果路由器的状态仍然处于拥塞状态，则IP源保持相同的降低的注入速率（图7，第7行）。否则，喷射速率缓慢地增加，直到其达到最大值（congestion_injection_rate;图13）。 7，第10行）。在T时钟周期的每个周期中，在该周期中比在之前的周期中多注入一个时钟。当注入速率达到阈值时，接口按照图7第13行中所示的预防-避免模式增加注入速率。伪码NωT Clockcycle表示更新注入速率的时间周期的N倍。N的值增加得越多，注入速率增加得越慢，从而避免拥塞。该值N可以是用于微调喷射速率的动态参数。N的最佳值应允许高吞吐量，同时避免拥塞。在我们的研究中，我们选择了N4作为最佳的基础上模拟测试的影响N的输入注入率。我们注意到，在该算法中也可以应用更大的N建议的路由器架构的性能进行了评估，与两个提出的拥塞避免的流量控制方案。在基于Simulink和ModelSim工具的联合仿真环境中，利用所描述的路由器结构构建了一个3 *3网状片上网络。该路由器的寄存器传输级（RTL）-VHDL描述，与ModelSim仿真，并用于连接网络的不同核心。对于该网络的每个核心，设计了适配器（接口）以形成注入速率和控制注入速率。在这个网络的核心之间，定义了许多通信过程，以测试在可变速率注入下的拥塞控制方案的性能，改变数据流量负载以创建拥塞状态。我们评估的计划，主要是基于他们的能力，以管理QoS，并提供更好的性能，在应用层时，网络拥塞。模拟侧重于评估特定实时数据流的QoS指标，该数据流通过网络与其他同步通信过程一起传输。具体的测试应用涉及发送图像并在接收器核心处检索图像。6.1. WRED类算法我们首先评估了所设计的WRED类算法的性能，该算法用于丢弃低重要性字节以卸载内存并避免在繁忙的流量期间拥塞。为了测试该算法在重负载下的抗拥塞能力，我们在一个路由器的不同输入端口上图 8显示的输出缓冲器和无缓冲器数据流控制方案的效率191R（n+1）北R（0）........R（n-2）R（n-1）数据总线R（n）R（n+1）西IP源Signaling_bus向源源必须降低进样吞吐量R（n+1）南图5流控制与反馈到源。表2路由表的结构。港内输出端口类ID喷射率Id_proc_1Proc1_in_Port_idProc1_Out_pot_idProc1_Class_idProc1_inj_rateId_proc_2Proc2_in_Port_idProc2_Out_pot_idProc2_Class_idProc2_inj_rateID_proc_nProcN_in_Port_idProcN_Out_pot_idProcN_Class_idProcN_inj_rate遇到拥塞的路由器将其设置为1。当路由器将信号转发回源时，设置为2位用于编码生成拥塞事件的路由器的状态（01：负载，10：过载，11：拥塞4位用于识别最高喷射速率图6拥塞信令总线的结构。用于两种不同注射速率（0.23微滴/毫升和0.19/时刻T1和T3是在路由器存储器中检测到注入速率为0.23在不使用比特丢弃算法的情况下，分别为0.19比特/比特和0.19比特/比特。当WRED类算法的情况下，拥塞发生对于两个输入速率分别延迟到T2和T4。通过使用选择性丢弃拥塞过程，路由器在输入速率为0.23和0.25的情况下将拥塞延迟了180和200个以上的延迟周期。0.19分别为1000/1000WRED类算法延迟拥塞的能力在较低的注入速率下更高。事实上，在这种情况下，路由过程有更多的时间将内存中的数据转发到目的地。类似WRED的算法在本地应用，在经历拥塞状态的路由器的内部存储器中。即使这个过程能够延迟拥塞（如0.23千兆比特/千兆比特的情况），它也无法避免向路由器注入高数据负载。因此，我们认为，一个适当的数据流控制机制必须与这种方法一起应用。图7注射速率控制算法的伪代码。192A. Aldammas等人表3两种建议的湍流控制方案的一般特性。方案一：输出缓冲器方案二：源核NoC架构布·布海尔拥塞感知网状架构，而且可扩展，带输出缓冲器的带宽内信令在带宽上向邻居适用无总线方法额外硬件总线基于非常快速的信令机制路由器之间产生的硬件信号类WRED算法数据包丢弃可扩展性所提出的两个方案是可扩展的网络的大小事实上，这两种方法与类似的工作相比，作者在李等。（2012）实现了全局同步帧以确保NoC中的QoS。在（Lee等人，2012），当采用不同的仲裁方法时，对于0.22比特/比特的输入速率发生拥塞。我们提出的解决方案，而不应用的一个下行控制方案变得拥挤的一个类似的输入速率（0.23位/位）。然而，WRED类算法延迟了拥塞的发生，这可以促进在接收级有效地传递QoS。此外，Lee等人（2012）的作者没有讨论管理或避免拥堵的具体机制。6.2. 应用流量控制机制建议的路由器，以避免在网络中的拥塞的能力进行了评估与两个建议的拥塞控制方案。性能进行了分析，其能力，以提高在应用程序级观察到的QoS。为此，通信过程专用于使用Haar小波变换（HWT）变换并注入到4 * 4 NoC网格架构中的512 * 512 8bpp的图像的传输。HWT生成器的使用为检索过程提供了不同重要性水平的证据（图9）。表示分解后的图像的数据流包含四个子带（LL、LH、HL和HL）。HH）。相应地，生成具有可变重要性标签（pr_tag）的标签并将其注入网络。从子带LL产生的回波与LL子带数据相比，两个子带LH注入网络的最不重要的比特是那些从HH子带传输数据的比特。HWT分解测试所提出的WRED类算法的效果，以选择低权重的数据流丢弃，以避免在路由器中的内存饱和。此外，为了增加每个路由器的负载并导致数据路径中的拥塞状态，在网络上同时进行其他通信过程。表4总结了模拟期间注入网络的数据流的特征。提出的拥塞控制方案，随着WRED类算法，从过渡节点的拥塞症状时，被检测到丢弃低重要性的拥塞。我们评估的能力，提出的两个方案的QoS控制，以提高在接收水平。对于Lena图像的传输，我们估计了抖动的变化，抖动表示路径中的路由器维持其传入数据的周期性递送的能力。图10示出了在1000MHz处针对不同的脉宽调制控制方案测量的抖动的最大绝对值。4604404204003803603401900 200021002200230024002500 2600时间（秒）图8路由器中拥塞延迟的WRED类算法的能力分析输入速率（0.19flits/sec）输入速率T1T3T2T4微片数量缓冲器和无缓冲器数据流控制方案的效率193表4进程标识符1测试数据的特点如下所示。ID类服务1输入注入速率网络（位/位）从0.01到0.1的来源目的（X(00，00）至段时间（T时钟周期）100 CLK周期一般描述234523410.015至0.10.020.02从0.01到0.1的(00，01）至（10，01）(01，00）至（01，10）(10，00）至HWT应用于Lena输出数据流在模拟过程中，额外的通信进程被注入到网状网络中，以加载网络(a) Lena图像（b）用HWT获得的频率子带图9 Lena图像的HWT分解后的输出流不同网络负载下的接收电平。在低网络负载（0.12 μ比特/μ周期）下，网络以几乎相同的最大抖动向接收机发送μ然而，在较高的网络负载下，这会导致拥塞（从0.56时钟/时钟周期），基于到源核的反馈信令机制的方案与输出缓冲器时钟控制机制或不具有任何时钟控制机制的通信相比确保更少的抖动。在0.56千比特/千分之一周期的负载下，当应用反馈信令控制机制时，抖动的最大测量值高于当应用两种其他方案中的任一种时。事实上，在这个负载下，路由器的内存是轻负载的，输出缓冲器的带宽控制机制在输出端（索引2）开始时移带宽，而不降低源的注入速率。这种高投入注入率有利于注入更多的相同的水，拥塞路由器中的数据流，并因此将更多的数据流传送到接收端。然而，反馈拥塞控制机制将源的注入速率降低一半，然后开始缓慢地增加注入速率以避免拥塞。结果，对于该0.56微比特的负载，由于输入注入速率的这种显著降低以及WRED类算法的应用，用反馈间歇控制机制测量的抖动将增加。图10显示了抖动高于其他两种抖动控制方案的测量值。当网络负载很重时，输出缓冲器无法避免高抖动值。它使用输出缓冲区中的位置索引1对缓存进行时间shit，由于路由器的高负载，缓存将很快饱和。因此，该方案将不能够通过应用WRED类算法来避免大量的丢弃的比特（因为注入无流量控制反馈带源核心流量控制输出缓冲区流量控制2001801601401201008060402000.12 0.56 0.76 1 1.05网络注入负载（千比特/千比特）图10不同带宽控制方案下抖动的最大绝对值抖动的最大绝对值（）194A. Aldammas等人进入路由器的速率将保持高）。然后，与使用反馈信令流控制机制相比，抖动将显著增加，反馈信令流控制机制与其他两种流控制方案相比将保持低的抖动测量值。抖动的测量值与输出缓冲器为基础的码流控制方案是略好于没有码流控制方案的通信。但是，这两种方案在不同的数据流量负载下保持相同的抖动增加趋势。事实上，在不降低数据源注入率的情况下，路由器的内存将负载沉重，这增加了丢弃缓存的概率。在这种情况下，在邻居中使用的输出缓冲器将在短时间后饱和，并且其延迟其时移的功能不会降低拥塞路由器中的注入速率在图10中，反馈带宽控制方案能够有效避免接收应用中出现的高抖动该图显示在1.05千比特/千周的网络负载下，增益约为43%。这个结果证明了反馈信号机制对源核的有效性端到端延迟是用来评估通信系统时间效率的最有趣的QoS度量之一。我们已经评估了所讨论的方案的时间性能和它们的能力，以确保没有延迟地交付给接收应用程序。图11给出了两种并行流控制方案的测量端到端延迟，以及在不应用并行流控制机制的情况下获得的结果。端到端延迟会随着数据流量负载的增加而增加，从而导致路由器中的缓冲时间增加。与使用到源核的反馈信令机制所获得的结果相比，输出缓冲器带宽控制机制的应用不减少端到端延迟。在相邻路由器的输出端的缓冲稍微降低了测得的端到端延迟，但这个增益小于与反馈信令机制的应用。在导致拥塞的网络负载下（P0.56位/周期），将反馈信令应用于源核心的测得端到端延迟仍然小于使用输出缓冲器的方案的测得值。我们也注意到，从图。 11，端到端延迟是与没有缓冲器流控制的通信相比，应用输出缓冲器流控制机制没有显著增强。事实上，如在图10的解释中所解释的，由于源处的输入注入速率没有降低，拥塞路由器的存储器以及数据路径中的其它路由器的存储器保持高数据负载。图11所示的结果表明，与输出缓冲器方案相比，反馈信令机制是一种更具可扩展性和有效性的流量控制机制。性能分析还测量了通过拥塞路由器丢失的数据包数量（图12）。输出缓冲器的流水控制方案的应用减少了丢失的字节数。反馈信令方案的源核心也产生了更少的丢失的拥塞路由器中。与没有特定的缓冲器控制机制的通信相比，丢失的字节数减少了40%以上，与输出缓冲器阴谋作为一个重要的提示，WRED类算法被应用到这两个研究计划，从低

下载后可阅读完整内容，剩余1页未读，立即下载