没有合适的资源?快使用搜索试试~ 我知道了~
基于垂直部分连接网格的3D-NoC的体系结构探索与性能分析引用此版本:玛丽亚姆·巴赫马尼。基于垂直部分连接网格的3D-NoC的体系结构探索与性能分析。其他[cs.OH]。格勒诺布尔大学,2013年。英语。NNT:2013GRENM066。电话:01070020v2HAL ID:电话:01070020https://theses.hal.science/tel-01070020v2提交日期:2015年HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire论文要获得的等级格勒诺布尔大学博士专业:计算机科学部长令:2006年8月7日提交人"玛丽亚姆·巴赫曼"论文由Maryam BAHMANI指导,共同指导Abbas Sheibanyrad博士在TIMA实验室内制备数学、信息科学与技术、计算机科学博士学院(MSTII)部分垂直连接的3D片上网络的架构探索和性能研究论文于2013年12月9日在评审团面前公开答辩,评审团由:伊恩·奥康纳教授法国ECL教授,角色(报告员)Gilles SassatelliLIRMM法国研究主任,作用(报告员)Jean-Philippe DIGUETLab-STICC法国研究总监,角色(评审团主席)[美]弗兰克·韦兹伯特著LIP6法国高级讲师,角色(成员)阿巴斯·谢巴尼拉德TIMA/SLS法国研究员,角色(论文主管)弗雷德里克·彼得罗教授,TIMA/SLS法国,角色(论文主任)I摘要第三维的使用可以显著降低片上网络(NoC1)中的功率和平均业务延迟。衬底通孔技术(或称TSV2)是最有前途的3D集成技术,因为它提供了短的垂直链路,解决了2DNoCs中的长导线问题。然而,TSP是巨大的,并且制造工艺不成熟,这降低了基于NoC-3D的片上系统的产量。因此,引入了部分垂直连接的3D片上网络的概念,以受益于3D技术,同时保持高效率。此外,这样的网络是灵活的,因为可以根据应用的要求来决定每一层中垂直链路的数量、位置和分配。然而,这种类型的网络带来了许多挑战:路由是主要问题,因为某些垂直链接的消除意味着不能使用遵循维度顺序的经典算法。为了回答这个问题,我们解释并评估了一种称为"电梯优先"的确定性路由算法基本上,NoC的性能受a)路由器的微体系结构和b)互连体系结构的影响。路由器的体系结构由于其引起的延迟而对NoC的性能具有显著影响。本文提出了一种实现电梯优先路由算法的低延迟路由器微体系结构的设计和实现从体系结构的角度来看,垂直链路的数量和放置在部分垂直连接的3D网络的性能中具有重要作用,因为它们影响网络中的平均跳数和FIFO利用率。此外,将垂直链路分配给没有向上和/或向下端口的路由器是一个严重影响性能的重要问题。因此,对部分垂直连接的3D片上网络的架构探索是重要的。我们定义、研究和评估描述网络行为的参数,以便以简单有效的方式确定垂直链路在各层中的放置和分配。我们提出了一种二次估计方法来预测基于这些参数的饱和阈值。1片上网络2通过硅通道IIIII摘要第三维的利用可以显著降低片上网络(NoC)中的功耗和平均跳数。作为3D集成中最有前途的技术,TSP技术提供了短而快的垂直链路,解决了2D NoC中的长线问题。非以太的TSP很大,其制造工艺还不成熟,这降低了基于3D的SoC.的产量。因此,引入了垂直部分连接的3D-NOC,以受益于3D技术和高产量。此外,垂直部分连接的3D-NoC是灵活的,这是由于可以基于设计的限制和要求来决定每个层中垂直链路的数量、放置和分配的事实。然而,由于层之间的垂直链路被移除,因此存在实现可行的和高性能的基于垂直部分连接网格的3D-NoC的挑战。本文解决了基于垂直部分连接网格的3D-NoC的挑战:路由是垂直部分连接3D-NoC的主要问题。由于一些垂直链路被删除,一些路由器没有向上或/和向下端口。因此,应该有一个将数据包发送到上层或下层的路径,该路径显然必须由路由算法确定。建议的路径不应导致整个网络的死锁。为了解决这个问题,我们解释并评估了一种称为电梯优先的无死锁和活锁路由算法。基本上,NoC性能受到1)路由器的微体系结构和2)互连的体系结构的影响。路由器体系结构对NoC的性能有很大的影响,因为它是传输延迟的一部分。因此,NoC微路由器架构设计的简单性和效率是关键问题,特别是在垂直部分连接的3D NoC中,由于一些被移除的垂直链路,3D NoC已经遭受高平均延迟。因此,我们提出了一种路由器的微体系结构的设计和实现,该路由器不仅基于电梯优先路由算法准确和快速地转发分组,而且还消耗合理量的面积和功率。从体系结构的角度来看,垂直链路的数量和放置在基于垂直部分连接网格的3D-NoC的性能中具有关键作用,因为它们影响网络中的平均跳数和链路以及缓冲区使用。此外,将垂直链路分配给不具有上行或/和下行端口的路由器是影响3D路由器性能的重要问题。因此,对基于垂直部分连通网格的3D-NoC的体系结构探索既重要又重要。我们定义、研究和评估描述网络行为的参数。参数可以帮助有效地放置和分配层中的垂直链接。最后,提出了一种基于二次估计的方法来预测网络平均延迟的饱和阈值IVV确认书首先,我会喜欢至快递我的真诚感恩至我的感谢我的导师Frédéric Petrot教授和顾问Abbas Sheibanyrad博士对我的论文研究的持续支持,感谢他们的耐心、动力、热情和丰富的知识。他们的指导帮助我完成了这项研究,并写了这篇论文。感谢我的导师和顾问,我想感谢我的论文委员会的其他成员:Ian O'Connor教授,Gilles SASSATELI博士, 博士 让-菲利普 数字, 和Franck WAJSBURT博士接受我们的邀请来评估和审查这篇论文。我还想向TIMA实验室的同事和朋友们表示感谢:Frédéric Rousseau教授、OlivierMuller、Stéphane Mancini、Nicolas Fournel、Sahar Foroutan 、Pierre-Henri Horrein、Damien Hedde 、 Florentine Dubois 、 Marcos Cunha 、 Clément Deschamps 、 AdrienPROST-BOUCLE 、 Yan XU、 Ashraf Elantably 、 Sofiane LAGRAA 、 Luc MICHEL、Guillaume Sarrazin、Panagiota PAPAVRAMIDOU、Fabien CHAIX、弗拉基米尔·帕斯卡、瓦西姆·曼苏尔、法特梅·贾瓦赫里、萨哈尔·贾夫达尼、托马斯·杜波特、丹尼和罗兰·维亚利,感谢他们的善良、支持,以及我们在过去三年中所拥有的所有乐趣。也我谢谢The管理团队在The蒂玛实验室:DominiqueBorrione教授、Laurence Ben Tito、Anne-Laure FOURNERET-ITIE、Sophie马丁,玛丽-克里斯汀萨利佐尼,年轻拉贾布,弗雷德里克·雪佛兰和尼古拉斯·加尼埃,感谢他们对我的支持和帮助。我想向我的家人,特别是我的母亲Nazafarin GAHRAMANI和我的兄弟KhashayarBAHMANI表达我最深切的感谢,感谢他们在我一生中对我的精神支持;没有他们的鼓励和支持,我就没有机会在格勒诺布尔的TIMA实验室。最后但并非最不重要;在过去的三年里,我也想向我所爱的加雷思·基利博士表达我的感激之情,感谢他无条件的爱、善良和支持。VI七|P A G E内容表摘要(法文)第一章:导言1第二章问题的定义5第三章第十一章第十一章第四章电梯第五章电梯第一路由器微架构e21第六章部分探索3d片上网络架构垂直连接25第七章结论与展望主要部分(主要部分)第一章:引言41第二章问题定义451.片上系统(SoC)451.1.共享介质和交叉连接461.2.片上网络(NoC)472.三维NoC(3D NoC)472.1.密集集成472.2.较低的平均延迟和功耗472.3.灵活的集成和可行的片上存储器3.通过硅通孔(TSV)483.1.TSP区域消耗493.2.产量与TSP494.垂直部分连接3D-NoC505.垂直部分连接3D-NoC中的问题515.1.问题1:垂直部分连接的3D-NoC52中的路由5.2.问题2:垂直部分连接的3D-NoC53中的性能下降5.2.1.微体系结构级别分析545.2.2.系统级分析546.结论56第三章:最新技术1.3D NoC路由算法相关作品61七|P A G E2.3D NoC路由器微体系结构相关作品663.3D NoC建筑探索相关作品684.结论71第四章电梯优先路由算法731.电梯概念732.电梯优先路由算法752.1.电梯第一路由算法3.电梯第一路由算法76中死锁的解决方案4.使用Z+和Z的电梯优先路由算法-虚拟网络775.电梯优先路由算法5.1.平均跳数816.结论82第五章电梯第一路由器83的微架构1.DSPIN路由器832.电梯第一路由器853.在电梯第一路由器中标头84.电梯第一路由器88中端口的微体系结构5.RTL级合成926.结论93第六章垂直部分连接3d-Noc95的建筑探索1.垂直部分连接3D-NoC中可能拓扑数目的分析.......................................................................................................................................... 982.区域概念983.基于模式的垂直部分连接网格3D-NoC放置和分配算法1004.统一电梯分配(UEA)1064.1.统一电梯分配方法1075.二次估计法1095.1.参数矩阵中的参数[参数]1115.2.二次基估计法1126.结论114第七章结论与未来作品附录A:理想区域跳数123七|P A G E首字母缩略词125参考文献127九|P A G图列表图1.1:论文路线图42图2.1:以计算为中心与以沟通为中心的方法45图2.2:异构和异构多处理器系统图2.3:片上系统互连的可扩展演进(从基于总线的SoC到基于NOC的SoC)46图2.4:片上系统互连的维度演进(从基于2D SoC的SoC到基于3D SoC的SoC)47图2.5:芯片外链路与芯片上链接48图2.6:带有着陆垫和保持区的TSP比闸门和存储单元大几倍[35] 49图2.7:收益率与TSP计数的关系[45] 50图2.8:(a)垂直部分连接的3D-NoC示例,(b)垂直部分连接的3D-NoC 51中的图2.9:垂直部分连接的3D-NoC挑战52图2.10:基于全连通网状3D-NoC 53的无死图2.11:垂直部分连接3D-NoC 53中的图2.12:传输延迟54图2.13:N等于9、16、25和36的可能拓扑数(T),以对数标度56表示图2.14:一个图层中两个3D节点和四个节点的图3.1:各种NoC拓扑(无法扩展)(a)2-D IC-2-D NoC。(b)2-D IC-3-D NoC. (c)3-D IC-2-D NoC。(d)3-D IC-3图3.2:XNoT拓扑(a-d)、建议的路由和通用XNoT体系结构的示例[48] 62图3.3:使用dTMA总线的3D NoC的侧面图[49] 63图3.4:AdaptiveZ路由中7种不同可能路径的示例[49] 63图3.5:MXYZ路由[51] 64图3.6:一个不规则区域定向多播框架[51] 64图4.1:作为层内路由机制的图4.2:电梯类型74X| P A GE图4.3电梯优先路由算法75图4.4电梯中的死栓第一路由算法76图4.5使用Z+和Z的电梯优先路由算法-虚拟网络77图4.6电梯第一路由器78的图4.7:本地输入端口78图4.8:2D输入端口79图4.9:3D输入端口79中的图4.10:使用均匀流量分布的平均图4.11:使用本地化流量分布的平均延迟图4.12使用统一流量的平均跳数82图4.13:使用本地化流量的平均跳数图5.1:DSPIN路由器[73] 83图5.2:传统NoC路由器84图5.3:电梯第一路由器85图5.4电梯优先路由算法87中临时标头的添加和删除图5.5:(a)添加临时标题(b)删除临时标题88图5.6:本地电梯第一有限状态机89图5.7:本地电梯第一输入端口90图5.8 UP_Elevator第一输入端口91图5.9:Down_Elevator第一个输入端口91图5.10:2D电梯第一输入端口92图5.11二维电梯第一有限状态机92图5.12:路由器区域比较93图6.1:基于网格的层96中图6.2:基于网格的层96中图6.3:基于垂直部分连通网格的3D-NoC 96图6.4:6×6×5网络中不同电梯数量的18.5 K拓扑的最佳和最差饱和阈值之间的差距图6.5:5 ×5×5网络中不同电梯数量的18.5 K拓扑的最佳和最差饱和阈值之间的差距十一|P A图6.6:4×4×5网络中不同电梯数量的18.5 K拓扑的最佳和最差饱和阈值之间的差距图6.7:3×3×5网络中不同电梯数量的18.5 K拓扑的最佳和最差饱和阈值之间的差距图6.8基于垂直部分连通网格的3D-NoC 99中的图6.9总区域度100的图6.10:垂直部分连接3D中基于模式的放置和分配- NoC 101图6.11:垂直部分连接3D中基于模式的布局的可扩展性- NoC 102图6.12:基于模式的算法103图6.13:基于模式的放置和分配算法104的图6.14:5×5网格层106图6.15(5×5×5)网络中统一电梯分配(UEA)和随机拓扑(放置和分配)之间图6.16二次基估计方法110的图6.17:基于优先级的选择图6.18 NZ= 6 × 6 × 5时误差的平均值和标准差115图6.19 NZ= 5 × 5 × 5时误差的平均值和标准差115图6.20 NZ= 4 × 4 × 5时误差的平均值和标准差115图6.21当NZ = 3 × 3 × 5时误差的平均值和标准差115图A:B是多个2D节点及其电梯之间的跳数之和十二世|P A十三|P A G E表列表表3.1将获得的垂直部分3D NoC对能量、延迟和面积值的最小-最大影响与[55]和[56]中的3D全垂直互连NoC进行表3.2:所列相关作品摘要;不适用表5.1:Z +和Z-开关结构表5.2:不同类型电梯-第一路由器93的表6.1:当HP等于表6.2:垂直部分连接3D-NoC 112的十四|P A G E第一章引言1 |PA G EC第一章:一、引言片上网络(NoC)最初是由Guerrier等人[14]引入的,以解决片上系统(SoC)内的互连(共享介质)的可扩展性问题,其中IP块的数量不断增加。NoC的一些优势如下:进化:由于NoC路由器的存在,大量的IP地址可以通过它们进行通信,而没有任何拥塞,并且具有更有效的功耗。此外,聚合链路带宽会根据网络的大小进行调整。灵活性:NoC路由器设计可用于任何网络规模,并可针对多种技术重新实例化。此外,IP块可以从不同的(异构NoC)或类似的(同质NoC)应用中选择,并且以不同或类似的时钟频率工作[13-17]。此外,网络可以是分组交换或电路交换的。当然,第一种方法以更高的并发性和更低的功耗结束,并且后一种方法为延迟敏感的应用带来更多的资源。透明度:片上网络设计的原子层和独立于工作流的层导致(上市时间)的减少,因为可能需要向单个层添加新服务来改变一层的功能,重用所有其他层的预期功能。模块化:通过互连网络路由分组的决策可以由NoC路由器以分布式方式做出,或者由核心网络中的制造单元做出。在第一种情况下,不仅可以同时在源节点和目的节点之间使用许多路径,而且所有链路在不需要时都不繁忙。前者的坚固耐用和容错设计结束了,后者导致更低的功耗。第一章引言2 |PA G E另一方面,片上网络受到长线程的延迟和高功耗以及随着IP核心数量的增长而增加的跳数的影响。第三维(3D技术)的使用可以导致片上网络(NoC)中的功率和平均跳数的显著降低。技术和3D NoC方法的结合最终导致不同的密集片上层与不同技术的集成,例如片上存储器片上系统42。此外,TSP技术作为最有前途的3D集成技术,在堆叠层之间提供短而快速的垂直链路。然而,TSP是巨大的[35],并且它们的制造工艺仍然不成熟,这降低了基于3D SoC的SoC的产量[45]。因此,引入了部分垂直连接的3D片上阵列,以针对三维(3D)和高产量技术。此外,部分垂直连接的3D片上网络是灵活的,这是因为可以根据设计要求决定每层中垂直链路的数量、位置和分配。然而,由于层之间的垂直链路被抑制,因此在呈现可能的、高性能的、部分垂直连接的3D片上网络方面存在挑战。因此,本文解决了部分垂直连接的3D片上网络的以下挑战:A. 路由的算法路由是部分垂直连接的3D片上网络的主要问题。由于消除了一些垂直链路,因此某些路由器没有向上和/或向下的端口。因此,应该存在用于将分组发送到上层或下层的路径,这显然必须由路由计算算法来确定。建议的路径不应导致整个网络的阻塞。因此,提出了一种无死胡同和无活锁的路由算法,并对部分垂直连接的3D片上网络进行了评估。这个问题在[68]和本文的第四章中得到了解决。B. 性能下降NoC性能受1)路由器微体系结构和2)互连体系结构的影响:B.1. 微体系结构级别的性能改进路由器微体系结构对NoC性能具有显著影响,因为它是延迟分组传输的一部分。因此,NoC路由器微架构设计的简单性和效率是至关重要的问题,特别是在部分垂直连接的3D片上网络中,该网络已经由于缺少一些垂直链路而遭受高平均因此,不
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++标准程序库:权威指南
- Java解惑:奇数判断误区与改进方法
- C++编程必读:20种设计模式详解与实战
- LM3S8962微控制器数据手册
- 51单片机C语言实战教程:从入门到精通
- Spring3.0权威指南:JavaEE6实战
- Win32多线程程序设计详解
- Lucene2.9.1开发全攻略:从环境配置到索引创建
- 内存虚拟硬盘技术:提升电脑速度的秘密武器
- Java操作数据库:保存与显示图片到数据库及页面
- ISO14001:2004环境管理体系要求详解
- ShopExV4.8二次开发详解
- 企业形象与产品推广一站式网站建设技术方案揭秘
- Shopex二次开发:触发器与控制器重定向技术详解
- FPGA开发实战指南:创新设计与进阶技巧
- ShopExV4.8二次开发入门:解决升级问题与功能扩展
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功