没有合适的资源?快使用搜索试试~ 我知道了~
纳米级VLSI技术中容错实现中的模糊硬件及其优势
工程科学与技术,国际期刊23(2020)289完整文章在纳米级易出错的VLSI技术中,对不精确的容错应用进行高效的容错实现:模糊硬件Hamid Reza Mahdiania, Mohammed Haji Seyed Javadiba伊朗德黑兰Shahid Beheshti大学计算机科学与工程系b伊朗德黑兰Shahid Beheshti大学电气工程系阿提奇莱因福奥文章历史记录:收到2018年2019年4月18日修订2019年5月6日接受在线预订2019年保留字:生物启发的不精确计算块容错模糊硬件三模冗余A B S T R A C T新兴的纳米级技术提供了非常高的器件密度,这有助于更复杂应用的高性能实现。然而,它们也引入了新的具有挑战性的可靠性问题,如瞬时故障的出现和电路中多个故障的并发发生。由于它们的不确定性,电路中所有多个并发瞬时故障的绝对检测和校正是一项具有挑战性的任务,随着并发故障的数量增加,由于其非常高的空间、时间或数据冗余,该任务变得不可行。幸运的是,基于新兴的不精确计算范例,在实现“不精确容忍”应用时,由于其对不精确的固有容忍度,检测和纠正电路中的所有故障并不是强制性的。由于这种有用的放松,本文利用松弛的三重模块冗余(RTMR)的交易的模糊应用程序的不精确性的固有的鲁棒性,有效地实现去模糊化块作为最计算密集型的部分Mamdani模糊处理器在不可靠的技术。传统的TMR基本上是针对单一的永久性故障而开发的,为了处理(N-1)/2个并发故障,NMR系统中的冗余部件的数量应该增加到N然而,实验结果表明,RTMR可以减轻更多的并发瞬态故障的数目与NMR方面的开销较少。综合结果表明,利用TMR导致更高的面积,延迟和功耗开销高达71%,25%和63%,分别相对于RTMR。©2019 Karabuk University. Elsevier B.V.的出版服务。这是CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍由于相对于传统和其他现代控制策略的显著优势,研究人员最近非常关注模糊控制作为智能控制范例的最实用实例[1,2]。模糊控制便于使用近似和模糊术语和值来表示专家的不确定经验和知识[3]。相对于传统的控制方法,这提高了其鲁棒性和紧凑性此外,模糊控制器不依赖于受控对象的模型,并且还提供了白盒方法。这意味着,它提供了一个清晰的洞察力的影响,每个内部参数的控制器的输出质量的设计。为了利用这些宝贵的优势,*通讯作者。电子邮件地址:mahdiani@gmail.com,mahdiani@sbu.ac.ir(H.R.Mahdiani)。由Karabuk大学负责进行同行审查。为了应对新兴的复杂且大部分是实时的应用,有许多研究努力来改进模糊控制引擎的性能为了实现更高的性能,一些研究人员专注于降低模糊处理引擎不同部分的算法复杂度[4,5],而另一些研究人员则试图使用自定义硬件方法而不是软件或混合实现[1-3]来提出更快作为几乎任何模糊处理引擎的计算最密集的部分的去模糊化块的一个实例,存在许多具有不同成本-性能-精度权衡的去模糊化算法[5],可以基于特定应用的性能要求来利用这些算法来实现自定义硬件去模糊化块。基于传统的设计规则,从多年前开始,当在可靠的传统超大规模集成电路(VLSI)技术上实现系统时,改善系统面积、延迟和功耗通常是数字硬件设计者的主要然而,https://doi.org/10.1016/j.jestch.2019.05.0052215-0986/©2019 Karabuk University.出版社:Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表工程科学与技术国际期刊杂志主页:www.elsevier.com/locate/jestch290H.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289晶体管向纳米超大规模集成电路的发展以及许多其他有前途的纳米级硅技术替代候选者(如量子点元胞自动机或碳纳米管)的出现正在迅速改变这种传统模式[6,7]。相对于传统技术,纳米级技术提供了更高的器件密度[8],这使得实现具有更高性能的更复杂系统成为然而,为了利用这种宝贵的潜力,设计人员应该首先解决这些纳米技术的重要固有可靠性问题[9更高数量的缺陷率和永久性故障、瞬态或软错误的出现以及电路中多个永久性或瞬态故障的并发发生是这些脆弱性[9,13-15]的可通过参考现有报告评估这些风险的重要性,这些报告强调了其在商业产品中的工业相关性[16考虑到这些重大的脆弱性,与传统的VLSI技术相反,假设底层硬件完全无故障,不可能以纳米级技术实现系统此外,虽然有一些容错设计技术来解决传统VLSI技术的可靠性问题,但它们不能被采用来处理这些新出现的可靠性问题。主要原因是传统的容错设计技术基本上是基于传统的Stuck-At故障模型开发的,该模型处理仅在传统VLSI中常见的单一和永久故障[15]。因此,它们要么施加非常高的物理开销(在面积、延迟和功耗方面),要么在处理瞬时和多个并发故障时变得大多不切实际由于它们的高脆弱性级别,不可能确定在纳米技术中实现的系统中发生的并发故障数量的上限。因此,即使付出非常高的容错设计开销,理论上也不可能使用纳米技术开发完全可靠的底层实现床。考虑到在包括控制理论在内的不同领域中存在许多现有的严格和确定性算法的事实,这是一个巨大的挑战著名的PID控制器作为一个例子是一个严格的算法,它是基于一些精确和严格的数学基础,因此,不能正常工作,如果它是在一个non-deterministic故障环境中实施。虽然模糊控制范式有一些经典的优点,与前面解释的其它控制策略相比,本文证明了模糊控制的优越性,这一次是由于它在成功处理新出现的脆弱性方面的独特能力我们的实验结果表明,根据其软和生物启发的性质,模糊控制引擎固有地容忍显着水平的不精确性和不确定性,可能会出现时,在一个不可靠的纳米级technol- ogy实现它。基于这一有价值的功能,它不是无形的,引入模糊控制范式作为唯一的(或至少是少数几个)有前途的控制范式,可以实际上实现新兴的不可靠的纳米技术。本文的后续章节组织如下。下一节介绍了不精确容限的应用,包括模糊系统作为一个著名的例子。提出了一种新的仿生容错设计方法,可以有效地利用任何不可靠的实现技术来实现不精确的容错应用。所提出的方法- ology提供了相同的可靠性水平的传统容错设计技术,大大改善成本方面的面积,延迟和功耗。第三节包括广泛的实验结果证明了所提出的用于硬件去模糊化块的容错实现的方法的效率最后一部分是对全文的总结。2. 一种仿生容错设计方法:松弛容错本节介绍了一种新的重要应用类别,称为不精确度公差应用然后介绍了一种新型的可靠性改进设计方法--松弛容错(RFT)方法,该方法专门用于在不损失性能的情况下,利用这些应用的固有容错能力和不精确性来提高容错设计的成本。2.1. 不精确公差应用:主要概念和定义虽然有一些众所周知的术语,如容错或容错,这是普遍使用的可靠性背景下,本文介绍的术语不精确公差,以涵盖更广泛和更有用的应用类别。从技术角度来看,一个或多个瞬时或永久故障的发生以及缺陷和错误的存在(作为容错和容错的主要对象)可能被认为是系统内部不精确的一些但不是所有实例[22]。例如,设计者可能会决定在设计中引入一些不精确的源,以改善其物理特性[23]。不精确容忍应用程序的共同特征是,它们容忍一定程度的不精确性,并向最终用户提供可接受的行为,尽管它们的实现平台中存在一些不精确性来源这个概念涵盖了来自不同研究领域的广泛应用,包括但不限于图像,视频和语音处理,人机交互,分类,模式识别和生物信号处理。此外,所有的软计算方法也应该被归类为一些最著名的实例的不精确容忍的应用,由于其固有的软和不确定性的性质。作为一个例子,我们以前的工作表明,神经网络和模糊系统自然地容忍相当程度的不精确性,这些不精确性是设计者故意引入到它们的计算块中以改善它们的整体物理特性的。2.2. 一种可靠实现不精确容限应用人类大脑作为世界上最聪明的实体,是一个高性能的自然处理器,能够以实时和令人惊讶的可靠方式运行多个繁重的任务,如模式识别,分类,图像,视频和语音处理需要注意的是,根据我们之前的定义,大多数在大脑上运行的任务都应该被归类为令人意想不到的事实是,大脑作为一个完全可靠和高性能的实体,是由许多称为神经元的不可靠和缓慢的构建块组成的。神经元通过由一些不精确的化学离子转移相互作用产生的非常低幅度的电信号来接收、新兴的不精确计算范式是遵循这个简单事实的令人印象深刻的灵感。根据这一新范式,开发完全精确和确定性的构建模块或实现技术来开发一个完整的精确和高性能的H.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289291不精确容忍系统,无论实现技术和方法。在通过引入生物启发的不精确计算(BIC)块的第一个实例对不精确计算范例的熟练程度进行了第一次预测之后,[23]以及它们对于实现称为不精确容忍应用的一类新的应用的效率,对该研究领域给予了极大的关注目前在各种不精确公差应用中普遍设计和开发的BIC块提供的是结果的估计而不是其精确值。换句话说,设计者有意地将诸如模糊或神经系统的不精确容限应用的固有容限与不精确性进行交换,以相对于常规精确计算块获得更好的物理特性类似的灵感可能会再次被利用,这一次是为了提高容错设计成本的不精确容错应用程序在一个错误的环境。在这种新的情况下,在电路中的软错误的发生也可以被认为是一个瞬态的不精确源以及。这两种情况之间的主要区别在于,在BIC中,设计者有意引入一些众所周知的和预定义的不精确源模式,而在后者中,设计者应该处理由系统内(一个或多个)软错误的非确定性发生引入的不精确源的未知分布在这种情况下,可以利用不精确容限应用的固有容限来类似地改善其容错设计成本基于不精确容限应用的固有容限,不强制遵循传统的容错设计范例来完全检测和校正电路中发生的所有软错误这种新的容错模式称为松弛容错(Relaxed,RFT),它只需付出额外的代价来检测和纠正一些破坏性错误,而让其他错误由不精确容错应用程序的固有容错能力来处理作为一个合理的例子,开发非常有用的RFT技术的一个好主意是使用任何合适的传统容错设计技术仅保护计算的一些最高有效位,而计算的最低有效位下一节将介绍一种基于这一基本思想的实用RFT技术。2.3. 一个松弛容错方法实例虽然TMR看起来是一种古老的FT设计技术,但由于其无源性,它仍然应该被视为FT设计技术中最有用的实例之一。此外,尽管TMR固有地被开发为检测和校正所有永久性单个错误,但是当处理新出现的可靠性问题时,它也可以提供有利的特征,如下面将解释的。研究传统FT设计技术在新兴技术的重大变化中的效率,并使其能够处理一些重要的新兴可靠性问题(如瞬时故障和多个并发故障),是一项非常有用的任务2.3.1. 用于纠正多个瞬时故障的TMR定制版本:松弛三模冗余传统的观点认为,三模冗余(TMR)方案只能纠正单个故障,而检测和纠正电路中所有(N-1)/2并发故障的唯一方法是将冗余模块的数目增加到N,从而实现因此,传统上认为NMR是不充分的和不可扩展的技术,由于其在多个故障的情况下非常高的空间冗余。由于不精确的计算范式,它允许在基于不精确容限应用的容限水平,TMR应该被重新引入作为可扩展的容错设计技术,其可以被定制以支持多个并发错误,而无需付出NMR的非常高的面积开销其主要思想是,由于应用程序可以容忍一些罕见的未检测到的故障,基于其固有的功能,这是可能的,分解成一个并发的低粒度的单一故障检测和纠正问题的捆绑的高级别的多并发故障检测和纠正问题。作为一个实例,这意味着不是试图使用NMR以全局方式校正(N-1)/2个并发故障,而是可以并行地使用低粒度TMR方案局部检测和校正这些分布式故障中的每一个在该方法中,可以基于实现技术的可靠性水平以及应用对不精确性的容忍水平来确定合适的TMR粒度水平作为实例,增加TMR的粒度提高了其针对更多数量的并发故障的保护与传统的NMR相反,该方法具有更高的可扩展性,并且随着TMR粒度级别的增加,可以处理更多数量的并发故障,而不会增加超过三个冗余系统的数量。这种方法的主要缺点是,随着粒度级别的增加,它需要更多的投票者这种新方法的主要特点是它不能检测和纠正在一个局部TMR区域内可能发生的多个并发故障,只能依靠应用程序的容限水平来解决这些未纠正的错误,这使得它只适用于实现不精确的容错应用程序另一个重要的注意是,基于不精确的计算,范例,当在不可靠的纳米技术中实现不精确容忍应用利用局域TMR技术来保护计算块的高阶位,产生了一种有用的RFT技术,称为松弛TMR(RTMR)技术。每个RTMR块具有一个或多个保护参数,这些参数确定受保护和不受保护部分的边界。这些参数影响RTMR块的可靠性和物理特性。通过系统级仿真或分析研究,基于特定应用的容限水平提取保护参数的合适值2.3.2. RTMR加法器和乘法器的设计图 1演示了RTMR纹波进位加法器(RRCA)结构[22]。如图所示,加法器未保护长度(AUL)参数确定电路中受保护和未受保护(或可能发生故障)的全加器(FA)的边界AUL = 0类似于全TMR加法器,而增加AUL会将虚线所示的未受保护部分向更重要的位传播,减小受保护部分的大小,并且Fig. 1. Ripple Carry Adder(RRCA)的内部结构。292H.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289PiDD图二. RTMR阵列乘法器(RAM)的内部结构。改善了RRCA面积、延迟和功耗。以类似的方式,图2示出了通过将RTMR方案应用于阵列乘法器而构造的RTMR阵列乘法器RAM由一个二维的进位保存加法器(CSA)单元阵列和一个矢量合并加法器组成[23]。它有两个不同的参数,称为水平无保护长度(HUL)或垂直无保护长度(VUL),功耗.在这一节中,我们证明了适用性和效率的建议RTMR技术在容错的VLSI实现的解模糊块作为最关键的实验结果表明,相对于一个完整的TMR实现没有一个有意义的容错水平下降的RTMR去模糊化块3.1. 加权坪平均解模糊算法在广泛的现有去模糊化算法中,这些算法在精度和实现成本之间提出了不同的权衡,真正的重心(COG)[4]是最受欢迎的选择,在许多应用中是首选的它提出了有价值的特征,例如在连续输入变化的情况下更高的精度以及连续和平滑的输出变化[5]。尽管有这些有价值的优点,COG的主要缺点是,它需要相对较高的计算量,导致较高的实现成本和较低的速度相对于其他去模糊化方法。加权平台平均(WPA)[3,5]作为另一种去模糊化算法,既表明了可接受的准确性,也具有直接的硬件实现,将其作为许多现有硬件模糊推理引擎[3]的首选。它试图通过基于以下等式计算其各个模糊隶属函数(MF)的确定未受保护部分的边距。如图所示,落在由HUL指示的水平虚线上方的所有CSA单元,以及垂直虚线右侧的所有CSA单元WPA¼N1/1 中点i×高度iN高度1/1ð2Þ由VUL指示虚线在没有任何保护的情况下使用,而所有其它CSA单元由TMR技术保护。因此,选择HUL = 0和VUL = 0导致完全保护的阵列乘法器,而增加HUL\VUL将相应的虚线向下移动,以降低RAM的保护级别,并显着改善其面积,延迟和功耗。电路的动态功耗是总功耗的主要因素,由[23]给出:其中梯形模糊隶属函数的高度和平台中点如图3所示。图4示出了Eq.(五)、3.2. 仿真环境P动态¼a:CL·V2·f1其中,a是活性因子,CL是负载电容,VDD是电源电压,f是时钟频率。考虑到TMR和RTMR模型电路两者的相同的活动因子、时钟频率和电源电压,由于RTMR模型提供更小的面积,所以它们基于CL与动态功耗的线性关系消耗更少的功率,如等式(1)所示(一).3. 高性能硬件模糊引擎由于其效率和嵌入式知识,高性能硬件模糊引擎是控制复杂实时工厂的良好候选者,即使在恶劣环境和安全因此,考虑到高性能硬件模糊引擎的可靠性问题变得非常重要,特别是当在不可靠的纳米级技术上实现它时,如前所述。在模糊引擎中,由于其迭代计算和高计算能力需求,去模糊化块应被认为是最容易出错的部分。与模糊化和推理机部分相反,模糊化和推理机部分可以使用具有合理开销的合适的传统容错设计技术以完全保护的方式实现,去模糊化块的容错实现涉及在面积、延迟和使用C有限长度算术建模扩展(C-FLAME)[23]库开发了WPA去模糊化块的两种不同的TMR和RTMR模型。然后用大量随机生成的模糊值对模型进行测试,在一些不同的输出隶属函数集上,以实现公平的仿真结果。所谓的TMR模型由两个纹波进位加法器和一个阵列乘法器组成,使用TMR技术进行最大保护。另一方面,RTMR模型由两个RRCA和一个RAM组成,这两个RRCA和一个RAM部分地基于RFT概念进行保护。TMR模型的单个参数是不影响其容错水平的字长(WL)。然而,RTMR模型具有四个参数:WL、AUL、HUL和VUL,而HUL和VUL是RAM的保护参数,AUL代表RAM的保护参数图三.梯形模糊隶属函数的高度和中点。PH.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289293见图4。加权平台平均解模糊硬件框图。这两种RRCA都避免了模拟时间复杂性。一个额外的精确位真模型的WPA还开发使用传统的精确加法器和乘法器,以初步提取的TMR和RTMR模型的最佳WL进一步的模拟。为了对TMR和RTMR模型进行公平的比较研究,针对300,000个输入模糊数计算了两个模型的去模糊化清晰输出值的平均绝对误差(MAE)、绝对误差方差(AEV)和最大绝对误差(MAX),这些模糊数是基于具有不同属性和应用领域的三种不同模糊MF集随机生成的[23],以获得一般化结果。两种模型的所有输出误差都是相对于精确COG的输出结果计算的解模糊3.2.1. 提出的多并发故障模型为了测量这些模型在瞬态软错误的存在下的性能,我们已经开发了一个现实的多瞬态故障模型在低抽象级别(即门级)。它支持在设计中所有现有FA和CSA(作为RRCA和RAM的主要构建块)的求和和进位输出上同时发生多个软错误。为了实现更一般化的结果,一个悲观的故障注入机制也被开发和使用,以验证基于保守策略的两个模型的行为。基于这种机制,所有现有FA和CSA的输出都是基于恒定且相似的错误概率(Perr)的故障注入的对象。通过严格切换输出值(位翻转模型),然后允许故障值自由传播到后续电路,对任何输出上的瞬态故障的发生进行建模。这意味着电路中发生的所有瞬态故障都被转换为软错误,这是一种基于实际电路中存在的不同错误掩蔽特征的悲观策略[23,25]。3.3. WPA TMR和RTMR模型本节提供了精确位真模型的仿真结果,以提取最佳WL值用于进一步仿真。基于提取的WL,对TMR和RTMR模型的保护参数进行了详尽的仿真,对比分析了两种模型的容错水平,证明了RTMR模型通过正确的参数调整可以精确地跟踪TMR模型的行为。在具有更多RTMR组件和参数的更复杂的系统中,可以利用自动设计空间探索方法(例如遗传算法)来代替穷举仿真,以实现导致足够好的结果的参数值,同时显著减少仿真时间。3.3.1. Bit-true模型仿真:提取最佳WL开发的精确位真模型在解释的条件下进行了广泛的模拟,以实现WPA算法硬件的最佳WL(图4)。图5显示了不同WL的精确模型的MAE、AEV和MAX误差。它显示图五. 精确模型在不同词谱下的误差曲线。将系统WL增加到6比特以上不会显著地改善去模糊化过程的误差度量。因此,WL为6或7是WPA去模糊化块的最佳实现的最佳选择。3.3.2. TMR和RTMR模型的仿真结果本节的结果表明,在错误的环境或实现技术的情况下,RTMR模型可以准确地跟踪相同的容错水平的TMR模型通过适当的微调其参数,同时还建议相对较低的实现成本和更快的运行速度。与完全保护的TMR模型相反,RTMR模型中的保护区域的大小取决于AUL、HUL和VUL参数的值。RTMR模型的所有受保护部分中的瞬时错误将被第一个投票者掩盖;如果它发生在模型的故障可能部分或未受保护部分中,则肯定会变成有效错误表决器的输入上同时发生多个瞬态错误是可能导致TMR模型以及RTMR模型的受保护部分中的有效错误的唯一情况。为RTMR模型的所有三个参数选择零值类似于TMR模型。增加这些参数中的每一个减小了受保护部分的大小,因此增加了软错误的概率,并且同时改善了系统面积、延迟和功耗。这一部分的模拟结果有一些重要的观点第一点是,由于软错误的可能多次出现,有效错误甚至可能出现在TMR模型以及RTMR模型的受保护部分中,相对于未受保护部分具有低得多的速率。下一个重要的点是,本节的所有仿真结果都是针对10- 3和10- 4两个不同的Perr值给出的,以证明错误率变化对去模糊化块模型性能的影响。最后一点是,有两种不同的方法可以用来提取RTMR模型参数。第一种是贪婪方法,它试图根据参数对模型精度和成本的影响,根据参数的重要性逐一确定参数。该方法的主要优点是其合理的仿真时间,而其主要缺点是,它不会导致一个全局最优的参数值,由于其贪婪的性质。下一种方法是同时固定所有保护参数。虽然这种方法可能会导致更优化的结果,相对于贪婪的方法,它需要更高的仿真时间,特别是对于具有多个RTMR组件和许多不同的保护参数的系统虽然我们在本文中使用了第294H.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289以确定这三个参数中的每一个的重要性和影响。3.3.2.1. WPA RTMR模型对单个参数变化的行为。本节的模拟结果展示了RTMR模型在仅一个当其他两个参数无效或为零时,其三个保护参数中的一个。图图6-8分别示出了RTMR模型相对于单独改变AUL、HUL和VUL的MAE、AEV和MAX误差。在所有三条曲线中,针对零参数值报告的误差值(灰色阴影)对应于RTMR模型的所有三个保护参数无效时的情况,这类似于完全TMR模型。结果表明,相对于全TMR模型,可以在不影响其容错水平的情况下提高RTMR模型的保护参数值。根据图6,当Perr = 10- 4时,如果我们将AUL、HUL和VUL增加到最大值4、5和7,而其他两个参数为零,则RTMR模型提供与TMR模型相同的MAE。如果Perr增加到10- 3,这些参数的最大值变为1,分别为3和7。以类似的方式并基于图7,当我们将AUL、HUL和VUL增加到3、5和9(Perr = 10- 4)时,RTMR模型提供了与TMR相同的AEV。对于Perr = 10- 3,这些最大值分别减少到1、1和3。这些图还表明,将软错误率从10- 4增加到10- 3会显著降低所有三个错误度量的值和增加率。当误码率增加时,设计者可以通过减小未保护区域的大小来保持相同的误码度量值。例如,图6中两个Perr值的AUL曲线表明,当Perr= 10- 3时,可以通过减小AUL参数(或加法器中未保护区域的大小)来实现Perr = 10- 4作为一个数值实例,当Perr = 10- 4时,通过选择AUL = 7来实现2.7然而,在这方面,为了在错误率增加到10- 3时保持相同的MAE,应该通过选择AUL = 4来增加受保护段的大小。以类似的方式,图7示出了当错误率从10- 4增加到10- 3时,将HUL参数减小约2或3保持相同的AEV。然而,由于MAX误差准则的非线性性质,该规则对于MAX误差准则是无效的,这将在下文中进行更多解释。图六、对于Perr = 10- 3和10- 4,RTMR模型的MAE值仅针对一个参数的变化,其他参数无效。见图7。当Perr = 10- 3和10- 4时,RTMR模型的AEV值仅针对一个参数的变化,而其他参数无效。图8.第八条。对于Perr = 10- 3和10- 4,RTMR模型的MAX值仅针对一个参数的变化,其他参数无效。这三幅图的下一个重要结果是,尽管增加三个参数中的每一个都会降低所有误差度量,而不管Perr如何,但误差度量的降低速率对于所有三个参数并不相似 如图1A和1B所示。如图6和图7所示,AUL增加一个单位导致去模糊化块的MAE和AEV相对于HUL的降解更高。图图6和图7显示,对于Perr = 10 - 3,AUL增加超过5会使去模糊化块的MAE和AEV都高度降低,并且结果从图中排除。同样以类似的方式,增加HUL对相对于VUL的去模糊化块输出错误具有更大的破坏性影响。这些结果意味着,降低RRCA加法器的保护水平对去模糊化块相对于RAM乘法器的整体行为具有更大的破坏性影响如果我们考虑到,H.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289295加法器的保护相对于乘法器需要少得多的成本,这将在下面的部分中讨论。关于所呈现的仿真结果的最后一个重要注意事项是,如图8中清楚地指示的,随着Perr增加,去模糊化块的总体MAX误差变得更加不确定。虽然这是一个预期的结果,由于nondeterministic发生的软错误的块,它强调,模糊的应用程序,这是武装的RTMR去模糊化块应该能够容忍罕见的,但大的错误时,它是利用在一个错误的环境。3.3.2.2. WPA RTMR模型参数同时变化时的行为。上 一 节的仿真结果显示了三个不精确参数的重要性顺序,基于它们对WPA块的总体误差的影响,为AUL,HUL和VUL。在本节中,我们将提取RTMR模型在所有三个保护参数同时变化时的行为。这些仿真结果可用于确定RTMR模型参数的最大可接受值,以实现所开发的不精确加法器和乘法器的最佳物理特性,同时提供与TMR模型相似的容错重要的是要注意,确定RTMR和TMR模型的全局行为的相似性是一个定性的有许多其他的去模糊化算法与不同的去模糊化的输出值,可以利用在模糊applica-灰,而不是WPA。以类似的方式,这意味着模糊应用程序也可以容忍与TMR模型输出的一定程度的偏差,而不会降低任何性能这可以用来增加RTMR模型的参数值,以实现相对于TMR的更多偏离的误差因子,从而进一步改善去模糊化块的物理性质。图图9至图11示出了根据本发明的方法的MAE、AEV和MAX误差结果。RTMR模型的三个参数的合适范围为10- 3和10- 4两种不同的Perr率。虚线表示曲线上各个点的全局趋势在下文中,我们使用三元符号(AUL,HUL,VUL)来处理RTMR模型的特定参数集,该参数集对应于每条曲线上的特定点基于该符号,所有曲线上的点(0,0,0)类似于在所有三个图中由灰色阴影突出显示的完全TMR模型模拟结果显示-假 设将 错 误 率增 加 10 倍 会使 去 模 糊化 块 的所 有 三个 错 误 度量(MAE、AEV和MAX)急剧降级。由于仿真的不确定性,它也增加了所有误差因子的多样性,特别是关于MAX因子。仿真结果清楚地表明,可以将RTMR模型的一些或所有三个参数增加到一定限度,以降低其实施成本,同时提供TMR模型的相同行为 图 9和10表明,当Perr = 10 - 4时,RTMR模型选择(3,4,5)或更高的参数集,不会使RTMR模型的MAE和AEV相对于TMR产生有意义的偏差。这些数字还表明,将Perr增加到约10在这种情况下,选择(1,2,5)参数集会导致两个模型的行为相同,而增加每个参数(特别是AUL和HUL)会导致RTMR模型的MAE和AEV相对于TMR的高度失真。从这些结果中可以得出的下一个重要的观点是,增加AUL比HUL更能破坏误差度量,并且以类似的方式增加HUL比VUL更能降低误差度量这支持了上一节关于不同单个参数的重要性的模拟结果模拟的最后一个重要结果是,每一个保护参数(或者换句话说,减小被利用的RAM和RRCA的受保护部分的大小)增加了所有的错误度量。这一点更加清楚,Perr= 10-3。然而,结果表明,如果Perr增加,仍然可以通过减小去模糊化块的未受保护部分的大小来保持相同的误差值。作为图9中的实例,对于Perr = 10- 4,RTMR(4,4,5)相对于TMR模型的MAE值之间的差异约为1%,而同时,将Perr增加到10- 3也将该差异增加到约9%。为了达到同样的1%的差异,设计者应该支付一些额外的容错成本,并通过选择参数值(1,3,5)或(2,1,5)作为某些实例来增加保护部分的大小。 在一个类似的方式,图。当Perr = 10 - 4时,RTMR(4,4,5)模型与TMR模型的AEV值相差约3%。当Perr增长到10- 3时,差异增加到约35%。在这种情况下,通过选择相同的(1,3,5)和(2,1,5)参数集来减小未保护区段的大小,将AEV差异分别减小到15%和5%以实现最大图9.第九条。Perr = 10- 3和10- 4时,RTMR模型对三个参数同时变化的MAE值。296H.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289图10个。Perr = 10- 3和10- 4时,RTMR模型的AEV值与其三个参数同时变化的关系。见图11。当Perr = 10- 3和10- 4时,RTMR模型对三个参数同时变化的最大值。RTMR模型和TMR模型的AEV值相差1%时,RTMR模型的参数值取(0,1,3)时,应进一步减小无保护区的尺寸。3.4. RTMR和TMR模型在本节中,我们将展示RTMR和TMR模型的物理特性,以全面了解RTMR模型的优越性。如图4所示,去模糊化块数据路径由乘法器和两个加法器组成,其中乘法器和加法器在其关键路径上。 图图12示出了RTMR模型的加法器和乘法器的受保护和不受保护部分的大小,用于它们的参数值和不同Perr值的一些特定实例。RRCA和RAM的未受保护部分以黑色突出显示。表1还包括图中提到的TMR和RTMR模型的物理特性以及模拟结果 为了实现该表的综合结果,RTMR加法器和乘法器的VHDL模型(如图1和2所示)。1和2)被开发和利用来构造图4所示的WPA去模糊化块。基于3.3.2.2部分中提取的参数值,开发了具有四个不同参数的WPA VHDL模型在45 nm库上使用Synopsis Design Modeler合成不同的参数值集(如图12利用WPA模型构造了参数均为(AUL = 0,HUL = 0,VUL = 0)的TMR当综合所有五个模型时,综合工具的优化表的最后五列包括数据路径面积、关键路径延迟、总功耗,以及在45 nm CMOS工艺库单元上合成时的每种情况的面积延迟积(ADP)和功率延迟积(PDP)。为方便起见,表中还包括了模型的MAE、AEV和MAX误差仿真结果。表I的模拟和综合结果清楚地表明了RTMR模型的不同实例优于TMR。对于Perr = 10- 4,TMR模型的行为与RTMR#1模型非常相似(图12-a),但提供了71%的面积,25%的关键路径,63%的功耗,以及分别高116%和106%的ADP和PDP。 通过将误差率增加到Perr = 10-3,RTMR#1模型的误差行为相对于TMR降低。在这种情况下,我们可以通过选择RTMR#2模型(图12-b)作为实例来支付更多的容错设计成本,以减少未受保护部分的大小。在这种情况下,H.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289297见图12。RTMR模型的受保护和未受保护部分的图示,具有一些有效参数集:a)RTMR#1(AUL = 4,HUL = 4,VUL = 5),b)RTMR#2(AUL = 2,HUL= 1,VUL = 5),c)RTMR#3(AUL = 1,HUL = 3,VUL = 5),d)RTMR#4(AUL = 0,HUL = 1,VUL = 3)。表1WPA TMR和RTMR模型在参数值(WL = 6)的特定情况下的模拟和合成结果模型类型误差模拟结果合成结果Perr MAEAEVMax面积(um2)延迟(us)功率(uw)面积延迟积功率延迟积TMR#110- 3 2.472.8610010694.48594684376110-4 2.462.753210694.485946843761RTMR#110- 3 2.713.872326243.55252165182210- 4 2.492.85486243.552521651822RTMR#210- 3 2.493.033078384.167334632779RTMR#310- 3 2.493.36407894.065831402621RTMR#410- 3 2.472.8712310204.482644673618对于Perr = 10- 3, TMR模型提供了相对于RTMR#2模型更相似的行为,它仍然分别具有大约27%、7%和27%的更高的面积、延迟和功耗以及35%的更高的ADP和PDP。如果利用解模糊块的应用程序可以容忍更多的TMR模型偏差,则可以利用RTMR#3(图12-c)或模型来代替TMR。例如,TMR模型提供了比RTMR#3差35%、10%和30%的面积、延迟和功率,以及高约49%和43%的ADP和PDP,而仅提供了略好的MAE和AEV。作为最后一种情况,TMR模型提供了与RTMR#4模型相似的结果,保护水平相对于其他RTMR模型,同时仍然有5%以上的面积和4%以上的功耗。4. 结论基于不精确计算范式,本文强调了一类新的应用程序被忽视,但有价值的功能命名为不精确容忍的应用程序。这些大多数新兴的软和生物启发的应用程序的基本共同特征是它们对可能的不精确源的298H.R. Mahdiani,M.Haji Seyed Javadi/工程科学与技术,国际期刊23(2020)289在他们的计算中。本文提出了一个宽松的版本的三模冗余(TMR)容错设计方案命名为宽松的TMR(RTMR),这是定制处理多个瞬态故障的检测和纠正。为了证明所提出的方法的适用性以及效率,它被用来实现一个高性能的硬件模糊处理器的Defuzzification块。由于其高计算能力需求和迭代计算性质,解模糊块应被视为不精确公差应用的关键情况实验结果表明,该方法可以同时提高物理属性的Defuzzification块的面积,延迟和功耗,而不会降低其容错水平,相对于传统的TMR实现。综合结果表明,基于电路中软错误发生概率,TMR导致的面积、延迟和功耗开销分别比RTMR高71%、25%和63%引用[1] Y. Wei,J. Qiu,H.K. Lam,具有时滞和传感器故障的模糊仿射系统的可靠输出反馈控制的新方法,IEEE Trans.模糊系统。(99)(2016)。[2] A.H.扎瓦拉岛涅托岛Batyrshin,L.V. Vargas,VLSI implementation of amodulefor realization of basic t-norms on fuzzy hardware,IEEE Int. 模糊系统(2009)655-659。[3] A.H.扎瓦拉岛Nieto,Fuzzy hardware:a retrospective and analysis,IEEETrans.Fuzzy Syst.20(4)(2012)623-635。[4] M. Haji Seyed,H.R. Javadi,Mahdiani,E.陈文,一种面向硬件的模糊化算法及其VLSI实现,软计算。J. 17(4)(2013)683-690。[5] H.R. Mahdiani , A.Banaiyan , M.Haji Seyed , Javadi , S.M. 法 赫 拉 伊 角Lucas,Defuzzification block:New algorithms,and
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 十种常见电感线圈电感量计算公式详解
- 军用车辆:CAN总线的集成与优势
- CAN总线在汽车智能换档系统中的作用与实现
- CAN总线数据超载问题及解决策略
- 汽车车身系统CAN总线设计与应用
- SAP企业需求深度剖析:财务会计与供应链的关键流程与改进策略
- CAN总线在发动机电控系统中的通信设计实践
- Spring与iBATIS整合:快速开发与比较分析
- CAN总线驱动的整车管理系统硬件设计详解
- CAN总线通讯智能节点设计与实现
- DSP实现电动汽车CAN总线通讯技术
- CAN协议网关设计:自动位速率检测与互连
- Xcode免证书调试iPad程序开发指南
- 分布式数据库查询优化算法探讨
- Win7安装VC++6.0完全指南:解决兼容性与Office冲突
- MFC实现学生信息管理系统:登录与数据库操作
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功