高性能FP分频器:基于Goldschmidt算法与共享乘法器

0 下载量 156 浏览量 更新于2024-08-28 收藏 448KB PDF 举报
"本文介绍了一种基于Goldschmidt算法的高性能浮点(FP)分频器设计,旨在解决除法运算复杂、计算时间长的问题。该设计利用Bipartite reciprocal look-up tables节省面积获取迭代初始值,并通过并行乘法器减少延迟。此外,通过状态机控制实现管道执行,提升吞吐量。该方案在数字信号处理(DSP)芯片中得以实现,通过共享已有的乘法器来优化资源利用。" 在高性能计算和现代应用中,浮点除法(FP division)的需求日益增长,但由于其复杂的计算过程和较长的延迟时间,成为计算性能的一个瓶颈。针对这一问题,文章提出了一种创新的解决方案,即基于Goldschmidt算法的FP分频器设计。Goldschmidt算法是一种快速除法的迭代方法,能够有效地将除法转化为乘法操作,从而减少计算复杂性。 设计的关键在于采用Bipartite reciprocal look-up tables来获取迭代的初始值。这种方法能够节省硬件资源,因为它利用预计算的表来存储部分结果,减少了计算过程中所需的逻辑门数量,从而降低了面积成本。 为了进一步降低延迟,设计中引入了并行乘法器。在每次迭代过程中,这些并行乘法器可以同时进行多个乘法运算,显著提高了计算速度,减少了总的执行时间。这种并行化策略对于提升整个系统性能至关重要,尤其是在需要高吞吐量的应用场景中。 为了支持管道执行并最大化处理效率,设计还包括了一个状态机控制器。状态机负责协调各个阶段的操作,确保数据流的连续性和无阻塞,从而提升了系统的吞吐量。这样的设计使得FP分频器能够在不影响其他计算任务的情况下连续处理多个除法请求,提高了整体系统的并发处理能力。 最后,该设计在数字信号处理(DSP)芯片上实现,通过共享现有的乘法器资源,避免了重复建设,节约了硬件成本。这样的实现方式既满足了高性能计算的需求,又充分考虑了资源的有效利用,是嵌入式系统和高性能计算平台的理想选择。 这篇论文提出的基于Goldschmidt算法的带共享乘数的高性能FP分频器设计,通过优化算法、并行化计算以及高效的控制机制,成功地解决了浮点除法的计算复杂性和延迟问题,为需要频繁进行浮点除法运算的领域提供了高效能的硬件解决方案。