FPGA实现嵌入式多核处理器与SUSAN算法并行优化

需积分: 16 0 下载量 28 浏览量 更新于2024-08-06 1 收藏 767KB PDF 举报
"该文介绍了如何使用FPGA实现嵌入式多核处理器FPEP的结构设计,并构建了FPGA验证平台。为了评估多核处理器的性能,文章提出了三种基于OpenMP的SUSAN(一种图像处理算法)的并行化策略:直接并行化、图像分块处理和多图像并行处理。实验结果表明,这三种并行算法在Intel四核心平台和FPEP FPGA平台上均能实现接近3.0的加速比,而在FPEP FPGA平台上,多图像并行处理的加速比接近4.0。关键词包括SUSAN算法、FPGA、OpenMP、多核处理器和图像处理。" 本文主要探讨了在FPGA(Field-Programmable Gate Array)上实现嵌入式多核处理器及其性能优化的方法,特别关注了在图像处理领域的应用。首先,作者提出了名为FPEP的四核心嵌入式并行处理器结构设计,该设计旨在提高处理器的并行处理能力,以适应日益增长的计算需求。FPGA作为一种可编程硬件,能够灵活地实现各种复杂的逻辑功能,是构建高性能并行处理器的理想选择。 为了评估FPEP处理器的性能,研究人员选择了SUSAN(Smallest Unimodular Square Amplitude Nuclei)算法,这是一种经典的图像处理算法,常用于边缘检测和图像去噪。他们提出了三种并行化策略: 1. 直接并行化SUSAN:将SUSAN算法的各个步骤分解,让多个核心同时处理不同的任务,提高算法执行效率。 2. 图像分块处理:将大图像分割成多个小块,每个核心负责处理一块,利用多核处理器的并行处理能力,加快处理速度。 3. 多图像并行处理:同时处理多个独立的图像,充分利用处理器的核心资源,提高整体吞吐量。 通过在Intel四核心处理器和FPEP FPGA验证平台上的实验证明,这三种并行化方法都有效提高了SUSAN算法的执行效率。在两种平台上,所有策略的加速比均接近3.0,这意味着它们的执行速度比单核心情况快了约三倍。更值得注意的是,在FPGA平台上采用多图像并行处理,加速比达到了近4.0,显示出FPGA在并行处理中的优势。 此外,文章还强调了OpenMP(Open Multi-Processing)的作用,这是一个用于共享内存并行计算的API标准,使得程序员可以方便地编写跨平台的并行程序。OpenMP在这三种并行策略中起到了关键作用,它简化了多核处理器上并行代码的编写和管理。 总结起来,这篇论文展示了如何通过FPGA实现高效的嵌入式多核处理器,并利用OpenMP实现经典图像处理算法SUSAN的并行化,从而提升系统性能。这些研究对于理解和优化基于FPGA的多核处理器系统,以及在图像处理和其他领域应用并行计算具有重要意义。