多核平台下模糊C均值聚类算法的并行化优化研究

16 浏览量更新于2024-09-01 收藏 202KB PDF 举报

"本文主要探讨了在嵌入式系统/ARM技术背景下，如何对模糊C均值聚类算法进行并行化研究，以提高在多核平台上的性能。作者运用Intel Parallel Amplifier工具来识别串行程序的瓶颈，并提出了基于Intel TBB和OpenMP的并行化解决方案。文章详细阐述了并行性的概念，包括并行处理的层次划分，以及不同粒度的并行化策略。同时，提到了多核处理器的普及对并行编程的需求，指出使用Intel Parallel Amplifier进行性能分析是优化程序的一种有效途径。" 模糊C均值聚类算法是一种常见的数据挖掘技术，用于将数据集划分为预设数量的类别。在多核平台上，由于串行执行可能导致性能瓶颈，因此需要通过并行化来提升效率。文中提到的Intel Parallel Amplifier是一个强大的性能分析工具，它可以定位程序中的热点和并发潜力，为并行化提供依据。并行性可以理解为同一时刻多个任务的执行能力，它可以是任务级、循环级乃至指令级。粗粒度并行化适用于大范围的任务分配，如MIMD（多指令多数据）模型，而细粒度并行化则常在SIMD（单指令多数据）中应用，例如在同一指令下处理多个数据元素。并行化方法主要包括资源重复、时间重叠和资源共享，这些策略有助于提高计算效率。多核处理器的广泛使用推动了并行编程的需求。为充分利用多核架构，开发者需要考虑如何在程序设计中引入并行思维，例如，通过循环并行化和任务分配来分散工作负载。操作系统通常设计为支持多核，但为了最大化性能，应用层的并行化设计至关重要。OpenMP和Intel TBB这样的并行库为实现这一目标提供了方便，它们允许程序员以相对较低的复杂性实现并行化，从而在多核环境中提升算法的执行速度。总结来说，本文重点讨论了如何在嵌入式系统/ARM技术中利用并行化技术改进模糊C均值聚类算法的性能，通过Intel工具进行性能分析，结合TBB和OpenMP进行并行编程，旨在应对多核处理器环境下的计算挑战。并行化不仅能够提高计算效率，还能为未来软件开发提供更好的架构支持。

嵌入式系统嵌入式系统/ARM技术中的浅谈模糊技术中的浅谈模糊C均值聚类算法的并行化研均值聚类算法的并行化研

究究

摘要：使用Intel Parallel Amplifier高性能工具，针对模糊C均值聚类算法在多核平台的性能问题，找出串行程

序的热点和并发性，提出并行化设计方案。基于Intel并行库TBB（线程构建模块）和OpenMP运行时库函数，对

多核平台下的串行程序进行循环并行化和任务分配的并行化设计。　　并行性主要是指同时性或并发性，并行

处理是指对一种相对于串行处理的处理方式，它着重开发计算过程中存在的并发事件。并行性通常划分为作业

级、任务级、例行程序或子程序级、循环和迭代级以及语句和指令级。作业级的层次高，并行处理粒度粗。粗

粒度开并行性开发主要采用MIMD方式，而细粒度并行性开发则主要采用SI

　　摘　摘要：要：使用Intel Parallel Amplifier高性能工具，针对模糊C均值聚类算法在多核平台的性能问题，找出串行程序的热点

和并发性，提出并行化设计方案。基于Intel并行库TBB（线程构建模块）和OpenMP运行时库函数，对多核平台下的串行程序

进行循环并行化和任务分配的并行化设计。

　　并行性主要是指同时性或并发性，并行处理是指对一种相对于串行处理的处理方式，它着重开发计算过程中存在的并发事

件。并行性通常划分为作业级、任务级、例行程序或子程序级、循环和迭代级以及语句和指令级。作业级的层次高，并行处理

粒度粗。粗粒度开并行性开发主要采用MIMD方式，而细粒度并行性开发则主要采用SIMD方式。开发计算机并行性的方法主

要有：资源重复、时间重叠和资源共享三种方法。

　　多核处理器的迅速发展，使得多核化不断全面普及。为了应对计算机硬件的发展要求，尽可能利用多核资源，就要设计出

相应的并行化应用程序。多核平台下的并行化有多种方案，利用英特尔推出的高性能分析工具Intel Parallel Amplifier对串行应

用程序进行性能分析，寻出热点实现并行化是其中的一种方法。

　　多核架构能够使用的软件更出色地运行，并创建一个促进未来的软件编写更趋完善的架构。尽管认真的软件厂商还在探索

全新的软件并发处理模式，但是，随着向多核处理器的移植，已有软件无需被修改就可支持多核平台。操作系统专为充分利用

多个处理器而设计，且无需修改就可运行。为了充分利用多核技术，应用开发人员需要在程序设计中融入更多思路，但设计流

程与对称多处理（SMP）系统的设计流程相同，并且单线程应用也继续运行。

　　多内核（multicore chips）是指在一枚处理器（chip）中集成两个或多个完整的计算引擎（内核）。多核技术的开发源于

工程师们认识到，仅仅提高单核芯片（one chip）的速度会产生过多热量且无法带来相应的性能改善，先前的处理器产品就是

如此。他们认识到，在先前产品中以那种速率，处理器产生的热量很快会超过太阳表面。即便是没有热量问题，其性价比也令

人难以接受，速度稍快的处理器价格要高很多。

　　模糊C均值聚类算法（FCM）是一种常用的聚类算法，在大规模数据分析、数据挖掘、模式识别、图像处理等领域有着非

常广泛的应用。它是给定分类数，通过优化目标函数得到样本点对聚类中心的隶属度，把目标函数迭代的过程和处理数据的过

程并行化，提高聚类过程的效率及多核处理器的利用率。实验结果表明，本方法减少了程序的运行时间，显示了多核编程的高

效性。

　　　　1 模糊模糊C均值聚类算法（均值聚类算法（FCM））

　　模糊C均值聚类算法[1]的基本思想是确定每个样本数据隶属于某个聚类的程度，把隶属程度相似的样本数据归为一个聚

类。FCM把n个样本集合X={x1，x2，…，xn}分为c个模糊组，并且求每组的聚类中心Ci（i=1，2，…c），使得目标函数最

小，该算法是优化目标函数的迭代过程。这个过程从一个随机的隶属度矩阵开始，确定聚类中心计算目标函数，通过迭代过程

达到样本分类。

　　初始化：给定样本数n，聚类数c∈[2，n]，模糊度m=2，迭代停止阈值？棕。

　　（4）如果目标函数的改变量小于？棕，停止算法，否者重复（2）直到改变量小于？棕。为了确保FMC得到一个最优

解，要不断调整隶属度矩阵，需多次运行该算法。

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38747144

粉丝: 4
资源: 938

多核平台下模糊C均值聚类算法的并行化优化研究

嵌入式系统/ARM技术中的利用高效的编程技术发挥多内核架构优势

嵌入式系统/ARM技术中的基于ARM的条码精密测量系统

嵌入式系统/ARM技术中的浅谈MPEG-4编码器在Intel PXA27X处理器上的实现

嵌入式系统/ARM技术中的嵌入式视觉系统的构建模块

嵌入式系统/ARM技术中的基于μC/OS-II的嵌入式激光测距系统

嵌入式系统/ARM技术中的嵌入式视觉系统给制造业带来的好处

嵌入式系统/ARM技术中的通用处理器的基本结构

嵌入式系统/ARM技术中的一种基于比特表的实时多任务新调度算法

嵌入式系统/ARM技术中的高速数据采集系统在基于ARM动态称重系统中的应用

嵌入式系统/ARM技术中的解析ARM9和Linux在机器人控制系统的应用

最新资源