改进模糊均值法:面向技术路线图的文本聚类挖掘
需积分: 6 61 浏览量
更新于2024-08-12
收藏 541KB PDF 举报
本文主要探讨的是"面向路线图编制的模糊均值文本聚类挖掘方法研究"(2011年),该研究针对模糊c均值聚类算法在实际应用中遇到的问题,特别是对初始值的敏感性和稳定性较差。作者李向东、刘晓斌、武利平和常洪梅在河北工业大学管理学院提出了改进的聚类方法——CGFCM(cGaussian Fuzzy C-Means)。CGFCM方法的创新之处在于结合了遗传算法和类的概念向量。
首先,遗传算法被用来解决模糊c均值算法对初始聚类中心依赖性高的问题。遗传算法以其全局搜索的能力,能够在众多可能的初始值中寻找到更优的聚类中心,从而提高聚类的稳定性和准确性。这一步骤为文本数据的聚类提供了更为坚实的起点。
接着,类的概念向量被引入,用于构建概念向量矩阵。概念向量是一种表示文本特征的方式,它将文本的抽象概念编码为数值形式,使得文本之间的相似度计算更为精确。通过迭代地更新和优化概念向量矩阵,CGFCM方法能够实现文本的模糊聚类划分,即允许数据点同时属于多个类别的概率。
最后,为了验证CGFCM方法的有效性,作者通过实例对比分析,展示了其在文本聚类挖掘任务中的优越性能。相比于传统的模糊c均值方法,CGFCM在聚类结果的稳定性和精度上有所提升,这对于技术路线图的编制等应用场景具有重要的实际价值。
这篇论文的核心贡献是提出了一种结合遗传算法与概念向量的文本聚类挖掘方法,旨在解决模糊c均值算法的局限性,并通过实证研究证明了其在技术路线图编制中的实用性和有效性。这个研究成果对于理解和改进文本数据分析技术,特别是在技术领域的发展规划中具有重要意义。
2021-09-10 上传
2021-09-10 上传
2022-07-14 上传
2022-09-22 上传
2022-07-13 上传
2021-10-02 上传
2021-06-13 上传
2022-09-24 上传
2022-09-24 上传
weixin_38703980
- 粉丝: 6
- 资源: 878
最新资源
- 前端协作项目:发布猜图游戏功能与待修复事项
- Spring框架REST服务开发实践指南
- ALU课设实现基础与高级运算功能
- 深入了解STK:C++音频信号处理综合工具套件
- 华中科技大学电信学院软件无线电实验资料汇总
- CGSN数据解析与集成验证工具集:Python和Shell脚本
- Java实现的远程视频会议系统开发教程
- Change-OEM: 用Java修改Windows OEM信息与Logo
- cmnd:文本到远程API的桥接平台开发
- 解决BIOS刷写错误28:PRR.exe的应用与效果
- 深度学习对抗攻击库:adversarial_robustness_toolbox 1.10.0
- Win7系统CP2102驱动下载与安装指南
- 深入理解Java中的函数式编程技巧
- GY-906 MLX90614ESF传感器模块温度采集应用资料
- Adversarial Robustness Toolbox 1.15.1 工具包安装教程
- GNU Radio的供应商中立SDR开发包:gr-sdr介绍