改进模糊K均值与BP神经网络的数据挖掘模型
需积分: 9 194 浏览量
更新于2024-08-20
收藏 294KB PDF 举报
"这篇文章是2008年发表在《大连海事大学学报》上的自然科学论文,由李桃迎、陈燕、杨明和牟向伟等人撰写。研究主要探讨了如何解决神经网络算法在处理数据时由于大量无关属性导致的训练效率低下问题,提出了一种基于改进模糊k均值(FKM)算法和BP神经网络的数据挖掘模型。"
本文关注的核心知识点包括:
1. **模糊k均值算法(FKM)**:模糊k均值是一种聚类算法,旨在将数据集中的对象分配到不同的模糊类别中,每个对象可以同时属于多个类别,且属于每个类别的程度是模糊的。在这个研究中,通过改进的FKM算法,可以对输入数据的属性进行聚类分析,识别出与目标属性相关性强和弱的属性。
2. **属性选择**:在数据挖掘中,选择与目标变量高度相关的属性至关重要,因为无关或冗余的属性会增加计算复杂度并降低模型的效率。通过聚类分析,研究人员能够剔除那些与目标属性关联性不强或冗余的属性,从而减少后续神经网络训练的数据量。
3. **BP神经网络**:反向传播神经网络是一种常见的前馈神经网络,主要用于学习非线性函数的映射关系。BP网络通过反向传播误差来调整权重,以最小化预测输出与实际输出之间的差异。然而,当样本数据包含大量无关属性时,训练过程可能变得低效和耗时。
4. **数据挖掘模型**:结合改进的FKM算法和BP神经网络,构建了一个新的数据挖掘模型。这个模型首先使用FKM聚类来预处理数据,然后用优化后的数据集训练BP神经网络,以提高训练效率和预测准确性。
5. **应用实例**:为了验证模型的有效性,研究人员以预测儿童血红蛋白含量为例。血红蛋白含量的预测结果证明了该模型在实际应用中的实用性和可靠性。
6. **文献分类号和标志码**:中图分类号"TP183"表示这是一篇关于计算机科学技术的信息处理技术领域的论文,文献标志码"A"通常代表该文章是应用基础研究。
这篇论文提出了一种创新的数据挖掘策略,通过改进模糊k均值算法对数据进行预处理,减少无关属性的影响,再结合BP神经网络进行高效训练,以实现更准确的数据挖掘任务。这种方法在处理大型数据集时,尤其是面对包含大量无关属性的数据时,有望显著提升模型训练的效率和预测精度。
2024-12-28 上传
2024-12-28 上传
2024-12-28 上传
2024-12-28 上传
weixin_38737635
- 粉丝: 6
- 资源: 917