神经网络在分类数据挖掘中的属性选择与规则抽取研究

版权申诉
0 下载量 98 浏览量 更新于2024-08-08 收藏 2.08MB PDF 举报
"这篇硕士学位论文主要探讨了基于神经网络的分类数据挖掘中的属性选择和规则抽取问题,由天津大学的文专撰写,导师为王正欧,专业为系统工程。研究集中在利用神经网络和模糊逻辑技术改进属性选择的效率和规则抽取的准确性,提出了三种新的算法:基于输入输出关联法排序的RBF神经网络属性选择方法、可分性判据排序的RBF神经网络属性选择方法以及基于降维的概率神经网络模糊规则抽取方法。" 在数据挖掘领域,神经网络是一种强大的工具,特别是在分类任务中。然而,处理大规模、高维数据时,如何构建高效且可扩展的算法是一个挑战。属性选择和规则抽取是这一过程中的关键步骤。属性选择旨在确定对分类最有影响力的特征,以减少计算复杂性和提高模型性能;规则抽取则旨在从数据中提取易于理解和解释的决策规则。 第一种提出的算法,即基于输入输出关联法排序的RBF神经网络属性选择方法,针对属性选择的NP难题,通过计算输入输出之间的关联性对属性进行排序,然后仅使用RBF神经网络处理最重要的一部分属性,显著提升了选择效率。 第二种算法引入了可分性判据,计算每个属性对于分类任务的区分能力,并据此排序,再应用RBF神经网络进行属性选择,进一步优化了属性的重要性评估。 最后,作者提出了一种基于降维的概率神经网络模糊规则抽取方法。首先,利用属性选择算法挑选出最重要的部分属性,然后对这些属性进行模糊化处理,利用概率神经网络生成模糊规则。这种方法减少了神经网络的训练规模,避免了节点裁剪,提高了规则抽取的效率,同时,模糊规则的形式使得知识表示更易理解,规则精度也得到提升。 综上,这篇论文通过创新的算法,显著改善了基于神经网络的分类数据挖掘在属性选择和规则抽取上的性能,为数据挖掘领域的理论与实践提供了有价值的贡献。关键词包括数据挖掘、神经网络、属性选择和规则抽取。