混合型增量分类算法在数据挖掘中的应用

需积分: 5 0 下载量 190 浏览量 更新于2024-08-12 收藏 3.87MB PDF 举报
"该资源是一篇2001年的自然科学论文,主要讨论了一种增量式混合型分类挖掘算法,该算法结合了概率论的符号学习和神经网络学习,适用于处理包含离散和连续属性的数据,尤其在法院决策支持系统中有实际应用并取得良好效果。" 在数据挖掘领域,分类是一种重要的任务,它旨在通过对数据库对象的共同特性的识别来创建模型,然后依据这些模型对数据进行分类。分类的目标是生成准确的描述或模型,用于预测新数据的类别。与回归不同,分类的输出是离散的类别,而回归则产生连续的数值。 本文提出的增量式混合型分类挖掘算法旨在解决包含离散和连续属性的数据集的分类问题。传统上,离散属性通常用于决策树构建,而连续属性往往由神经网络处理。这种算法创新性地将两者结合起来,首先利用符号学习算法处理离散属性,构建二叉判定树,接着,对于那些无法通过离散属性精确划分的实例,算法会利用神经网络(例如FTART网络)来处理其连续属性,进行进一步的分类和学习。 算法的核心优势在于其增量学习能力。当新的数据实例加入时,无需完全重构已有模型,只需要对原有的判定树和神经网络进行适当调整,就能适应新数据并完成学习和分类。这种增量式学习不仅提高了学习效率,也保持了模型的稳定性。 在实际应用中,该算法被应用于法院决策支持系统,显示了它的实用性和有效性。法院决策往往需要处理大量复杂的数据,其中包括离散的法律条款和连续的证据指标,这种混合型分类算法能帮助法官更准确地做出判断,提高决策的准确性。 这篇论文贡献了一种新的数据挖掘方法,通过结合两种不同的学习机制,提升了分类的性能,特别是在处理混合属性数据集时。这种方法对于那些需要处理复杂数据结构的领域,如法律、医疗、金融等,都有潜在的应用价值。