聚类技术驱动的QMP模型:数据挖掘与知识发现

版权申诉
0 下载量 110 浏览量 更新于2024-07-02 收藏 1.71MB PDF 举报
在"计算机研究 -基于聚类技术的QMP模型建立与知识发现.pdf"中,论文探讨了如何利用计算机技术处理和挖掘海量数据中的知识,尤其是在经济、科学决策等领域的重要应用。作者首先指出,随着计算机技术的飞速发展,数据量急剧增加,而有效提取有价值的知识成为亟待解决的问题,这正是数据挖掘技术应运而生的背景。 数据挖掘作为当前国际数据库和信息决策领域的热门研究方向,目标是开发理论、方法和工具,从海量数据中发现有用的信息。特别是对于包含数量型属性的时序数据库,如在金融领域分析公司业绩、预测商品销售模式和股票价格变动,关联规则分析是一种常用的技术。例如,通过市场篮子分析,可以识别出顾客群体的购买习惯,如规则RI所示,大部分购买面包的顾客也往往会购买牛奶。 然而,关联规则仅限于发现事件之间的概率关系,对于股票市场的预测,如规则R2所示,尽管能揭示股票间的某种联动性,但在价格预测上作用有限。因为这类数据本质上是时间序列数据,可以采用时间序列分析方法,如将股票价格涨跌视为事务,通过规则R3发现股票价格走势的模式,即多数下跌后的股票有80%可能在两个交易日后反弹。 论文作者Hongjun Lu在此基础上提出了利用N维数据关联规则对这类问题进行深入探究的新方法。这种方法旨在挖掘数据背后的深层次联系,并可能提供更为精确和全面的知识发现。通过对数据的聚类和分析,可以构建更精细的模型,帮助决策者更好地理解和预测复杂系统的动态行为。这不仅局限于市场分析,还可以应用于其他领域,如用户行为分析、医疗数据挖掘等,以揭示潜在的知识结构和规律。这篇论文着重于如何通过基于聚类技术的模型建立,提升数据挖掘的效率和知识发现的质量。