应用,IBM 和微软都成立了相应的研究中心,一些公司的相关软件也开始在国内销售,如 Platinum, BO
以及 IBM。
我国的数据挖掘研究开始于 90 年代中期,目前初步形成了知识发现和数据挖掘的基本框架。自
90 年代中期一批研究成果(学术论文)
[6]
逐渐发表在《计算机学报》、《计算机研究与发展》、《软件学
报》、《人工智能与模式识别》等刊物上,研究重点也正在从发现方法转向系统应用,并且注重多种发
现策略和技术的集成,以及多种学科之间的相互渗透。国内从事数据挖掘研究的人员主要在大学,也
有部分在研究所或公司,所涉及的研究领域很多,一般集中于学习算法的研究、数据挖掘的实际应用
以及有关数据挖掘理论方面的研究。目前进行的大多数研究项目是由政府资助进行的,如国家自然科
学基金、863 计划、973 计划等。可以看出,数据挖掘的研究和应用受到了学术界、实业界和政府部
门的越来越多的重视,但是基本上还是以学术研究为主,实际应用上处于起步阶段。1993 年国家自
然科学基金首次支持对该领域的研究项目。目前,国内的许多科研单位和高等院校竞相开展知识发现
的基础理论及其应用研究,如清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中
心等。其中,华中科技大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等
单位开展了对关联规则开采算法的优化和改造。与国外相比,国内对 DMKD 的研究稍晚,没有形成
整体力量。
1.3.2 数据挖掘的应用
目前 KDD 和 DM 已成为研究的热点和焦点,一批 DM 系统开发出来,在商业.经济.金融.管理等
领域都取得了应用性的成果。
市场营销:预测顾客的购买行为,划分顾客群体。
银行业:侦测信用卡的欺诈行为;客户信誉分析。
生产销售和零售业:预测销售额;决定库存量,批发点分布的规划调度。
制造业:预测机器故障;发掘影响生产能力的关键因素。
经纪业和安全交易:预测债券价格的变化;预测股票价格升降;决定交易的最佳时刻。
保险业:分析决定医疗保险的主要因素;预测顾客保险的模式。
计算机安全:监测磁盘驱动器故障;估计潜在的安全漏洞。
政府和防卫:估计军事装备转移的成本;预测资源的消耗;评价军事战略。
医药:验证药物的治疗机理;划分出哪一类型医生会再次购买某类型药品。
交通:航空公司可以根据历史资料寻找乘客的旅行模式,改进航线的设置。
电信:评估客户群;欺诈分析;综合效益分析;网络性能评估等等。
公司经营管理:评估客户信誉,评估部门业绩,评价员工业绩等。