IBM本地模型PMML导出:SPSS-Clementine应用中的数据挖掘与限制

需积分: 13 11 下载量 177 浏览量 更新于2024-08-23 收藏 9.07MB PPT 举报
《数据库本地模型PMML导出 - 数据挖掘原理与SPSS-Clementine应用宝典》由元昌安主编,邓松、李文敬、刘海涛编著,电子工业出版社出版。本书主要探讨了数据挖掘在现代社会中的重要性和应用,特别是在商业决策中的价值。 章节23.5.1.4聚焦于数据库本地模型的PMML导出,这是一种将数据挖掘算法生成的模型转换成PMML(Predictive Model Markup Language)标准格式的技术。PMML是一种开放的标准,用于表示预测模型,使得不同平台间的模型共享和部署成为可能。然而,值得注意的是,PMML导出功能并非所有数据挖掘工具通用,如在Microsoft的Analysis Services和Oracle Data Miner创建的模型,由于平台限制,无法直接导出至IBM Intelligent Miner之外的环境,包括Clementine。 数据挖掘作为一个关键领域,其社会需求随着数据量的爆炸式增长而日益迫切。作者提到,全球信息的增长速度惊人,这促使企业和组织寻求有效的数据挖掘工具来处理和分析海量数据,挖掘其中的有价值信息。例如,著名的“啤酒尿布”案例展示了数据挖掘如何通过发现消费者行为模式帮助企业提升销售。 1.2节详细阐述了数据挖掘的定义,它不仅包括从大量数据中提取隐含模式的过程,而且还涵盖了寻找先前未知关系的能力,与传统的信息检索有所区别。数据挖掘在商业上的定义强调了它为企业提供决策支持和竞争优势的能力,通过对客户资料的深入分析,可以制定更有针对性的营销策略。 本书的历史发展部分介绍了数据挖掘概念的起源,始于1989年的IJCAI会议,随后在1991年至1994年期间的KDD(Knowledge Discovery in Databases)讨论专题中得到了进一步发展。这些早期的工作为后续的数据挖掘技术奠定了基础。 综上,该书深入浅出地讲解了数据挖掘的核心概念、实际应用、工具如SPSS(Statistical Package for the Social Sciences)的使用以及与PMML导出相关的局限性,为读者提供了理解和应用数据挖掘技术的实用指南。