没有合适的资源?快使用搜索试试~ 我知道了~
首页IBM SPSS Modeler使用教程
资源详情
资源评论
资源推荐
IBM SPSS Modeler 说明
数据挖掘和建模
数据挖掘是一个深入您的业务数据,以发现隐藏的模式和关系的过程。数据挖掘解决了一个常见的问
题:您拥有的数据越多,就越难有效地分析并得出数据的意义,并且耗时也越长。金矿无法开采,通
常是由于缺乏人力、时间或专业技术。
数据挖掘使用清晰的业务流程和强大的分析技术,快速、彻底地探索大量的数据,抽取并为您提供有
用且有价值的信息,这正是您所需要的“商务智能”。
尽管您数据中的这些以前未知的模式和关系本身很有趣,但一切并不止于此。如果您可以使用这些过
去行为的模式来预测未来可能发生的事情,那又会怎样?这就是建模的目标 -模型,它包含一组从源
数据中抽取的规则、公式或方程式,并允许您通过它们生成预测结果。这正是预测分析的核心。
关于预测分析
预测分析是一个业务流程,其中包含一组相关技术,通过从您的数据中总结出有关当前状况与未来事
件的可靠结论,帮助制定有效的行动措施。它是以下方面的组合:
•高级分析
•决策优化
高级分析使用多种工具和技术,分析过去与现在的事件,并预测未来的结果。决策优化确定您的哪些
措施可以产生最好的可能结果,并确保这些建议措施能够最有效地融入到您的业务流程中。
有关预测分析如何工作的深入信息,请访问公司网站 http://www.spss.com/
predictive_analytics/work.htm。
建模技术
建模技术基于对算法的使用,算法是解决特定问题的指令序列。您可以使用特定算法创建相应类型的
模型。有三种主要的建模技术类别,IBM® SPSS® Modeler 为每种类别提供了一些示例:
•Classi"cation
•关联
•细分(有时称为“聚类”)
分类模型
使用一个或多个输入字段的值来预测一个或多个输出(或目标)字段的值。这些技术的部分
示例为:决策树(C&R 树、QUEST、CHAID 和 C5.0 算法)、回归(线性、logistic、广义线性和
Cox 回归算法)、神经网络、Support Vector Machine (SVM) 和贝叶斯网络。
关联模型
查找您数据中的模式,其中一个或多个实体(如事件、购买或属性)与一个或多个其他实体
相关联。这些模型构建定义这些关系的规则集。数据中的字段可以作为输入和目标。您可以手动查找
这些关联,但关联规则算法可以更快速地完成,并能探索更多复杂的模式。Apriori 和 Carma 模型
是使用此类算法的示例。另一种类型的关联模型是序列检测模型,后者可以在按时间建立结构的数据
中查找顺序模式。
细分模型
将数据划分为具有类似输入字段模式的记录段或聚类。细分模型只对输入字段感兴趣,没有
输出或目标字段的概念。细分模型的示例为 Kohonen 网络、K-Means 聚类、两步聚类和异常检测
等。
我如何知道使用哪种技术?
有这样种类繁多的技术摆在面前,很难知道从哪里开始解决您的特定问题。幸运的是,IBM®
SPSS® Modeler 可以通过自动化建模形式替您做出其中的部分决定。这是一种功能强大的技术,
它能评估和比较多种不同建模方法,并按有效性顺序对它们进行排序。这样,您可以在单次建模运行
中尝试多种方法。
自动建模
使用说明
要启动该应用程序,请从 Windows“开始”菜单的 SPSS Inc 程序组中选择 IBM® SPSS®
Modeler14.1。几秒钟后,屏幕上将显示主窗口。
在数据挖掘过程中的每一个阶段,均可通过 IBM® SPSS® Modeler 易于使用的界面来邀请特定业务
的专家。建模算法(如预测、分类、细分和关联检测)可确保得到强大而准确的模型。模型结果可以方
便地部署和读入到数据库、IBM® SPSS® Statistics 和各种其他应用程序中。
使用 SPSS Modeler 即处理数据的三个步骤。
•首先,将数据读入 SPSS Modeler,
•然后,然后通过一系列操纵运行数据,
•最后,将数据发送到目标位置。
这一操作序列称为数据流,因为数据以一条条记录的形式,从数据源开始,依次经过各种操纵,最终到
达目标(模型或某种数据输出)
流工作区是 IBM® SPSS® Modeler 窗口的最大区域,也是您构建和操纵数据流的位置。
通过在界面的主工作区中绘制与业务相关的数据操作图表来创建流。每个操作都用一个图标或节点表示,
这些节点通过流链接在一起,流表示数据在各个操作之间的流动。
在 SPSS Modeler 中,可以在同一流工作区或通过打开新的流工作区来一次处理多个流。会话期间,流
存储在 SPSS Modeler 窗口右上角的“流”管理器中。
IBM® SPSS® Modeler 中的大部分数据和建模工具位于节点选项板中,该选项板位于流工作区下方窗
口的底部。
例如,可以使用“记录选项”选项板选项卡中包含的节点对数据记录执行操作,如选择、合并和追加等。
要将节点添加到工作区,请在节点选项板中双击图标或将其拖放到工作区。随后可将各个图标连接以创
建一个表示数据流动的流。
每个选项板选项卡均包含一组不同的流操作阶段中使用的相关节点,如:
•源。此类节点可将数据引入 SPSS Modeler。
•记录选项。此类节点可对数据记录执行操作,如选择、合并和追加等。
•字段选项。此类节点可对数据字段执行操作,如过滤、导出新字段和确定给定字段的测量级别等。
•图形。此类节点可在建模前后以图表形式显示数据。图形包括散点图、直方图、网络节点和评估图
表。
•建模。此类节点可使用 SPSS Modeler 中提供的建模算法,如神经网络、决策树、聚类算法和数据
排序等。
•数据库建模。 节点使用 Microsoft SQL Server、IBM DB2 和 Oracle 数据库中可用的建模算法。
•输出。节点生成可在 SPSS Modeler 中查看的数据、图表和模型等多种输出结果。
•导出。节点生成可在外部应用程序(如 IBM® SPSS® Data Collection 或 Excel)中查看的多种
输出。
•SPSS Statistics。 节点将数据导入 IBM® SPSS® Statistics 或从中导出数据,以及运行 SPSS
Statistics 过程。
随着对 SPSS Modeler 的熟悉,您也可以自定义供自己使用的选项板内容。
可以使用“流”选项卡打开、重命名、保存和删除在会话中创建的流。
“输出”选项卡中包含由 IBM® SPSS® Modeler 中的流操作生成的各类文件,如图形和表格。您可以
显示、保存、重命名和关闭此选项上列出的表格、图形和报告。
“模型”选项卡是管理器选项卡中功能最强大的选项卡。该选项卡中包含所有模型块,这些模型块包含针
对当前会话在 SPSS Modeler 中生成的模型。这些模型可以直接从“模型”选项卡上浏览或将其添加到工
作区的流中。
剩余37页未读,继续阅读
姽婳一方
- 粉丝: 42
- 资源: 21
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0