目 录 XV
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
18
17
8.2 局部加权线性回归
................................
141
8.3 示例:预测鲍鱼的年龄
.........................
145
8.4 缩减系数来“理解”数据
.....................
146
8.4.1 岭回归
........................................
146
8.4.2 lasso
............................................
148
8.4.3 前向逐步回归
.............................
149
8.5 权衡偏差与方差
....................................
152
8.6 示例:预测乐高玩具套装的价格
..........
153
8.6.1 收集数据:使用 Google 购物
的 API
........................................
153
8.6.2 训练算法:建立模型
.................
155
8.7 本章小结
................................................
158
第 9 章 树回归
..............................................
159
9.1 复杂数据的局部性建模
.........................
159
9.2 连续和离散型特征的树的构建
.............
160
9.3 将CART 算法用于回归
........................
163
9.3.1 构建树
........................................
163
9.3.2 运行代码
....................................
165
9.4 树剪枝
....................................................
167
9.4.1 预剪枝
........................................
167
9.4.2 后剪枝
........................................
168
9.5 模型树
....................................................
170
9.6 示例:树回归与标准回归的比较
..........
173
9.7 使用Python 的 Tkinter 库创建 GUI
......
176
9.7.1 用Tkinter 创建 GUI
...................
177
9.7.2 集成Matplotlib 和 Tkinter
.........
179
9.8 本章小结
................................................
182
第三部分 无监督学习
第 10 章 利用 K-均值聚类算法对未标注
数据分组
.......................................
184
10.1 K-均值聚类算法
..................................
185
10.2 使用后处理来提高聚类性能
...............
189
10.3 二分K-均值算法
.................................
190
10.4 示例:对地图上的点进行聚类
...........
193
10.4.1 Yahoo! PlaceFinder API
.........
194
10.4.2 对地理坐标进行聚类
.............
196
10.5 本章小结
..............................................
198
第 11 章 使用 Apriori 算法进行关联
分析
................................................
200
11.1 关联分析
..............................................
201
11.2 Apriori 原理
.........................................
202
11.3 使用Apriori 算法来发现频繁集
.........
204
11.3.1 生成候选项集
.........................
204
11.3.2 组织完整的 Apriori 算法
.......
207
11.4 从频繁项集中挖掘关联规则
...............
209
11.5 示例:发现国会投票中的模式
...........
212
11.5.1 收集数据:构建美国国会
投票记录的事务数据集
.........
213
11.5.2 测试算法:基于美国国会
投票记录挖掘关联规则
.........
219
11.6 示例:发现毒蘑菇的相似特征
...........
220
11.7 本章小结
..............................................
221
第 12 章 使用 FP-growth 算法来高效
发现频繁项集
..............................
223
12.1 FP 树:用于编码数据集的有效
方式
.....................................................
224
12.2 构建FP 树
...........................................
225
12.2.1 创建FP 树的数据结构
.............
226
12.2.2 构建FP 树
................................
227
12.3 从一棵FP 树中挖掘频繁项集
.............
231
12.3.1 抽取条件模式基
.......................
231
12.3.2 创建条件 FP 树
........................
232
12.4 示例:在Twitter 源中发现一些
共现词
..................................................
235
12.5 示例:从新闻网站点击流中挖掘
.......
238
12.6 本章小结
..............................................
239
第四部分 其他工具
第 13 章 利用 PCA 来简化数据
................
242
13.1 降维技术
..............................................
242
13.2 PCA
.....................................................
243
13.2.1 移动坐标轴
............................
243
13.2.2 在NumPy 中实现 PCA
..........
246
13.3 示例:利用 PCA 对半导体制造数据
降维
.....................................................
248
13.4 本章小结
..............................................
251
图灵社区会员 lethe3000 专享 尊重版权
下载PDF电子书请到“招财猫咪网”(www.wljz.top)