Andrew Ng机器学习入门笔记：从线性回归到SVM

需积分: 5 102 浏览量更新于2024-06-28 收藏 1.52MB PDF 举报

本篇机器学习笔记提供了入门级的学习资料，主要涵盖了机器学习的一些基础概念和技术，以Andrew Ng在Coursera的课程为基础，适合初学者理解和实践。笔记详细探讨了以下几个关键主题： 1. **单变量线性回归**：单元开始介绍了监督学习的概念，通过实例（如预测波特兰房子的价格），阐述了如何利用机器学习技术，如线性回归，分析数据并预测结果。线性回归是一种广泛应用的预测模型，它试图找到输入特征与目标变量之间的线性关系。 2. **多变量线性回归**：进一步扩展到多变量情况，讲解了梯度下降法求解模型参数的方法，以及属性缩放（如标准化）和学习速率的选择。归一化方程（Normal Equation）也作为另一种解决方法提及。 3. **逻辑斯谛回归**：对于二分类问题，逻辑斯谛回归引入了预测函数和损失函数的表达，包括对多元分类的处理。正则化部分探讨了过拟合问题及其解决方案，包括在损失函数中引入正则化项。 4. **神经网络**：非线性假设的神经网络被讨论，包括学习过程、模型解释以及简单的模型示例，如使用神经网络解决异或逻辑问题。 5. **机器学习实践指导**：提供了实用的调试技巧，如模型评估、选择合适的模型（如正则化）、理解偏差和方差、学习曲线的应用等。这部分内容对于实际项目中的模型调优至关重要。 6. **支持向量机（SVM）**：介绍支持向量机的目标优化，间隔（Margin）的概念，以及核函数在非线性问题上的作用。 7. **聚类和降维**：包括经典的k-means聚类算法，降维的重要性，如主成分分析（PCA）在数据降维中的应用。 8. **异常检测**：描述了异常检测的算法原理，提供实践指导，并与监督学习进行比较，还讨论了多变量高斯分布在异常检测中的应用。 9. **推荐系统**：分析了基于内容的推荐和协同过滤算法，这两种在个性化推荐中常用的技术。通过阅读这份笔记，读者将能够建立起机器学习的基本框架，掌握常见模型的原理和应用，以及如何在实际项目中有效地调整和优化模型。

在进行参数更新时，如果是以整个训练集为基础，则称为 Batch 梯度下降。还有增量式

更新，表示如下（只修改步骤 2）：

2.For

=1 to m,

)()()(

))((:

xxhy







(一般我们对训练集中任意记录

)(

增加第一维属性

)(



，这样预测函数为

1100

)(

xxxh 





)。继续执行 1。

2 多变量线性回归

还是以预测房子价格为例，房子的属性除了其面积大小外，这里还有房子楼层数、房子

年龄、厅室数等。也就是说一个房子的特征将不只一个，而是多个。

这里用

表示特征数目，

)(

表示的是训练集中第

个例子的特征向量，

)(

表示第

个

例子的第

个特征值。这是目标函数变为：

xxxxh 



 ...)(

22110

，一般

说来，会为每个记录增加属性



。

在进行多变量线性回归中，对目标函数利用梯度下降进行参数求解的过程为：

1. 判断是否收敛，收敛则终止；否则，转到 2。

2. 更新参数。对

进行同步更新，

)(

)()(

))((

xyxh











。

2.1 利用梯度下降求解

属性的 scaling

对属性进行 scaling 的目标是让属性的范围基本类似，而不会存在数量级差别过多的情

况。Scaling 的好处是让图像变得好看，而且也利于数据处理，如果数据范围过大不仅画图

难看而且占用较多存储。

几种典型的数据 scaling 方法：

（1） min-max normalization

min-max 标准化也成为离差标准化，是对原始数据的线性变换，使得结果落在[0,1]区间，

转换函数如下：

min)(max

min)(





。其中 max 和 min 分别为样本中数据的最大值

和最小值，这种方法的缺陷就是当有新数据加入时，可能导致 max 和 min 发生变化，需要

重新定义。

（2） log 函数转换

变换函数如下：

(max)log/)(log

1010



。这里，max 为样本数据最大值，而且所

有的数据都需要大于等于 1。

剩余27页未读，继续阅读

承让@

粉丝: 8
资源: 380

Andrew Ng机器学习入门笔记：从线性回归到SVM

机器学习学习笔记.pdf

机器学习笔记.pdf

机器学习入门技术笔记.pdf

机器学习个人笔记完整版.pdf.zip

黄海广-机器学习个人笔记v5.26.pdf

机器学习个人 笔记完整版2.5.pdf

python机器学习，最详细入门笔记.pdf

Hadoop Hive入门学习笔记.pdf

强化学习入门笔记.pdf

“机器学习基石”笔记.pdf

最新资源

机器学习个人笔记完整版2.5.pdf