吴恩达机器学习笔记：监督与无监督学习详解

需积分: 0 147 浏览量更新于2024-06-17 收藏 24.11MB PDF 举报

吴恩达的机器学习课程笔记涵盖了机器学习的基础概念和发展历史。早期，Arthur Samuel（1959年）将机器学习定义为计算机在无明确指令下自我学习的能力，而Tom Mitchell（1998年）则进一步阐述为程序通过经验和反馈改进执行任务的能力。机器学习的核心分为监督学习和无监督学习两大类。监督学习是机器学习的基石，它依赖于有标签的数据集进行训练，目标是预测未知数据的标签。常见的监督学习算法包括KNN、朴素贝叶斯、支持向量机(SVM)、决策树、随机森林和神经网络（如BP）。这些算法广泛应用于垃圾邮件分类、心脏病预测等场景，通过不断调整模型参数以提高预测准确性。在无监督学习中，数据集没有预先提供的标签，算法需要自行发现数据的内在结构和规律。无监督学习的应用包括降维技术，如主成分分析(PCA)和独立成分分析(ICA)，它们可以减少数据的复杂性，便于数据分析和可视化。聚类算法，如K均值和层次聚类，是无监督学习的重要组成部分，用于发现数据中的自然群组，帮助揭示数据的内在组织。此外，异常检测也是无监督学习的应用之一，通过识别数据集中的异常值或异常模式，可以应用于金融监控和网络安全等领域，提升系统的稳定性和安全性。吴恩达的机器学习自做笔记强调了学习过程中理论与实践相结合的重要性，无论是监督还是无监督学习，都要求学习者理解和掌握如何有效地从数据中提取有价值的信息，并将其转化为实际问题的解决方案。

利用三次函数模型与数据集进行拟合

使用多元线性回归的方法，用假设函数来拟合数据。

下面讨论使用三次函数模型来拟合数据。

例要进行预测房子价格

表示用房子面积房子面积的平方房子面积的立方。

中的、、均为输入特征。

把和两者关联起来

把特征设置为房子面积，把特征设置为房子面积的平方，把特征设置为房子面积的立方

即设、、

再用线性回归方法，

就可以拟合这个三次函数模型到数据集上

如像上述那样设置特征、、

特征：房子面积范围大小在到之间

特征：房子面积的平方的范围大小就在到一百万的平方之间

特征：房子面积的平方的范围大小就在到的次方之间

可以看出上述个特征的范围相差很大，因此此时使用梯度下降法的话，那么运用特征缩放就显得更加尤为重要了

之前所述的二次函数模型拟合数据并不是很理想，因为二次函数模型拟合数据到最终曲线会下降，曲线会

下降即意味着房子面积增加的情况下房子价格反而下降的情况，这是使用二次函数模型不理想的地方。因此采用三次函数模型

来拟合数据。当然除了使用三次函数模型之外，还可以通过其他模型来进行拟合。

如：。表示求房子面积的平方根。

表示预测的房子价格房子面积房子面积的平方根。

那么该函数的曲线趋势上升到一定程度之后便慢慢变得平缓，曲线最终也不会下降的，最多也只会缓慢上升。

正规方程（区别于迭代方法的直接解法）

为了求出最优解θ，假如θ是个实数，我们可以求导，令导数等于0得到θ。

但是这里θ是一个N维向量，可以运用微积分的知识，分别对θ1，θ2，θ3，...，求偏导数令其为0得到最

优解。

正规方程提供了一种求θ的解析方法，不需要再像之前梯度下降算法那样运行迭代算法，而是可以直接

一次性求解θ的最优值，即只需要一步就可以得到最优值。

假设有一个非常简单的代价函数：（这里的是一个实数）

可以利用对求导，然后令的导数等于即可得到令最小的值。

在目前所探讨的问题中，θ不是一个实数，而是一个n+1维的参数向量

对每一个都求偏导，并令其偏导为，求对应的的值

举一个m=4的例子，构建一个矩阵X

是一个维矩阵，是一个维向量

为训练样本数量，是特征变量数，其实是

不可逆的两个常见原因：

由于某些原因，学习问题包含了多余的特征。

如在预测住房价格时，如果是以平方英尺为单位的房子面积，是以平方米为单位的房子面积。

两个特征可以用一个线性方程联系起来，这样的话是不可逆矩阵。

在运行的学习算法，有很多特征。具体地说在训练样本小于或等于特征变量的时候。

解决办法是看能否删除某些特征，或者使用一种叫做正规化的方法。

总结：如果是不可逆矩阵，首先看特征里是否有多余的特征像和若是线性相关的或互为线性函数。若的确有一些多余

的特征，可以删除其中一个，无需将两个特征同时保留，所以删除二者其一。如果特征里没有多余的，检查是否有过多的特征，

如果特征数量实在太多，在不影响结果的情况下删除一些特征，或者考虑使用正规化方法

导师的编程小技巧

略



章节06 Octave/Matlab教程(Python编程)

基本操作

移动数据

计算数据

数据绘制

控制语句: for，while...

矢量

本章课程总结

编程作业: 线性回归

01 简单的练习

总结下题目：输出一个5*5的单位矩阵

在此我们用 np.eye(N,M=None, k=0, dtype=<type ‘float’>)

函数的原型： numpy.eye(N,M=None,k=0,dtype=<class 'float'>,order='C')

返回的是一个二维2的数组 (N,M) ，对角线的地方为1，其余的地方为0.

参数介绍：

（1）N：int型，表示的是输出的行数即方阵的维度

（2）M：int型，可选项，输出的列数，如果没有就默认为M=N

（3）k：int型，可选项，默认对角线为1，其余全为0；如果k为正数，则对角线往上第k个全为1，其余

全为0；如果k为负数，则对角线往下第k个全为1，其余全为0

（4）dtype：数据的类型，可选项，返回的数据的数据类型

（5）order：{‘C’，‘F'}，可选项，也就是输出的数组的形式是按照C语言的行优先’C'，还是按照Fortran

形式的列优先‘F'存储在内存中

剩余51页未读，继续阅读

彷徨迷离

粉丝: 6
资源: 1

吴恩达机器学习笔记：监督与无监督学习详解

吴恩达机器学习个人笔记

吴恩达机器学习笔记1（自制版）

最牛吴恩达老师的机器学习笔记

吴恩达机器学习深度学习笔记

对于吴恩达机器学习的学习笔记

吴恩达机器学习讲义、笔记

吴恩达机器学习course1笔记

吴恩达机器学习深度学习笔记以及机器学习训练秘籍（吴恩达新书Machine Learning Yearning）

2023吴恩达机器学习新版课程笔记

斯坦福吴恩达机器学习视频学习笔记.pdf

最新资源