CS229机器学习概率论复习笔记

需积分: 5 200 浏览量更新于2024-08-11 收藏 1.17MB PDF 举报

"这篇文档是斯坦福大学CS229机器学习课程的概率论复习材料，由ArianMaleki和TomDo编写，中文版由石振宇翻译，黄海广审核和修改。它涵盖了概率论的基本要素，包括条件概率、独立性、随机变量及其属性、联合分布、贝叶斯定理、多变量概率以及随机向量和多元高斯分布。文档旨在为机器学习提供概率论基础知识，但不深入到测度论等高级数学理论。" 在机器学习领域，概率论是理解和构建算法的关键工具。这篇资料首先介绍了概率论的基本要素，包括样本空间、事件集和概率度量，确保读者对概率论的基础有清晰的理解。样本空间是所有可能实验结果的集合，而事件集则是样本空间的子集。概率度量是一个函数，满足概率公理，即每个事件的概率非负，所有可能事件的概率总和为1。接着，文档讨论了条件概率和独立性。条件概率是在已知某个事件发生的情况下，另一个事件发生的概率。独立事件是指两个事件的发生互不影响，其概率乘积等于各自概率的乘积。随机变量是概率论中的核心概念，分为离散和连续两种类型。离散随机变量有概率质量函数（PMF），连续随机变量有概率密度函数（PDF）。期望是随机变量的平均值，方差衡量随机变量的离散程度。文档还列举了一些常见的随机变量，如伯努利、二项、泊松和均匀分布。当涉及两个或更多随机变量时，讲解了联合分布、边缘分布和条件分布。联合分布描述了两个或多个变量同时出现的概率，而边缘分布是单个变量的概率分布。贝叶斯定理是条件概率的重要应用，用于更新先验概率以得到后验概率。独立性的概念也扩展到了多个变量，当两个或更多随机变量相互独立时，它们的联合分布可以简化为各自边缘分布的乘积。在处理多个随机变量时，文档特别提到了随机向量和多元高斯分布，这是许多机器学习模型（如高斯混合模型和线性回归）的基础。随机向量是多个随机变量的集合，而多元高斯分布（也称作正态分布）在统计和机器学习中极其常见，它的特性使其在建模复杂数据分布时非常有用。这篇文档为机器学习初学者提供了概率论的坚实基础，涵盖的概率概念是理解和实现许多机器学习算法的基石。通过深入理解这些概念，学生能够更好地应对实际问题，如数据建模、预测和不确定性量化。

图1：一个累计分布函数(CDF)

举例：

假设是一个随机变量，表示放射性粒子衰变所需的时间。在这种情况下，具有无限多的可能

值，因此它被称为连续随机变量。我们将在两个实常数和之间取值的概率(其中 )表示为：

2.1 累积分布函数

为了指定处理随机变量时使用的概率度量，通常可以方便地指定替代函数(CDF、PDF和PMF)，在本节

和接下来的两节中，我们将依次描述这些类型的函数。

累积分布函数(CDF)是函数，它将概率度量指定为：

通过使用这个函数，我们可以计算任意事件发生的概率。图1显示了一个样本CDF函数。

性质：

2.2 概率质量函数

当随机变量取有限种可能值(即，是离散随机变量)时，表示与随机变量相关联的概率度量的更简单

的方法是直接指定随机变量可以假设的每个值的概率。特别地，概率质量函数(PMF)是函数

，这样：

剩余11页未读，继续阅读

不安分实验室

粉丝: 130
资源: 23

CS229机器学习概率论复习笔记

cs229-prob.pdf

斯坦福大学机器学习课程原始讲义

python -u main_informer.py --model informer --data ETTh1 --attn prob --freq h 是什么意思

prob_theta = np.squeeze(prob_fit.theta_) prob_theta = prob_theta.reshape(-1, 1) coef_mat = np.column_stack((prob_theta, logit_fit.coef_[0], linear_fit.coef_[0]))

最新资源