多变量线性回归与梯度下降算法解析

需积分: 0 27 浏览量更新于2024-08-05 收藏 1.11MB PDF 举报

"这篇笔记主要介绍了机器学习中的线性回归，特别是多变量线性回归以及相关的概念、假设、参数、成本函数和梯度下降优化方法。" 在机器学习领域，线性回归是一种基础且重要的预测模型，用于建立输入特征与输出结果之间的线性关系。在 Week 2 的笔记中，我们关注的是多变量线性回归，它允许我们同时考虑多个特征来预测目标变量。 1. 多变量线性回归的基本概念： - **符号约定**：m 表示样本数量，n 表示特征维度。x_j^(i) 表示第 i 个样本的第 j 个特征，而 x^(i) 包含了第 i 个样本的所有 n 个特征。 2. **假设函数** (Hypothesis): 多变量线性回归的假设函数 h_θ(x) 是所有特征的线性组合，包括一个常数项（偏置项）θ0，形式为： h_θ(x) = θ0 * 1 + θ1 * x1 + ... + θj * xj + θn * xn 其中，向量 θ = [θ0, θ1, ..., θj, ..., θn] 属于实数空间 ℝ^(n+1)，并且 x0 ≡ 1，这样可以将常数项包含进来。 3. **参数** (Parameters): 参数 θ 包括了 θ0, θ1, ..., θj, ..., θn，它们是模型待学习的权重，用于确定特征与目标变量的关系。 4. **成本函数** (Cost Function): 使用均方误差作为损失函数，成本函数 J(θ) 定义为： J(θ) = 1/(2m) * ∑[(h_θ(x^(i)) - y^(i))^2] ，i 从 1 到 m，其中 y^(i) 是第 i 个样本的真实目标值。 5. **目标**: 我们的目标是最小化成本函数 J(θ)，找到最优的参数组合。 6. **梯度下降优化** (Gradient Descent for multiple variables): - 在多变量情况下，梯度下降法同样用于求解最小化问题，但需要对每个参数进行更新。 - 更新规则为：θ_j := θ_j - α * (∂/∂θ_j)J(θ)，其中 α 是学习率，j 从 0 到 n。 - 对于 j=0, x0=1，所以更新规则与单变量情况相同。 - 偏导数计算为：∂/∂θ_j J(θ) = 1/m * ∑[(h_θ(x^(i)) - y^(i)) * x_j^(i)]。 7. **数据预处理**： - **特征缩放** (Feature Scaling) 是一种常见的策略，目的是减小不同特征的数值范围差异，避免梯度下降过程中收敛速度过慢或无法收敛。因为当特征尺度不一时，等高线会变得尖锐，导致梯度下降沿等高线法线方向的步进过大，可能形成 Z 字形路径。预处理通常包括标准化（使特征具有零均值和单位方差）或归一化（将特征缩放到特定范围，如 0-1 或 -1 到 1）。特征缩放有助于优化过程的稳定性和效率，确保模型更好地拟合数据。这篇笔记涵盖了多变量线性回归的基本理论和实现细节，包括模型设定、参数优化以及数据预处理的重要性，这些都是构建有效机器学习模型的关键步骤。

Gradient descent for multiple variables

（多变量梯度下降算法）

Repeat until convergence

{ //依旧是同步更新





 



  









󰇛



󰇜

 



  





 󰇟 





󰇛



󰇜

  

󰇛



󰇜

 





󰇗







󰇛



󰇜

 󰇠

(for j from 0 to n)





 

(for j from 0 to n)

}

偏导推导过程









󰇛



󰇜





 



{





 





󰇛



󰇜

  

󰇛



󰇜









󰇗



󰇞

=







{





 





 







󰇛



󰇜

  







󰇛



󰇜

 







󰇛



󰇜

 

󰇛



󰇜









󰇗



󰇞

=





 󰇟



 







󰇛



󰇜

   







󰇛



󰇜

   







󰇛



󰇜

 

󰇛



󰇜

 





󰇗







󰇛



󰇜

󰇠

=





 󰇟 





󰇛



󰇜

  

󰇛



󰇜

 





󰇗







󰇛



󰇜

 󰇠

剩余13页未读，继续阅读

蒋寻

粉丝: 29
资源: 319

多变量线性回归与梯度下降算法解析

Week 1 笔记 - by Roger1

jquery-week-calendar-master日历控件

web-basics-2-week-1-lena-aiu：web-basics-2-week-1-lena-aiu由GitHub Classroom创建

web-basics-1-week-2-NataMarkova：web-basics-1-week-2-NataMarkova由GitHub Classroom创建

web-basics-1-week-2-lorikhamala：web-basics-1-week-2-lorikhamala由GitHub Classroom创建

web-basics-2-week-1-Rossana900：web-basics-2-week-1-Rossana900由GitHub Classroom创建

backend-1-week-2-Iuliia-Shevtsova：backend-1-week-2-Iuliia-Shevtsova由GitHub Classroom创建

week-2-challenges-gyasigit:week-2-challenges-gyasigit由GitHub Classroom创建

week-2-assessment-rmdpalo：GitHub Classroom创建的week-2-assessment-rmdpalo

week-2-programming-exercise-issmemrid：week-2-programming-exercise-issmemrid，由GitHub Classroom创建

最新资源