Python实现牛顿法与梯度下降法：多元线性回归求解

版权申诉

63 浏览量更新于2024-09-11 1 收藏 100KB PDF 举报

本篇文章主要介绍了如何通过Python编程实现多元一次函数的线性回归，特别是利用牛顿法和梯度下降法来解决这一问题。首先，让我们概述一下这两种优化方法。 **梯度下降法原理** 梯度下降是一种优化算法，用于寻找函数的局部最小值。其基本思想是沿着函数梯度的反方向逐步调整参数（θ），以降低损失函数（或代价函数）的值。梯度（Δ）是函数f(θ)对参数θ的偏导数，表示函数在当前点变化最快的方向。公式表达为Δ = df(θ) / dθ。在梯度下降算法中，参数的更新规则是θ = θ0 - η * Δf(θ0)，其中η（学习率）控制每次迭代的步长，较小的学习率可以保证收敛但速度较慢，较大的学习率可能导致发散。 **求解二元一次线性回归的梯度下降法** 具体到二元一次线性回归（y = θ1 * x1 + θ2 * x2 + θ0），作者使用了Python的pandas和numpy库。首先，数据被导入并分为特征（x_data）和目标变量（y_data）。接下来，定义了初始参数（θ0, θ1, θ2），学习率（lr）、最大迭代次数（epochs）以及一个计算损失函数的函数（compute_error），它计算每个样本点的误差平方和平均值，作为模型性能的度量。在`gradient_descent_runner`函数中，通过for循环迭代执行梯度下降算法，每次迭代更新θ0、θ1和θ2的值，直到达到预设的迭代次数或满足某个停止条件。这个过程会反复调整参数，直到找到使损失函数最小化的最优解，即线性回归方程的参数估计。 **牛顿法与梯度下降法的比较** 牛顿法是一种更为精确但计算成本较高的优化方法，它使用的是函数的二阶导数（Hessian矩阵），能更快速地接近局部最小值。相比之下，梯度下降仅依赖于一阶导数，对于大型数据集可能不够高效，但在小规模数据和高维空间中表现良好。总结起来，本文通过Python代码展示了如何运用梯度下降法求解二元一次线性回归问题，并简要提到了牛顿法作为优化手段的另一种选择。实际应用中，选择哪种方法取决于数据规模、计算资源和对精度的要求。

通过通过python程序，采用牛顿法和梯度下降法求解多元一次函数程序，采用牛顿法和梯度下降法求解多元一次函数

的线性回归方程的线性回归方程

通过通过python程序，采用牛顿法和梯度下降法求解多元一次函数的线性回归方程程序，采用牛顿法和梯度下降法求解多元一次函数的线性回归方程

梯度下降法原理梯度下降法原理

梯度就是表示某一函数在该点处的方向导数沿着该方向取得较大值，即函数在当前位置的导数

Δ=df(Ɵ)÷d(Ɵ)

上式中，Ɵ是自变量，f(Ɵ)是关于Ɵ的函数，Ɵ表示梯度简单来说Δ就是函数相对于自变量Ɵ的求导

梯度下降算法公式： Ɵ=Ɵ0-Ƞ*Δf(Ɵ0）

其中Ƞ是学习因子，由我们自己定义，Ɵ即为数据更新后下一个Ɵ0

f(Ɵ)=f(Ɵ0)+(Ɵ-Ɵ0)*Δf(Ɵ0）

通过该公示不断地进行数据迭代，就可以得到最终的数据

梯度下降法求解二元一次线性回归方程梯度下降法求解二元一次线性回归方程

import pandas as pd

import numpy as np

from matplotlib import pyplot as plt

from mpl_toolkits.mplot3d import Axes3D

data=np.genfromtxt('C:\Users\ll\Desktop\作业六2题.csv',delimiter=',') #导入数据

x_data=data[:,:-1] y_data=data[:,2] #定义学习率、斜率、截据a

#设方程为y=theta1x1+theta2x2+theta0

lr=0.00001

theta0=0

theta1=0

theta2=0

#定义最大迭代次数，因为梯度下降法是在不断迭代更新k与b

epochs=10000

#定义最小二乘法函数-损失函数（代价函数）

def compute_error(theta0,theta1,theta2,x_data,y_data):

totalerror=0

for i in range(0,len(x_data)):#定义一共有多少样本点

totalerror=totalerror+(y_data[i]-(theta1*x_data[i,0]+theta2*x_data[i,1]+theta0))**2

return totalerror/float(len(x_data))/2

#梯度下降算法求解参数

def gradient_descent_runner(x_data,y_data,theta0,theta1,theta2,lr,epochs):

m=len(x_data)

for i in range(epochs):

theta0_grad=0

theta1_grad=0

theta2_grad=0

for j in range(0,m):

theta0_grad-=(1/m)*(-(theta1*x_data[j,0]+theta2*x_data[j,1]+theta2)+y_data[j])

theta1_grad-=(1/m)*x_data[j,0]*(-(theta1*x_data[j,0]+theta2*x_data[j,1]+theta0)+y_data[j])

theta2_grad-=(1/m)*x_data[j,1]*(-(theta1*x_data[j,0]+theta2*x_data[j,1]+theta0)+y_data[j])

theta0=theta0-lr*theta0_grad

theta1=theta1-lr*theta1_grad

theta2=theta2-lr*theta2_grad

return theta0,theta1,theta2

#进行迭代求解

theta0,theta1,theta2=gradient_descent_runner(x_data,y_data,theta0,theta1,theta2,lr,epochs)

print('结果：')

print('迭代次数：{0} 学习率：{1} a0={2},a1={3},a2={4},代价函数为

{5}'.format(epochs,lr,theta0,theta1,theta2,compute_error(theta0,theta1,theta2,x_data,y_data)))

print("多元线性回归方程为:y=",theta1,"X1",theta2,"X2+",theta0)

#画图

ax=plt.figure().add_subplot(111,projection='3d')

ax.scatter(x_data[:,0],x_data[:,1],y_data,c='r',marker='o')

x0=x_data[:,0] x1=x_data[:,1] #生成网格矩阵

x0,x1=np.meshgrid(x0,x1)

z=theta0+theta1*x0+theta2*x1

#画3d图

ax.plot_surface(x0,x1,z)

ax.set_xlabel('area')

ax.set_ylabel('distance')

ax.set_zlabel("monney")

plt.show()

结果：

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38725902

粉丝: 4
资源: 929

Python实现牛顿法与梯度下降法：多元线性回归求解

使用Python实现牛顿法求极值

牛顿法和拟牛顿法（python源代码）

牛顿法、梯度下降法原理及Python编程应用

Python实现多元线性回归方程梯度下降法与求函数极值

python实现梯度法 python最速下降法

求解一个非线性方程的方法

python实现共轭梯度法

非线性方程组 非线性方程组 非线性方程组

Newton_Method_ROOT_Python实现割线法求非线性方程的根_

机器学习优化：梯度下降与牛顿法解析

最新资源

非线性方程组非线性方程组非线性方程组