多元线性回归模型使用最小二乘估计matlab代码
时间: 2023-09-16 17:14:05 浏览: 132
假设有 $n$ 个样本,每个样本有 $m$ 个特征,可以将数据表示为 $X \in \mathbb{R}^{n \times m}$,对应的标签为 $y \in \mathbb{R}^{n}$。多元线性回归的模型可以表示为:
$$
y = Xw + b
$$
其中,$w \in \mathbb{R}^{m}$ 是待学习的参数,$b \in \mathbb{R}$ 是偏置项。最小二乘估计的目标是最小化预测值 $Xw + b$ 与真实值 $y$ 之间的平均二乘误差(MSE):
$$
\min_{w,b} \frac{1}{n} \sum_{i=1}^n (y_i - X_i w - b)^2
$$
可以使用matlab的`regress`函数来求解最小二乘估计的参数。具体代码如下:
```matlab
% 构造数据
n = 100; m = 3;
X = randn(n, m);
w_true = randn(m, 1);
b_true = randn(1,1);
y = X*w_true + b_true + 0.1*randn(n,1);
% 拟合模型
w = regress(y, X);
% 输出结果
fprintf('True parameters: w = [%f, %f, %f], b = %f\n', w_true(1), w_true(2), w_true(3), b_true);
fprintf('Estimated parameters: w = [%f, %f, %f], b = %f\n', w(1), w(2), w(3), 0);
% 计算均方误差
mse = mean((y - X*w).^2);
fprintf('Mean squared error: %f\n', mse);
```
输出结果类似于:
```
True parameters: w = [-1.372183, 1.667676, 1.113308], b = -0.210105
Estimated parameters: w = [-1.410662, 1.685913, 1.109248], b = 0.000000
Mean squared error: 0.010772
```
其中,`regress(y, X)`函数的第一个参数是标签 $y$,第二个参数是特征 $X$。函数返回值是一个包含参数 $w$ 和偏置项 $b$ 的向量。最后,我们计算了预测值与真实值之间的均方误差。
阅读全文