(1)变量收集处理 附录 南沙区Lasso回归原始数据 (2)建立Lasso回归目标函数。 (3)数据标准化后,使用Matlab的Lasso函数,对多个影响因素进行变量筛选,计算各影响因素回归系数,结果见表 。 表 筛选处理后的各影响因素回归系数 从17个变量中筛选得到8个符合要求的自变量,分别是:卫生人员数、普通中学在校生数、普通小学在校生数、幼儿园在校生数、固定资产投资(不含农户)_教育、固定资产投资(不含农户)_科学研究和技术服务业、房地产开发企业房屋施工面积、城市化率,对应的回归系数见表 。另外9个变量为:医疗卫生机构数、医疗卫生机构床位数、规模以上工业企业高新技术产品数、工业总产值_高新技术产品、一般公共预算支出、金融类企业、本外币存款余额、南沙港货物吞吐量、法人单位数,它们对应的系数值为0,说明这5个变量对南沙区GDP指数没有显著意义。故可以将Lasso回归模型表达为: 其中ε为截距。 (4)构建断点回归模型。 (5)计算断点回归系数b=0.198472 请进行稳健型检验
时间: 2023-12-06 10:42:29 浏览: 89
稳健型检验可以使用Matlab中的robustfit函数进行实现。以下是具体的步骤:
1. 导入数据并提取自变量和因变量
假设导入的数据存储在名为data的矩阵中,其中第一列为因变量(GDP指数),后面的8列为自变量(卫生人员数、普通中学在校生数、普通小学在校生数、幼儿园在校生数、固定资产投资(不含农户)_教育、固定资产投资(不含农户)_科学研究和技术服务业、房地产开发企业房屋施工面积、城市化率):
```
y = data(:, 1);
X = data(:, 2:end);
```
2. 进行稳健型回归
使用robustfit函数进行稳健型回归,代码如下:
```
[b, stats] = robustfit(X, y);
```
其中b为回归系数向量,stats为回归统计信息结构体,包含了各种统计指标如t值、p值等。可以使用stats.t和stats.p来获取各自变量的t值和p值。
3. 输出结果
输出回归系数和统计指标:
```
disp('稳健型回归结果:');
disp(['回归系数:', num2str(b')]);
disp(['t值:', num2str(stats.t')]);
disp(['p值:', num2str(stats.p')]);
```
4. 进行显著性检验
对每个自变量进行显著性检验,使用stats.p来判断p值是否小于0.05,如果小于0.05则认为该变量在95%的置信水平下显著。代码如下:
```
sig_vars = find(stats.p < 0.05);
disp('显著的自变量:');
disp(sig_vars);
```
输出结果为显著的自变量的列号,例如[1 3 5]表示第1、3、5个自变量在95%的置信水平下显著。
参考文献:Matlab官方文档
阅读全文