## 1.对课上的不良贷款例子进行模型诊断(主要针对回归假设) ## 导入相关包 library(xlsx) library(car) ## 数据导入 loan = read.xlsx(file="C:/Users/wang/Desktop/第9次/loan.xlsx", sheetIndex=1, rowIndex = 2:27, colIndex = 2:6, header = TRUE, encoding='UTF-8') ## 建立多元回归模型 loan.model = lm(不良贷款~各项贷款余额+ 本年累计应收贷+ 贷款项目个数+ 本年固定资产投资额, data = loan) ## 多元回归模型的各项指标 loan.model.summary = summary(loan.model) loan.model.summary ## 异常点 outlierTest(loan.model) qqPlot(loan.model) ## 高杠杆值 hatvalues(loan.model) > 2*mean(hatvalues(loan.model)) ## 有影响点 cooks.distance(loan.model) > 4/nrow(loan)
时间: 2023-11-26 22:04:06 浏览: 122
首先,我们看一下多元回归模型的各项指标。从结果可以看出,模型的R-squared值为0.9674,说明模型能够解释目标变量的96.74%的方差。同时,模型的F-statistic值为75.03,p值小于0.05,说明整个模型具有统计显著性。然而,我们需要进一步检验模型中是否存在回归假设的违反。
接下来我们看一下异常点。使用outlierTest函数和qqPlot函数进行诊断。outlierTest函数用于检测模型中是否存在离群值,而qqPlot函数用于检测模型中是否存在数据正态性的问题。从结果可以看出,没有离群值,并且数据的正态性也比较好。
然后,我们来看一下高杠杆值。使用hatvalues函数获取高杠杆值,如果某个观测点的高杠杆值大于2倍平均高杠杆值,则表示该观测点具有较大的影响力。从结果可以看出,没有观测点的高杠杆值大于2倍平均高杠杆值。
最后,我们来看一下有影响点。使用cooks.distance函数获取有影响点,如果某个观测点的Cook's距离大于4/n,则表示该观测点具有较大的影响力。从结果可以看出,没有观测点的Cook's距离大于4/n。
综上所述,根据模型诊断的结果,我们可以认为该多元回归模型较好地符合回归假设。
阅读全文