## 1.对课上的不良贷款例子进行模型诊断(主要针对回归假设) ## 导入相关包 library(xlsx) library(car) ## 数据导入 loan = read.xlsx(file="C:/Users/wang/Desktop/第9次/loan.xlsx", sheetIndex=1, rowIndex = 2:27, colIndex = 2:6, header = TRUE, encoding='UTF-8') ## 建立多元回归模型 loan.model = lm(不良贷款~各项贷款余额+ 本年累计应收贷+ 贷款项目个数+ 本年固定资产投资额, data = loan) ## 多元回归模型的各项指标 loan.model.summary = summary(loan.model) loan.model.summary ## 异常点 outlierTest(loan.model) qqPlot(loan.model) ## 高杠杆值 hatvalues(loan.model) > 2*mean(hatvalues(loan.model)) ## 有影响点 cooks.distance(loan.model) > 4/nrow(loan)

时间: 2023-11-26 16:04:06 浏览: 34
首先,我们看一下多元回归模型的各项指标。从结果可以看出,模型的R-squared值为0.9674,说明模型能够解释目标变量的96.74%的方差。同时,模型的F-statistic值为75.03,p值小于0.05,说明整个模型具有统计显著性。然而,我们需要进一步检验模型中是否存在回归假设的违反。 接下来我们看一下异常点。使用outlierTest函数和qqPlot函数进行诊断。outlierTest函数用于检测模型中是否存在离群值,而qqPlot函数用于检测模型中是否存在数据正态性的问题。从结果可以看出,没有离群值,并且数据的正态性也比较好。 然后,我们来看一下高杠杆值。使用hatvalues函数获取高杠杆值,如果某个观测点的高杠杆值大于2倍平均高杠杆值,则表示该观测点具有较大的影响力。从结果可以看出,没有观测点的高杠杆值大于2倍平均高杠杆值。 最后,我们来看一下有影响点。使用cooks.distance函数获取有影响点,如果某个观测点的Cook's距离大于4/n,则表示该观测点具有较大的影响力。从结果可以看出,没有观测点的Cook's距离大于4/n。 综上所述,根据模型诊断的结果,我们可以认为该多元回归模型较好地符合回归假设。
相关问题

install.packages('xlsx') #运行xlsx library(xlsx) write.xlsx("E:asm_1 .xls")

此代码的作用是安装并加载 `xlsx` 包,然后将数据写入到名为 `asm_1.xls` 的 Excel 文件中。不过需要注意的是,需要指定数据写入到文件中的位置,而你的代码中没有指定具体的数据。 下面是修正后的代码,其中 `data` 是需要写入到 Excel 文件中的数据: ```R # 安装并加载xlsx包 install.packages('xlsx') library(xlsx) # 创建一个数据框 data <- data.frame( name = c("Alice", "Bob", "Charlie"), age = c(23, 34, 28), gender = c("female", "male", "male") ) # 将数据写入Excel文件 write.xlsx(data, file = "E:/asm_1.xls", sheetName = "Sheet1") ``` 这个代码将会将数据写入到 `E:/asm_1.xls` 中,并且在 Excel 文件中创建一个名为 `Sheet1` 的工作表。

(1)读取代码所在文件夹中的“广告收益数据.xlsx”,然后建立多元线性回归模型 (2)对上面搭建的模型通过Python代码进行模型评估

以下是实现上述功能的Python代码: ```python import pandas as pd import numpy as np from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score, mean_squared_error # 读取数据 data = pd.read_excel('广告收益数据.xlsx') # 构建特征和标签 X = data.iloc[:, :-1] y = data.iloc[:, -1] # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 建立多元线性回归模型 model = LinearRegression() model.fit(X_train, y_train) # 模型评估 y_pred = model.predict(X_test) print('R2 score:', r2_score(y_test, y_pred)) print('MSE:', mean_squared_error(y_test, y_pred)) ``` 代码中使用了Pandas库读取Excel表格数据,并使用Scikit-learn库中的LinearRegression模型建立多元线性回归模型。为了对模型进行评估,使用train_test_split函数将数据集划分为训练集和测试集,并使用r2_score和mean_squared_error两个指标评估模型的拟合效果。

相关推荐

最新推荐

recommend-type

POI通用导出Excel(.xls,.xlsx)的方法

主要介绍了POI通用导出Excel(.xls,.xlsx)的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
recommend-type

Linux下xlsx文件转txt文件.docx

Linux命令行实现在线预览PPT,PPTX,DOC,DOCX,XLS,XLSX文件,可以实现xlsx文件转txt文件,文档内是安装插件详细步骤
recommend-type

C# EXCEL(.xls和.xlsx)导入到数据库

C# EXCEL(.xls和.xlsx)导入到数据库,个人收集资料,没有必要下载
recommend-type

navicat下载、安装、配置连接与使用教程.pdf

Navicat是一款强大的数据库管理和开发工具,支持多种数据库系统,如MySQL、PostgreSQL、SQLite等。以下是Navicat的下载、安装、配置连接与使用教程: 一、下载Navicat 1.访问Navicat官方网站:https://www.navicat.com.cn/download/navicat-premium。 2.在下载页面,选择适合你操作系统的版本进行下载。Navicat支持Windows、macOS和Linux等多种操作系统。 二、安装Navicat 1.双击下载好的Navicat安装包,根据安装向导的指示进行安装。 2.选择安装路径(建议不直接安装在C盘),点击“下一步”继续安装。 3.同意软件许可协议,点击“我同意”并选择“下一步”。 4.根据需要选择是否创建桌面图标,点击“下一步”继续。 5.点击“安装”开始安装过程,等待安装完成。 6.安装完成后,点击“完成”退出安装向导。 三、配置连接 1.打开Navicat软件,点击左上角的“连接”按钮或顶部菜单栏的“连接”选项。 2.在弹出的连接窗口中,选择你要连接的数据库类型(如MySQL、PostgreS
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

优化MATLAB分段函数绘制:提升效率,绘制更快速

![优化MATLAB分段函数绘制:提升效率,绘制更快速](https://ucc.alicdn.com/pic/developer-ecology/666d2a4198c6409c9694db36397539c1.png?x-oss-process=image/resize,s_500,m_lfit) # 1. MATLAB分段函数绘制概述** 分段函数绘制是一种常用的技术,用于可视化不同区间内具有不同数学表达式的函数。在MATLAB中,分段函数可以通过使用if-else语句或switch-case语句来实现。 **绘制过程** MATLAB分段函数绘制的过程通常包括以下步骤: 1.
recommend-type

SDN如何实现简易防火墙

SDN可以通过控制器来实现简易防火墙。具体步骤如下: 1. 定义防火墙规则:在控制器上定义防火墙规则,例如禁止某些IP地址或端口访问,或者只允许来自特定IP地址或端口的流量通过。 2. 获取流量信息:SDN交换机会将流量信息发送给控制器。控制器可以根据防火墙规则对流量进行过滤。 3. 过滤流量:控制器根据防火墙规则对流量进行过滤,满足规则的流量可以通过,不满足规则的流量则被阻止。 4. 配置交换机:控制器根据防火墙规则配置交换机,只允许通过满足规则的流量,不满足规则的流量则被阻止。 需要注意的是,这种简易防火墙并不能完全保护网络安全,只能起到一定的防护作用,对于更严格的安全要求,需要
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。
recommend-type

"互动学习:行动中的多样性与论文攻读经历"

多样性她- 事实上SCI NCES你的时间表ECOLEDO C Tora SC和NCESPOUR l’Ingén学习互动,互动学习以行动为中心的强化学习学会互动,互动学习,以行动为中心的强化学习计算机科学博士论文于2021年9月28日在Villeneuve d'Asq公开支持马修·瑟林评审团主席法布里斯·勒菲弗尔阿维尼翁大学教授论文指导奥利维尔·皮耶昆谷歌研究教授:智囊团论文联合主任菲利普·普雷教授,大学。里尔/CRISTAL/因里亚报告员奥利维耶·西格德索邦大学报告员卢多维奇·德诺耶教授,Facebook /索邦大学审查员越南圣迈IMT Atlantic高级讲师邀请弗洛里安·斯特鲁布博士,Deepmind对于那些及时看到自己错误的人...3谢谢你首先,我要感谢我的两位博士生导师Olivier和Philippe。奥利维尔,"站在巨人的肩膀上"这句话对你来说完全有意义了。从科学上讲,你知道在这篇论文的(许多)错误中,你是我可以依