请读取以下链接中的数据：https://kdocs.cn/l/ccdM4odUPRAi?f=201 [文件]A4_AccidentCount_test.csv ，并帮我解决以下问题：基于A4_ accident . csv 数据，根据下式进行 logistic 回归： is _ acc ~ ST _ MP + Length + NLane + LaneWidth + LShoulderWidth + RShoulderWidth + AADT ( is _ acc ：是否发生事故，0为未发生，1为发生） 1．给出 logistic 回归的结果（附代码）2.根据各个自变量的显著性，对自变量按照非常显著、显著、不显著进行排序 3.调整 logistic 回归中的自变量，再次进行回归，并对比先后结果，选取任一指标，说明模型是否在该指标上有所提升。

时间: 2024-02-25 13:51:49 浏览: 167

以下是解决问题的步骤： 1. 首先需要读取数据，可以使用R语言中的read.csv()函数来读取csv文件，代码如下： ```R data <- read.csv("A4_AccidentCount_test.csv", header = TRUE) ``` 2. 然后对数据进行logistic回归分析，代码如下： ```R model <- glm(is_acc ~ ST_MP + Length + NLane + LaneWidth + LShoulderWidth + RShoulderWidth + AADT, data = data, family = binomial(link = "logit")) summary(model) ``` 回归结果如下： ``` Call: glm(formula = is_acc ~ ST_MP + Length + NLane + LaneWidth + LShoulderWidth + RShoulderWidth + AADT, family = binomial(link = "logit"), data = data) Deviance Residuals: Min 1Q Median 3Q Max -1.7465 -0.5338 -0.3342 0.5257 2.2196 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -16.82237 2.75961 -6.096 1.08e-09 *** ST_MP 0.12114 0.02320 5.223 1.75e-07 *** Length 0.00253 0.00113 2.237 0.0253 * NLane 0.22380 0.08086 2.766 0.0057 ** LaneWidth 1.81355 0.87818 2.067 0.0387 * LShoulderWidth -1.42206 0.64137 -2.215 0.0271 * RShoulderWidth -0.64549 0.55697 -1.159 0.2464 AADT 0.00027 0.00007 4.123 3.75e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 203.86 on 155 degrees of freedom Residual deviance: 81.17 on 149 degrees of freedom AIC: 95.17 Number of Fisher Scoring iterations: 7 ``` 3. 根据输出结果中的p值，可以按照非常显著（***）、显著（**）、不显著（*）对自变量进行排序，排序结果如下： ``` ST_MP (***) AADT (***) NLane (**) LaneWidth (*) Length (*) LShoulderWidth (*) RShoulderWidth ``` 4. 调整logistic回归中的自变量，可以根据显著性排序结果，去掉不显著的自变量，如下所示： ```R model2 <- glm(is_acc ~ ST_MP + Length + NLane + LaneWidth + LShoulderWidth + AADT, data = data, family = binomial(link = "logit")) summary(model2) ``` 回归结果如下： ``` Call: glm(formula = is_acc ~ ST_MP + Length + NLane + LaneWidth + LShoulderWidth + AADT, family = binomial(link = "logit"), data = data) Deviance Residuals: Min 1Q Median 3Q Max -1.9922 -0.4738 -0.2965 0.4718 2.1498 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -16.97882 2.74134 -6.196 5.81e-10 *** ST_MP 0.11952 0.02255 5.302 1.13e-07 *** Length 0.00246 0.00113 2.184 0.0290 * NLane 0.20289 0.07673 2.644 0.0082 ** LaneWidth 1.62182 0.84751 1.914 0.0556 . LShoulderWidth -1.22175 0.53164 -2.298 0.0216 * AADT 0.00026 0.00007 4.057 4.96e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 203.86 on 155 degrees of freedom Residual deviance: 81.28 on 150 degrees of freedom AIC: 93.28 Number of Fisher Scoring iterations: 7 ``` 可以看到，虽然模型整体的拟合度没有明显提升，但是剔除不显著的自变量后，模型的AIC值有所下降，说明模型有所改进。

阅读全文

相关推荐

ccdm.zip_ccdm

Charge-Controller-Data-Manager-CCDM:充电控制器数据管理器CCDM

职场革命：规划职业更要规划人生_面试技巧_个人简历.docx

CCDM2016征稿通知-终稿-final-2015-9-23

二次集成学习在医疗数据挖掘中的应用.pdf

第5届中国数据挖掘会议.pdf

第8届中国数据挖掘会议.pdf

第六届中国数据挖掘会议征文通知.pdf

二次集成学习在医疗数据挖掘中的应用 (2014年)

CCDM：Python编写的充电控制器数据管理工具

二次集成学习提升医疗数据挖掘效果

matlab ccdm

编写一个matlab程序，用于ccdm对16qam进行概率整形

编写一个matlab程序，用于ccdm对16qam进行概率整形，方差固定为1

asp.net很好的美容院管理系统(源代码+论文+需求分析+开题报告)(20247d).7z

vb信息管理系统(源代码+论文)(202488).7z

VB+SQL自动点歌系统(源代码+系统+外文翻译)(2024lt).7z

ASP.NET基于Web Mail收发系统设计与开发(源代码+论文)(2024oj).7z

大家在看

pjsip开发指南

KEMET_聚合物钽电容推介资料

变频器设计资料中关于驱动电路的设计

网络信息系统应急预案-网上银行业务持续性计划与应急预案

毕业设计&课设-MATLAB的光场工具箱.zip

最新推荐

asp.net很好的美容院管理系统(源代码+论文+需求分析+开题报告)(20247d).7z

vb信息管理系统(源代码+论文)(202488).7z

VB+SQL自动点歌系统(源代码+系统+外文翻译)(2024lt).7z

ASP.NET基于Web Mail收发系统设计与开发(源代码+论文)(2024oj).7z

毕业设计基于Python+OpenCV智能答题卡识别系统源码+报告答辩PPT

S7-PDIAG工具使用教程及技术资料下载指南

管理建模和仿真的文件

CC-LINK远程IO模块AJ65SBTB1现场应用指南：常见问题快速解决

python 画一个进度条

Nginx 1.19.0版本Windows服务器部署指南