SAS Logistic回归分析实战：异常值处理与模型优化

需积分: 50 159 浏览量更新于2024-08-30 1 收藏 325KB DOC 举报

"本实验是关于使用SAS软件进行Logistic回归分析的实践操作，旨在理解和掌握Logistic回归模型在二分类响应变量情况下的应用。实验数据集为lab06-1.txt，其中响应变量Y只有0和1两种状态，自变量包括X1、X2和X3，均为连续型变量。" 在SAS中，Logistic过程被用于构建基于连续自变量的二项逻辑回归模型。实验首先建立了包含X1、X2、X3的Logistic回归模型，得到的回归方程为logit(p) = 10.15 - 0.33*x1 - 0.18*x2 - 5.09*x3。通过似然比检验，模型的统计意义显著，因为似然比的卡方值85.68对应p值远小于0.05。然而，对每个自变量的显著性检验结果显示，X1、X2、X3的显著性并不明显。接着，实验计算了各自变量的OR（优势比）值及其95%置信区间，这对于理解自变量对响应变量的影响至关重要。此外，通过观察影响力的观察表，可以评估每个观测值对模型的影响。散点图中，皮尔逊残差（Pearson residuals）绝对值大于1的观测值被认为是具有较大影响力的，实验中发现第9和第52号观测值满足此条件。进一步，通过Cbar（置信区间位移）散点图，同样确定第9和第52号观测值的Cbar值大于1，表明这些观测值可能为异常值。根据这些结果，决定删除这两个异常值并重新进行回归分析。排除异常值后，新模型的预测正确率提高到98.4%，证明了异常值的影响。然后，采用自变量逐步筛选方法，仅让X1进入模型，得到的新模型预测正确率为95.3%。在第二个实例中，针对39例病人的治愈情况（Y=治愈，Y=未愈），考虑了病情严重程度X1、年龄X2以及治疗方案X3作为潜在影响因素。通过Logistic回归分析，可以探究这些因素如何影响治愈率。这个SAS Logistic回归分析实验涵盖了模型构建、参数显著性检验、异常值识别与处理、模型预测性能比较以及自变量筛选等多个重要环节，是理解和应用Logistic回归分析的全面实践。

《统计软件应用》实验

SAS Logistic回归分析

实验目的

1、使用SAS LOGISTIC 过程作响应变量为二分类变量的回归分析

实验准备

复习相关章节“SAS相关与回归分析（三）”。

实验内容

(一) 数据集lab06-1.txt，响应变量Y只取0、1两个值(0为基准值)，建立基于3个连续型自变

量X1、X2、X3的线性预测模型：

1. 使用proc logistic 建立包含X1-3的回归模型，写出回归方程，并对模型的统计意义、

及每个自变量对模型的统计意义的显著性进行检验；

回归方程：logit（p）=10.15-0.33*x1-0.18*x2-5.09*x3

似然比的卡方为85.68（p<0.0001<0.05），模型具有显著性意义。

x1、x2、x3显著性均不明显。

下载后可阅读完整内容，剩余4页未读，立即下载

黎岚冥

粉丝: 3
资源: 6

SAS Logistic回归分析实战：异常值处理与模型优化

医学研究中的logistic回归分析及SAS实现

logistic回归分析及SAS实现

回归分析实验课实验8.doc

在H3C交换机中配置聚合流量重定向功能有哪些关键步骤，以及如何通过SAS实现logistic回归分析？

如何在SAS中实现对医学研究数据的多元Logistic回归分析，并解释输出结果中的系数含义？

基于广义线性模型的本科毕业生去向的分析论文.doc

流行病SAS期末考试历年考题(含答案).doc

医用多元统计分析与计算机应用.doc

SAS-BASE.rar_SAS Ba_it_sas_sas base

朱世武sas习题训练

最新资源