Logistic模型统计诊断研究：异常点检测与实例分析

需积分: 9 5 浏览量更新于2024-08-11 收藏 710KB PDF 举报

"这篇文章是关于Logistic模型的统计诊断，主要介绍了如何将线性模型的诊断方法应用到Logistic模型中，包括数据删除模型的一阶近似参数估计公式，以及如何利用Score统计量、广义Cook距离和似然距离等诊断统计量来识别和处理强影响点或异常点。作者通过实例分析验证了这些诊断方法的有效性。" Logistic模型是一种广泛应用的二元响应变量模型，常用于预测和解释一个二项分布结果的概率。在统计学中，对模型的诊断是确保模型正确性和可靠性的关键步骤。本文系统地探讨了Logistic模型的统计诊断方法，将线性模型中的诊断技术延伸到非线性的Logistic模型中。首先，文章推导了数据删除模型（CDM）的一阶近似参数估计公式。这种估计方法允许我们在处理缺失数据或考虑数据影响时，对模型参数进行近似计算。通过对数据进行局部删除，可以观察每个观测值对模型参数的影响程度，从而判断是否存在异常或强影响点。其次，文章提出了数据删除模型与均值漂移模型（MSOM）之间的等价性。这意味着，通过数据删除，我们可以理解和评估数据中的离群点如何改变模型的均值结构，从而对模型的稳健性进行评估。此外，文章还引入了几种诊断统计量，用于识别Logistic模型中的强影响点或异常点。Score统计量是基于模型的似然函数的梯度，可以用来检测观测值对参数估计的敏感性。广义Cook距离是线性模型中Cook距离的扩展，它可以量化单个观测值对模型整体的影响。而似然距离则通过比较有和无特定观测值时的模型似然函数差异，来评估该观测值的重要性。最后，作者通过实例分析证明了所提出的诊断方法的有效性。实例可能包括实际数据集的应用，展示如何应用上述诊断工具来识别潜在的问题，并展示在剔除异常点或处理影响点后，模型性能的改善情况。这篇文章提供了Logistic模型诊断的重要工具，对于理解和改进Logistic回归分析的稳健性具有重要意义。无论是对初学者还是经验丰富的研究人员，理解这些诊断方法都能提高他们在数据分析中的专业水平。

书书书

第

１１

卷第

１

期

２０１２

年

２

月

江南大学学报

（

自然科学版

）

ＪｏｕｒｎａｌｏｆＪｉａｎｇｎａｎＵｎｉｖｅｒｓｉｔｙ（ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）

Ｖｏｌ．１１　Ｎｏ．１

Ｆｅｂ．　２０１２

收稿日期

：２０１１－１０－２０；　

修订日期

：２０１１－１１－１８。

作者简介

：

 

（１９８０—），



，



，



。



。Ｅｍａｉｌ：ＧＬ００８＠ｓｉｎａ．ｃｏｍ

Ｌｏｇｉｓｔｉｃ

模型的统计诊断

光琳

１

，　

宗序平

２

（１．

江苏联合职业技术学院连云港财经分院

，

江苏连云港

２２２００３；２．

扬州大学数学科学学院

，

江苏扬州

２２５００２）

摘要

：

系统地分析了

Ｌｏｇｉｓｔｉｃ

模型的统计诊断

，

将线性模型的诊断方法运用到

Ｌｏｇｉｓｔｉｃ

模型

。

推导

出数据删除模型一阶近似的参数估计公式

，

并给出数据删除模型与均值漂移模型的等价性

;

推导

了判别强影响点或异常点的诊断统计量如

Ｓｃｏｒｅ

统计量

、

广义

Ｃｏｏｋ

距离

、

似然距离等

。

通过实例分

析证实了该诊断方法的有效性

。

关键词

：Ｌｏｇｉｓｔｉｃ

模型

；

统计诊断

；

诊断统计量

中图分类号

：Ｏ２１２．１

文献标识码

：Ａ

文章编号

：１６７１－７１４７（２０１２）０１－０１１３－０５

ＳｔａｔｉｓｔｉｃａｌＤｉａｇｎｏｓｉｓｏｆＬｏｇｉｓｔｉｃＭｏｄｅｌ

ＧＵＡＮＧＬｉｎ

１

，　ＺＯＮＧＸｕｐｉｎｇ

２

（１ＬｉａｎｙｕｎｇａｎｇＢｒａｎｃｈｏｆＦｉｎａｎｃｅａｎｄＥｃｏｎｏｍｉｃｓ，ＪｉａｎｇｓｕＵｎｉｏｎＴｅｃｈｎｉｃａｌＩｎｓｔｉｔｕｔｅ，Ｌｉａｎｙｕｎｇａｎｇ２２２００３，Ｃｈｉｎａ；

２ＳｃｈｏｏｌｏｆＭａｔｈｅｍａｔｉｃａｌＳｃｉｅｎｃｅ，ＹａｎｇｚｈｏｕＵｎｉｖｅｒｓｉｔｙ，Ｙａｎｇｚｈｏｕ２２５００２，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：ＴｈｉｓｐａｐｅｒｓｙｓｔｅｍａｔｉｃａｌｌｙｄｉｓｃｕｓｓｅｓｔｈｅｓｔａｔｉｓｔｉｃａｌｄｉａｇｎｏｓｔｉｃｓｏｆＬｏｇｉｓｔｉｃｓｔａｔｉｓｔｉｃａｌｍｏｄｅｌ，ｗｈｉｃｈａｒｅ

ｅｘｔｅｎｄｅｄｆｒｏｍｔｈｅｄｉａｇｎｏｓｔｉｃｍｅｔｈｏｄｓｆｏｒｌｉｎｅａｒｍｏｄｅｌ．Ｔｈｅｆｉｒｓｔｏｒｄｅｒａｐｐｒｏｘｉｍａｔｅｆｏｒｍｕｌａｏｆｐａｒａｍｅｔｅｒｅｓｔｉｍａｔｅｏｆ

ＣＤＭａｒｅｄｅｒｉｖｅｄ，ａｎｄｔｈｅｅｑｕｉｖａｌｅｎｃｅｏｆＣＤＭａｎｄＭＳＯＭａｒｅｐｒｏｖｅｄ．Ａｔｔｈｅｓａｍｅｔｉｍｅ，ｗｅｄｅｒｉｖａｔｅｔｈｅｄｉａｇｎｏｓｔｉｃ

ｓｔａｔｉｓｔｉｃｓｔｏｄｉｓｔｉｎｇｕｉｓｈｓｔｒｏｎｇｉｎｆｌｕｅｎｃｅｐｏｉｎｔｓｏｒｔｈｅｄｉａｇｎｏｓｉｓｏｆｏｕｔｌｉｅｒｓ，ｓｕｃｈａｓＳｃｏｒｅｓｔａｔｉｓｔｉｃｓ，ＧｅｎｅｒａｌｉｚｅｄＣｏｏｋ

ｄｉｓｔａｎｃｅ，ａｎｄＬｉｋｅｌｉｈｏｏｄｄｉｓｔａｎｃｅ．Ｆｉｎａｌｌｙ，ａｃａｓｅｓｔｕｄｙｉｓｇｉｖｅｎｔｏｉｌｌｕｓｔｒａｔｅｏｕｒｒｅｓｕｌｔｓ．

Ｋｅｙｗｏｒｄｓ：Ｌｏｇｉｓｔｉｃｍｏｄｅｌ，ｓｔａｔｉｓｔｉｃａｌｄｉａｇｎｏｓｉｓ，ｄｉａｇｎｏｓｔｉｃｓｔａｔｉｓｔｉｃｓ

　　Ｌｏｇｉｓｔｉｃ





。



，Ｌｏｇｉｓｔｉｃ



，



［１］

ｌｏｇｉｔ（ｐ）＝ｌｏｇ

ｐ

１－

( )

ｐ

＝

０

＋

１

Ｘ

１

＋

２

Ｘ

２

＋…

ｐ－１

Ｘ

ｐ－１

（

）



、



、





，



。



，



Ｌｏｇｉｓｔｉｃ





、





［２５］

，





。

　　Ｌｏｇｉｓｔｉｃ



（ＧＬＭ），

  

ｙ

１

，ｙ

２

，…，ｙ

ｎ

     

，

 

ｙ

ｉ

～

Ｂ（ｐ

ｉ

），Ｅｙ

ｉ

＝ｐ

ｉ

＝Ｐ（ｙ

ｉ

＝１）。



，ｐ

ｉ



ｘ

ｉ



：

ｉ

＝ｌｏｇ（

ｐ

ｉ

１－ｐ

ｉ

）＝

０

＋

１

ｘ

ｉ１

＋… ＋

ｐ－１

ｘ

ｉ，ｐ－１

＝ｘ

Ｔ

ｉ

（１）



：

ｘ

ｉ

＝（１，ｘ

ｉ１

，…，ｘ

ｉ，ｐ－１

）

Ｔ

；

＝（

０

，

１

，…，

ｐ－１

）

Ｔ

。



、Ｓｃｏｒｅ





［１］



下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38665814

粉丝: 6
资源: 981

Logistic模型统计诊断研究：异常点检测与实例分析

人口指数Malthus增长模型和Logistic模型（附matlab代码）

人口增长模型 指数模型和logistic模型 五种求解方法数学建模

matlab解logistic模型

Logistic模型的局部影响分析 (2012年)

基于机器学习算法的脑出血相关肺炎预测模型研究.pdf

Logistic模型局部影响分析：曲率与扰动研究

对数在医学中的应用：药物剂量和疾病诊断，守护健康

YOLO训练Pascal VOC数据集：部署与应用，将模型落地实际场景

16-17 数据挖掘算法基础 - 分类与回归1(1).ipynb

精选微信小程序源码：停车场管理小程序（含源码+源码导入视频教程&文档教程，亲测可用）

最新资源

人口增长模型指数模型和logistic模型五种求解方法数学建模