回归分析中如何判断是否需要删除influential point
时间: 2023-06-18 21:03:50 浏览: 173
Identitying influential spreaders in complex networks的分析 K壳
在回归分析中,可以通过以下几种方式来判断是否需要删除异常点:
1. 条件数(Condition Number):当模型中存在高度相关的自变量时,条件数会变得很大,这会导致回归系数的标准误差变得很大,使得回归系数的显著性受到影响。如果条件数大于30,就需要考虑删除一些自变量。
2. Cook's距离(Cook's Distance):Cook's距离是一种用于检测回归模型中杠杆点和影响点的统计量。如果某个数据点的Cook's距离大于1,则可以将其视为影响点。
3. DFFITS值:DFFITS值是一种用于检测影响点的统计量。如果某个数据点的DFFITS值大于2(或小于-2),则可以将其视为影响点。
4. 删除离群值后,重新计算回归模型的R方值和残差图。如果删除离群值后,R方值和残差图的表现有明显的改善,则可以考虑删除这些数据点。
需要注意的是,删除数据点可能会导致模型的偏差或不准确性,因此需要谨慎考虑。
阅读全文