乌鲁木齐空气质量(AQI)与PM2.5等因子的线性回归分析

需积分: 0 0 下载量 98 浏览量 更新于2024-08-04 收藏 766KB DOCX 举报
"乌鲁木齐1" 本资源探讨了乌鲁木齐地区的空气质量指数(AQI)与多种空气污染物之间的关系,采用线性回归分析方法进行了深入研究。线性回归是一种统计学方法,用于探究一个因变量(此处为AQI)与多个自变量(PM2.5、PM10、SO2、CO、NO2、O3_8h)之间的定量关系。 在描述性分析阶段,首先对各项空气污染物及AQI进行了统计概括,发现部分数据存在异常值,如AQI、PM2.5等最小值为0,这在实际环境中是不可能的,因此使用openrefine工具进行了数据清理。清理后的数据再次进行描述性分析,结果显示大部分污染物的日间变化差异较大,而CO和SO2的波动相对较小。此外,所有变量均呈现左偏分布,即大部分数值集中在较低的一侧,同时,峰度数据显示AQI、PM2.5、SO2、PM10呈现出高峰态,意味着数据分布较尖锐;而CO、NO2、O3_8h则呈现低峰态,表示数据分布较为平坦。 接下来,进行了线性回归分析。将AQI作为响应变量,其他六种污染物作为预测变量构建了线性模型。通过调整后的R方(1.285)大于0.6,说明模型对数据的拟合程度良好。方差分析的显著性值远小于0.01,证明了该模型具有极显著的统计学意义,即各自变量与因变量之间存在显著的线性关系。具体到每个自变量,PM2.5、PM10、O3_8h的显著性水平小于0.01,表明这些因素与AQI呈正相关,并且关联性强。 模型的标准化系数揭示了自变量对因变量的影响程度,其中B、C、E、F分别代表PM2.5、PM10、O3_8h、NO2,它们的系数为正,显示了这些污染物浓度的增加会提升AQI的值。然而,标准化残差的直方图和P-P图显示,虽然数据分布并非理想,但仍然适合进行回归分析。 进一步的模型残差独立性检验通过了Durbin-Watson统计量(DW=1.285),这意味着模型残差独立,没有明显的自相关性,支持了回归分析的可靠性。 最后,进行了相关性分析,以双变量方式分别考察了AQI与其他污染物的相关性。结果显示,AQI与PM2.5、PM10、SO2、CO、NO2、O3_8h均显示出显著相关性。特别是当变量值处于一定范围内时,如PM2.5、PM10、SO2在100或200以内,相关性更为明显。 总结来说,这项研究通过线性回归分析揭示了乌鲁木齐地区空气质量指数与主要空气污染物之间的关联,为理解和预测空气质量提供了科学依据。