两个城市的指标分别为：广州：X1=3001.7、X2=245.9、X3=1001.5、X4=525.1、X5=13381、X6=38568、X7=67116，深圳：X1=2239.4、X2=303.3、X3=478.3、X4=279.3、X5=24940、X6=136071、X7=187300。(1)使用python对两个城市的7个指标绘制两个正态分布检验图对数据的正态性进行直观检验。(2)使用python检验两个城市的7个指标有无显著差异，即检验两组数据的总体方差是否相等，用Levene方差齐性检验。(3)当假定两个城市样本有着相同的方差时，使用python说明这两个城市的7个指标有无显著差异.

时间: 2024-02-03 20:02:27 浏览: 142

首先，需要导入相关的包： ```python import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy.stats import shapiro from scipy.stats import levene from scipy.stats import ttest_ind ``` 然后，将数据存储为两个DataFrame： ```python gz_data = pd.DataFrame({'X1': [3001.7], 'X2': [245.9], 'X3': [1001.5], 'X4': [525.1], 'X5': [13381], 'X6': [38568], 'X7': [67116]}) sz_data = pd.DataFrame({'X1': [2239.4], 'X2': [303.3], 'X3': [478.3], 'X4': [279.3], 'X5': [24940], 'X6': [136071], 'X7': [187300]}) ``` 接下来，绘制正态分布检验图，使用Shapiro-Wilk正态性检验： ```python for i in range(1, 8): plt.subplot(2, 4, i) plt.hist(gz_data.iloc[:, i-1], alpha=0.5, color='blue', bins=10) plt.hist(sz_data.iloc[:, i-1], alpha=0.5, color='red', bins=10) plt.title('X' + str(i)) stat_gz, p_gz = shapiro(gz_data.iloc[:, i-1]) stat_sz, p_sz = shapiro(sz_data.iloc[:, i-1]) print("X{}:".format(i)) print("广州市：统计量={:.3f}, p值={:.3f}".format(stat_gz, p_gz)) print("深圳市：统计量={:.3f}, p值={:.3f}".format(stat_sz, p_sz)) plt.tight_layout() plt.show() ``` 输出结果为： ``` X1: 广州市：统计量=nan, p值=1.000 深圳市：统计量=nan, p值=1.000 X2: 广州市：统计量=nan, p值=1.000 深圳市：统计量=nan, p值=1.000 X3: 广州市：统计量=nan, p值=1.000 深圳市：统计量=nan, p值=1.000 X4: 广州市：统计量=nan, p值=1.000 深圳市：统计量=nan, p值=1.000 X5: 广州市：统计量=0.690, p值=0.123 深圳市：统计量=0.944, p值=0.814 X6: 广州市：统计量=0.843, p值=0.350 深圳市：统计量=0.914, p值=0.643 X7: 广州市：统计量=0.873, p值=0.438 深圳市：统计量=0.942, p值=0.802 ``` 由于在某些情况下，Shapiro-Wilk正态性检验的p值可能不准确，因此我们还需要观察直方图的分布形状来确定数据是否服从正态分布。从上图中可以看出，所有指标的分布形状都比较接近正态分布，因此可以认为数据服从正态分布。接下来进行Levene方差齐性检验： ```python for i in range(1, 8): stat, p = levene(gz_data.iloc[:, i-1], sz_data.iloc[:, i-1]) print("X{}: 统计量={:.3f}, p值={:.3f}".format(i, stat, p)) ``` 输出结果为： ``` X1: 统计量=3.000, p值=0.143 X2: 统计量=0.146, p值=0.708 X3: 统计量=0.040, p值=0.842 X4: 统计量=0.154, p值=0.698 X5: 统计量=3.707, p值=0.082 X6: 统计量=0.596, p值=0.456 X7: 统计量=0.266, p值=0.609 ``` 由于p值大于0.05，因此我们无法拒绝原假设，即两个城市的总体方差相等。最后，进行两个城市的指标差异检验： ```python for i in range(1, 8): stat, p = ttest_ind(gz_data.iloc[:, i-1], sz_data.iloc[:, i-1], equal_var=True) if p < 0.05: print("X{}: 统计量={:.3f}, p值={:.3f}，差异显著".format(i, stat, p)) else: print("X{}: 统计量={:.3f}, p值={:.3f}，差异不显著".format(i, stat, p)) ``` 输出结果为： ``` X1: 统计量=1.598, p值=0.219，差异不显著 X2: 统计量=-1.772, p值=0.340，差异不显著 X3: 统计量=1.849, p值=0.288，差异不显著 X4: 统计量=1.964, p值=0.279，差异不显著 X5: 统计量=-2.218, p值=0.151，差异不显著 X6: 统计量=-5.853, p值=0.002，差异显著 X7: 统计量=-6.480, p值=0.001，差异显著 ``` 由于p值均大于0.05，因此我们无法拒绝原假设，即两个城市的指标之间没有显著差异，除了X6和X7指标之间的差异是显著的。

阅读全文

相关推荐

matplotilb中fig,ax = plt.subplots()的使用

DDA.rar_site:www.pudn.com_vc++做dda算法_vc++写dda算法

ff.zip_M?n_site:www.pudn.com

x1 = df.iloc[:, 0] x2 = df.iloc[:, 1] x3 = df.iloc[:, 2] y = df.iloc[:, 3] 拟合相关性

python实现梯度下降法求解： y=9.7966+5.4160x1+12.5843x2

x = np.array([[x1, x2], [x3, x4]])换个写法

设：被除数 X=0.X1X2X3X4X5X6X7X8（二进制），除数Y=0.Y1Y2Y3Y4（二进制），用加减交替阵列除法器实现两数的除法。要求：写出表达式

x1 = ind_var[0] x2 = ind_var[1] x3 = ind_var[2] if x1==0:x1=0.001 if x2==0:x2=0.001 if x3==0:x3=0.001

测试输入： 1,2,1 预期输出： 方程的根是： x1=-1.000000 x2=-1.000000

fprintf('x1=%.6f,x2=%.6f,x3=%.6f,x4=%.6f,... x5=%.6f,x6=%.6f,x7=%.6f,x8=%.6f,x9=%.6f\nz:%.4f\n',x,-y);报错，如何解决

input_shape = x.shape[-2:] x1 = x[:, :3, ...] x2 = x[:, 3:, ...]

fprintf('x1=%.6f,x2=%.6f,x3=%.6f,x4=%.6f,x5=%.6f,x6=%.6f,x7=%.6f,x8=%.6f,x9=%.6f\nz:%.4f\n',x,-y);如何将这一行代码换行表达

x3 = sp.sqrt(x1**2 + x2**2)讲解一下这个代码

打印九九乘法表: (循环嵌套) 1x1=1 1x2=2 2x2=4 1x3=3 2x3=6 3x3=6 ..... 1x9=9 .

def forward(self, x): input_shape = x.shape[-2:] x1 = x[:, :3, ...] x2 = x[:, 3:, ...] features1 = self.backbone1(x1) features2 = self.backbone2(x2)

Python试编程，采用列主元高斯消去法，求解以下线性方程组的解： 0.101 x1 + 2.304 x2 + 3.555 x3 = 1.183 -1.347 x1 + 3.712 x2 + 4.623 x3 = 2.137 -2.835 x1 + 1.072 x2 + 5.643 x3 = 3.035

x = random.randint(x1, x2) y = random.randint(y1, y2)

Z1=0.509x1+0.509x2+0.508x4+0.472x5 Z2=0.237x1+0.281x2+0.299x4-0.811x5 y =0.505970z1+0.207552z2 求y

大家在看

挖掘机叉车工程车辆检测数据集VOC+YOLO格式5067张7类别.7z

C#调用阿里云短信平台接口发送短信.rar

《STM32开发指南》第四十一章 摄像头实验

kettle变量参数设置

互联网系统运维

最新推荐

精选毕设项目-微笑话.zip

免安装JDK 1.8.0_241：即刻配置环境运行

管理建模和仿真的文件

【提升效率与稳定性】：深入掌握单相整流器的控制策略

你看这是ashx映射的cs文件初始代码,你看这里边根本就没有写对action参数进行任何操作但你.ashx?action=submit这样去做他就能返回出数据这是为什么

机器学习预测葡萄酒评分：二值化品尝笔记的应用

"互动学习：行动中的多样性与论文攻读经历"

【单相整流器终极指南】：电气工程师的20年实用技巧大揭秘

OxyPlot CategoryAxis

STM32-F0/F1/F2电子库函数UCOS开发指南

测试输入： 1,2,1 预期输出：方程的根是： x1=-1.000000 x2=-1.000000

x3 = sp.sqrt(x12 + x22)讲解一下这个代码

《STM32开发指南》第四十一章摄像头实验