数据集ObesityDataSet_raw_and_data_sinthetic.csv怎么利用age和NObeyesdad来做假设检验
时间: 2023-11-12 13:08:28 浏览: 83
利用age和NObeyesdad来做假设检验可以探索不同年龄段和肥胖程度的人群中肥胖情况的差异性,以下是一个基于Python的代码示例:
```python
import pandas as pd
import scipy.stats as stats
# 读取数据集
data = pd.read_csv('ObesityDataSet_raw_and_data_sinthetic.csv')
# 提取年龄和肥胖程度两个变量
age_obesity = data[['Age', 'NObeyesdad']]
# 按年龄和肥胖程度分组计算人数
age_obesity_count = age_obesity.groupby(['Age', 'NObeyesdad']).size().reset_index(name='count')
# 构造列联表
ct = pd.crosstab(age_obesity_count.Age, age_obesity_count.NObeyesdad)
# 进行卡方检验
chi2, p, dof, expected = stats.chi2_contingency(ct)
# 输出结果
print('卡方值为:', chi2)
print('p值为:', p)
```
结果是卡方值和p值,可以通过p值来判断不同年龄段和肥胖程度的人群中肥胖情况是否存在显著性差异。若p值小于0.05,则拒绝原假设,认为不同年龄段和肥胖程度的人群中肥胖情况存在显著性差异;若p值大于等于0.05,则接受原假设,认为不同年龄段和肥胖程度的人群中肥胖情况不存在显著性差异。
相关推荐
![txt](https://img-home.csdnimg.cn/images/20210720083642.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)