数据集ObesityDataSet_raw_and_data_sinthetic.csv怎么利用年龄、体重、身高和NObeyesdad来做推断统计
时间: 2023-11-12 07:09:06 浏览: 172
利用年龄、体重、身高和NObeyesdad来做推断统计可以探索不同年龄、体重、身高和肥胖程度的人群中肥胖情况的分布情况和特征,以下是一个基于Python的代码示例:
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import statsmodels.api as sm
# 读取数据集
data = pd.read_csv('ObesityDataSet_raw_and_data_sinthetic.csv')
# 提取年龄、体重、身高和肥胖程度四个变量
age_weight_height_obesity = data[['Age', 'Weight', 'Height', 'NObeyesdad']]
# 绘制年龄、体重、身高和肥胖程度的分布情况
sns.pairplot(age_weight_height_obesity, hue='NObeyesdad')
# 进行多元逻辑回归
X = age_weight_height_obesity[['Age', 'Weight', 'Height']]
y = age_weight_height_obesity['NObeyesdad']
X = sm.add_constant(X)
model = sm.MNLogit(y, X)
result = model.fit()
print(result.summary())
```
结果包括多元逻辑回归的系数、标准误、z值和p值,可以用来分析年龄、体重、身高和肥胖程度对于肥胖情况的影响和相互关系。同时,通过绘制散点图矩阵,可以观察不同变量之间的相关性,以及不同肥胖程度的人群在年龄、体重、身高上的分布情况和特征。
阅读全文