怎么画数据集ObesityDataSet_raw_and_data_sinthetic.csv年龄一列的直方图
时间: 2023-11-12 17:09:07 浏览: 42
你可以使用Python中的matplotlib库来画出数据集ObesityDataSet_raw_and_data_sinthetic.csv年龄一列的直方图。可以按照以下步骤进行操作:
1. 导入matplotlib库和pandas库
```python
import matplotlib.pyplot as plt
import pandas as pd
```
2. 读取数据集
```python
data = pd.read_csv('ObesityDataSet_raw_and_data_sinthetic.csv')
```
3. 获取年龄列数据
```python
age = data['Age']
```
4. 绘制直方图
```python
plt.hist(age, bins=20, color='green')
plt.title('Age Distribution')
plt.xlabel('Age')
plt.ylabel('Frequency')
plt.show()
```
这段代码会将年龄数据分成20个区间,并画出直方图,其中x轴表示年龄,y轴表示频数,通过观察直方图可以了解年龄数据的分布情况。
相关问题
怎么只保留数据集ObesityDataSet_raw_and_data_sinthetic.csv中Gender和NObeyesdad这两列
你可以使用Pandas库来读取数据集,并使用drop函数删除不需要的列,然后使用to_csv函数将修改后的数据集保存到一个新的CSV文件中。以下是一个示例代码:
```python
import pandas as pd
# 读取数据集
data = pd.read_csv('ObesityDataSet_raw_and_data_sinthetic.csv')
# 保留 Gender 和 NObeyesdad 两列
data = data[['Gender', 'NObeyesdad']]
# 将修改后的数据集保存到新的CSV文件中
data.to_csv('ObesityDataSet_Gender_NObeyesdad.csv', index=False)
```
运行以上代码后,将会在当前目录下生成一个名为 ObesityDataSet_Gender_NObeyesdad.csv 的文件,其中只包含 Gender 和 NObeyesdad 两列。
怎么将数据集ObesityDataSet_raw_and_data_sinthetic.csv中Gender为Female和Male的数据分别提取出来
提取数据集ObesityDataSet_raw_and_data_sinthetic.csv中Gender为Female和Male的数据,可以使用pandas库中的DataFrame提取方法,具体步骤如下:
1. 首先,导入pandas库并读取数据集ObesityDataSet_raw_and_data_sinthetic.csv。
```python
import pandas as pd
df = pd.read_csv('ObesityDataSet_raw_and_data_sinthetic.csv')
```
2. 然后,使用DataFrame的loc()方法提取Gender列为Female或Male的数据,并将结果保存到新的DataFrame中。
```python
female_df = df.loc[df['Gender'] == 'Female']
male_df = df.loc[df['Gender'] == 'Male']
```
这样就可以将Gender为Female和Male的数据分别提取出来并保存到新的DataFrame中。如果需要将这些数据保存到文件中,可以使用to_csv()方法,如下所示:
```python
female_df.to_csv('female.csv', index=False)
male_df.to_csv('male.csv', index=False)
```
完整的代码如下:
```python
import pandas as pd
df = pd.read_csv('ObesityDataSet_raw_and_data_sinthetic.csv')
female_df = df.loc[df['Gender'] == 'Female']
male_df = df.loc[df['Gender'] == 'Male']
female_df.to_csv('female.csv', index=False)
male_df.to_csv('male.csv', index=False)
```
希望能对你有所帮助!