利用pandas模块读取 penguins.csv 数据集,用head()查看数据集;筛选出体重大于等于6000g的条目,并计算他们的平均体重;统计所有企鹅的种类和数目,并绘制饼图
时间: 2024-10-06 22:06:04 浏览: 25
数据集不是完整的,目的是熟练使用Pandas - 两个数据集 >`calendar.csv` >`listings.csv`
在Python中,我们可以使用pandas库来处理和分析数据。首先,你需要导入`pandas`库并加载名为`penguins.csv`的数据集。以下是步骤:
```python
import pandas as pd
# 1. 读取数据集
df = pd.read_csv('penguins.csv')
# 2. 查看数据集前几行
print(df.head()) # 使用head()函数显示数据集的前五行
# 筛选出体重大于等于6000g的企鹅
filtered_df = df[df['body_mass_g'] >= 6000]
# 3. 计算这些企鹅的平均体重
average_weight = filtered_df['body_mass_g'].mean()
print(f"大于等于6000g的企鹅平均体重:{average_weight} g")
# 4. 统计所有企鹅的种类及其数目
species_counts = df['species'].value_counts()
print("各物种数量:", species_counts)
# 5. 绘制饼图
species_counts.plot(kind='pie', autopct='%1.1f%%') # autopct参数用于显示百分比
plt.title('企鹅种类分布')
plt.ylabel('')
plt.show() # 显示饼图
```
阅读全文