1.将数据集drink.csv中的数据读入一个名为drinks的DataFrame对象中。 2.哪个地方(continent)平均消耗的啤酒(beer_servings)更多? 3.输出每个地方(co
时间: 2024-12-19 10:23:44 浏览: 42
首先,我们可以使用pandas库来读取CSV文件并创建DataFrame。假设`drink.csv`文件已存储在本地,并且第一行包含列名:
```python
import pandas as pd
# 1. 将数据集读入DataFrame
drinks_df = pd.read_csv('drink.csv')
```
接下来,为了找出平均啤酒消费量最高的地方,我们先计算每个地方的总啤酒消费(beer_servings),然后除以人口(population)得到每人的啤酒消费,最后找出这个比率最高的是哪里:
```python
# 2. 计算每个continent的啤酒消耗平均值
average_beer_per_person = drinks_df.groupby('continent')['beer_servings'].mean() / drinks_df.groupby('continent')['population'].mean()
# 找出平均啤酒消耗最多的地方
max_beer_continent = average_beer_per_person.idxmax()
```
最后,如果我们想要输出每个地方的详细信息(包括名称、啤酒消费和服务的人口),可以这样做:
```python
# 3. 输出每个continent及其相关信息
output = drinks_df[drinks_df['continent'] == max_beer_continent].sort_values(by='country')
print(output[['country', 'beer_servings', 'population']])
```
阅读全文