Pandas数据分析实例
时间: 2023-08-08 10:07:17 浏览: 108
Pandas 数据处理示例
假设我们有一个包含学生信息的数据集,包括学生姓名、年龄、性别、所在班级、数学成绩、语文成绩和英语成绩。我们要对这个数据集进行分析,找出各个班级的平均成绩和总成绩。
首先,我们需要导入 Pandas 库并读取数据集:
```python
import pandas as pd
data = pd.read_csv('students.csv')
```
接下来,我们可以使用 Pandas 提供的 groupby() 函数按照班级分组,并计算每个班级的平均成绩和总成绩:
```python
grouped_data = data.groupby('班级').agg({
'数学成绩': ['mean', 'sum'],
'语文成绩': ['mean', 'sum'],
'英语成绩': ['mean', 'sum']
})
```
最后,我们可以将结果输出到一个新的 CSV 文件中:
```python
grouped_data.to_csv('class_scores.csv')
```
完整代码示例:
```python
import pandas as pd
# 读取数据集
data = pd.read_csv('students.csv')
# 按照班级分组,并计算每个班级的平均成绩和总成绩
grouped_data = data.groupby('班级').agg({
'数学成绩': ['mean', 'sum'],
'语文成绩': ['mean', 'sum'],
'英语成绩': ['mean', 'sum']
})
# 输出结果到CSV文件
grouped_data.to_csv('class_scores.csv')
```
这样,我们就成功地对学生信息数据集进行了分析,并得出了各个班级的平均成绩和总成绩。
阅读全文