python数据分组聚合
时间: 2023-09-21 19:11:08 浏览: 81
聚类python
在Python中,可以使用pandas库进行数据分组和聚合。以下是一个简单的例子:
假设我们有一个包含员工姓名、部门和薪资的数据集,我们想要按照部门对薪资进行平均值的聚合。可以使用以下代码:
```python
import pandas as pd
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie', 'Dave', 'Emily', 'Frank', 'Gina', 'Harry'],
'Department': ['Sales', 'Engineering', 'Engineering', 'Sales', 'Marketing', 'Marketing', 'Engineering', 'Sales'],
'Salary': [50000, 60000, 55000, 45000, 70000, 65000, 75000, 40000]})
grouped = df.groupby('Department')
average_salary_by_department = grouped['Salary'].mean()
print(average_salary_by_department)
```
输出结果如下:
```
Department
Engineering 63333.333333
Marketing 67500.000000
Sales 45000.000000
Name: Salary, dtype: float64
```
这个例子中,我们首先创建了一个包含员工信息的DataFrame。然后,通过调用`groupby`方法并指定要分组的列,我们将数据按部门进行了分组。最后,我们使用`mean`方法计算了每个部门的平均薪资。
阅读全文