给定一个csv文件,如何创建新的数据框,聚合想要的信息
时间: 2023-06-16 18:06:41 浏览: 90
使用Python(pandas库)处理csv数据
要创建一个新的数据框并聚合想要的信息,你可以使用Python的pandas库。具体步骤如下:
1. 使用pandas库中的read_csv方法读取csv文件并将其转换为数据框。
```python
import pandas as pd
df = pd.read_csv('file_name.csv')
```
2. 使用pandas库中的groupby方法根据想要聚合的列进行分组。
```python
grouped = df.groupby('column_name')
```
3. 使用聚合函数(如mean、sum、count等)计算想要的信息。
```python
agg_df = grouped.agg({'column_name_1': 'mean', 'column_name_2': 'sum', 'column_name_3': 'count'})
```
4. 将结果保存为新的csv文件。
```python
agg_df.to_csv('new_file_name.csv', index=False)
```
其中,'column_name'是你想要根据哪一列进行分组的列名,'column_name_1'、'column_name_2'、'column_name_3'是你想要聚合的列,可以根据你的需求进行修改。最后,记得将结果保存为新的csv文件,并将index设置为False,否则会将行索引也保存到csv文件中。
阅读全文