pandas读取sanfrancisco_top200数据集,并对 IncidntNum、Category、Descript、DayOfWeek、Date、Time、PdDistrict Resolution、Address、X、Y、Location、PdId完成groupby操作
时间: 2023-07-03 15:16:56 浏览: 103
pandas数据集获取
好的,以下是代码示例:
```python
import pandas as pd
# 读取数据集
df = pd.read_csv('sanfrancisco_top200.csv')
# 按照多列进行分组,计算每组的count
grouped = df.groupby(['IncidntNum', 'Category', 'Descript', 'DayOfWeek', 'Date', 'Time', 'PdDistrict', 'Resolution', 'Address', 'X', 'Y', 'Location', 'PdId']).size()
# 输出结果
print(grouped)
```
注意,上述代码中的文件路径需要根据实际情况进行修改。另外,这里使用了数据集中的所有列作为分组依据,并计算了每个分组的数量。你也可以根据自己的需求修改分组依据和聚合方式。
阅读全文