如何在pandas中对csv文件内容进行分类统计
时间: 2024-03-01 20:55:44 浏览: 17
我们可以使用 Pandas 中的 `read_csv()` 函数读取 csv 文件,并使用 `groupby()` 方法对指定列进行分组,然后使用统计函数(如 `count()`、`sum()`、`mean()` 等)对分组后的数据进行统计。具体的步骤如下:
1. 使用 `read_csv()` 函数读取 csv 文件,例如:
```python
import pandas as pd
df = pd.read_csv('data.csv')
```
2. 使用 `groupby()` 方法对指定列进行分组,例如:
```python
group = df.groupby('category')
```
其中,`category` 是需要进行分类统计的列名。
3. 对分组后的数据应用统计函数进行统计,例如:
```python
count = group['product'].count()
```
其中,`product` 是需要统计的列名,`count()` 是统计函数。
完整的代码示例如下:
```python
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('data.csv')
# 对 category 列进行分组
group = df.groupby('category')
# 统计每个品种的数量
count = group['product'].count()
print(count)
```
其中,`data.csv` 是需要进行分类统计的 csv 文件,`category` 列存储了分类信息,`product` 列存储了需要统计的数据,`count()` 是统计函数。