python统计某一列各个种类占该列所有数值的比例
时间: 2023-10-12 14:15:25 浏览: 359
统计数据集中各个类别的数目
可以使用 Python 的 pandas 库来统计某一列各个种类占该列所有数值的比例。假设你有一个名为 `df` 的数据框,其中包含一列名为 `category`,你可以按照以下步骤进行统计:
1. 使用 `value_counts()` 方法统计该列各个种类的数量,并将结果保存在一个新的数据框中:
```
count_df = df['category'].value_counts().reset_index()
```
2. 将新数据框的列名修改为 `category` 和 `count`:
```
count_df.columns = ['category', 'count']
```
3. 计算每个种类占该列所有数值的比例,并添加一列到新数据框中:
```
count_df['percentage'] = count_df['count'] / count_df['count'].sum()
```
完整代码如下:
```python
import pandas as pd
# 读取数据
df = pd.read_csv('data.csv')
# 统计各个种类数量并计算比例
count_df = df['category'].value_counts().reset_index()
count_df.columns = ['category', 'count']
count_df['percentage'] = count_df['count'] / count_df['count'].sum()
print(count_df)
```
其中,`data.csv` 是你的数据文件名,需要替换成你自己的数据文件名。
阅读全文