dataframe 某列数据占比
时间: 2023-07-06 13:38:33 浏览: 363
DataFrame 将某列数据转为数组的方法
5星 · 资源好评率100%
要计算 DataFrame 中某列数据值的占比,可以使用 Pandas 库中的 value_counts() 函数来统计该列每个值的出现次数,然后除以该列总数据量即可得到每个值的占比。
例如,假设 DataFrame 中有一列名为 'gender',包含男女两种取值,可以使用以下代码计算男女数据的占比:
```python
import pandas as pd
# 创建 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
'gender': ['F', 'M', 'M', 'F', 'F']}
df = pd.DataFrame(data)
# 计算 gender 列中每个值的出现次数
counts = df['gender'].value_counts()
# 计算 gender 列中每个值的占比
proportions = counts / df.shape[0]
print(proportions)
```
输出结果如下:
```
F 0.6
M 0.4
Name: gender, dtype: float64
```
其中,'F' 和 'M' 分别表示女性和男性,0.6 和 0.4 分别表示女性和男性数据的占比。
阅读全文