如何利用pandas统计某列下相应数值的个数
时间: 2023-06-29 11:15:32 浏览: 178
可以使用 Pandas 的 `value_counts()` 方法统计某列下每个数值出现的次数。假设你有一个名为 `data.csv` 的文件,其中包含一个名为 `col` 的列,你可以按如下方式操作:
```python
import pandas as pd
# 读取文件,假设有列名
df = pd.read_csv('data.csv')
# 统计 'col' 列中每个数值出现的次数
value_counts = df['col'].value_counts()
# 打印结果
print(value_counts)
```
这会输出一个类似以下内容的结果:
```
1.0 100
2.0 80
3.0 50
4.0 30
5.0 20
Name: col, dtype: int64
```
其中,每行表示一个数值及其出现次数,第一列是数值,第二列是出现次数。你可以使用这个结果进行进一步的数据分析和可视化。
如果你想统计多个列的数值,你可以使用 `groupby()` 方法对多个列进行分组,然后使用 `value_counts()` 方法统计每组中数值的出现次数。例如,假设你有两个列 `col_1` 和 `col_2`,你可以按如下方式操作:
```python
# 统计 'col_1' 和 'col_2' 两列中每个数值出现的次数
value_counts = df.groupby(['col_1', 'col_2']).size()
# 打印结果
print(value_counts)
```
这会输出一个类似以下内容的结果:
```
col_1 col_2
1 a 50
b 30
c 20
2 a 40
b 20
c 20
3 a 30
b 10
c 10
dtype: int64
```
其中,每行表示一个数值及其出现次数,第一列是 `col_1` 和 `col_2` 的值,第二列是出现次数。你可以根据需要进行进一步的数据处理和可视化。
阅读全文