我的pandas表格中的数据某行是由逗号分隔的字符,我用str.split分割以后,得到的都是数组,我该如何统计这些数组中出现的元素的种类和数量
时间: 2023-06-02 14:08:28 浏览: 83
pandas使用工作技能总结
你可以使用Python内置的collections模块中的Counter函数来统计数组中元素出现的种类和数量。具体操作如下:
1. 将每行数据分割成数组后,使用列表推导式将所有数组合并成一个大列表。
2. 使用Counter函数对大列表进行统计,返回一个字典类型,其中键是元素,值是该元素出现的次数。
以下是示例代码:
```python
from collections import Counter
import pandas as pd
# 假设待统计数据在csv文件中,文件名为data.csv
df = pd.read_csv('data.csv')
# 将每行数据分割成数组后合并成一个大列表
data = [item for sublist in df['column_name'].str.split(',').tolist() for item in sublist]
# 使用Counter函数统计元素出现的次数
counter = Counter(data)
# 输出每个元素出现的次数
for key, value in counter.items():
print(key, value)
```
其中,'column_name'替换为包含待统计数据的列名。
阅读全文