pandas统计关键字出现的次数
时间: 2023-06-25 22:05:35 浏览: 112
可以使用 pandas 中的 `str.contains()` 方法和 `value_counts()` 方法来统计关键字出现的次数。
首先,将需要统计的文本数据存储在一个 pandas Series 中。然后使用 `str.contains()` 方法检查每个元素是否包含关键字,并将其结果存储在一个布尔类型的 Series 中。最后,使用布尔类型的 Series 过滤原始数据,并使用 `value_counts()` 方法统计每个关键字出现的次数。
下面是一个示例代码:
```python
import pandas as pd
# 创建一个包含文本数据的 Series
data = pd.Series(['apple is good', 'banana is also good',
'orange is not as good as apple'])
# 指定需要统计的关键字
keywords = ['apple', 'banana', 'orange']
# 使用 str.contains() 方法检查每个元素是否包含关键字
mask = data.str.contains('|'.join(keywords))
# 使用布尔类型的 Series 过滤原始数据,并使用 value_counts() 方法统计每个关键字出现的次数
result = data[mask].value_counts()
print(result)
```
输出结果为:
```
apple is good 1
banana is also good 1
orange is not as good as apple 1
dtype: int64
```
其中,每个关键字出现的次数为 1。如果需要统计所有关键字出现的总次数,可以使用 `sum()` 方法。
```python
print(result.sum())
```
输出结果为:
```
3
```