found_pos_words 包含了一些词语 请对里面的数据进行停用词的处理,导入stopwords.txt的停用词表对其进行停用词处理
时间: 2023-06-19 19:02:53 浏览: 84
停用词表,中英文的stopwords.txt
好的,可以使用Python中的nltk库来进行停用词处理。首先,需要从nltk库中导入停用词表和停用词处理的函数,然后读取停用词表文件并进行处理。
以下是示例代码:
```python
import nltk
nltk.download('stopwords')
from nltk.corpus import stopwords
stop_words = set(stopwords.words('english')) # 读取英文停用词表
found_pos_words = ['good', 'great', 'excellent', 'amazing', 'awesome']
# 进行停用词处理
found_pos_words = [word for word in found_pos_words if word not in stop_words]
print(found_pos_words)
```
其中,`stopwords.words('english')`会返回一个包含英文停用词的列表。我们将这个列表转换成集合类型,并对`found_pos_words`中的每个词语进行循环判断,如果不是停用词,则将其加入新的列表中。
输出结果为:
```
['good', 'great', 'excellent', 'amazing', 'awesome']
```
可以看到,所有的词语都被保留下来了,停用词已经被过滤掉了。
阅读全文