我有一个数据 消极文本消极词.txt 里面全是一些词语 但是有些词不需要,通过停用词表stopwords表将去除掉
时间: 2023-06-17 15:04:37 浏览: 117
停用词表stopwords
5星 · 资源好评率100%
好的,你可以使用Python来处理这个任务。首先,你需要先读取停用词表和消极文本消极词数据集。可以使用以下代码:
```python
# 读取停用词表
with open('stopwords.txt', 'r', encoding='utf-8') as f:
stopwords = f.read().splitlines()
# 读取消极文本消极词数据集
with open('消极文本消极词.txt', 'r', encoding='utf-8') as f:
words = f.read().split()
```
接下来,你需要使用循环和条件语句来去除停用词,代码如下:
```python
# 去除停用词
new_words = []
for word in words:
if word not in stopwords:
new_words.append(word)
```
最后,你可以将去除停用词后的词语保存到文件中,代码如下:
```python
# 将去除停用词后的词语保存到文件中
with open('消极文本消极词_去除停用词.txt', 'w', encoding='utf-8') as f:
f.write(' '.join(new_words))
```
这样,你就成功去除了停用词并保存了结果。
阅读全文