用python代码写一个提取文件中形容词的代码
时间: 2024-05-06 07:17:33 浏览: 161
使用python提取html文件中的特定数据的实现代码
5星 · 资源好评率100%
你可以使用Python中的nltk库来实现提取文件中形容词的代码。以下是一个示例代码:
```python
import nltk
from nltk.tokenize import word_tokenize, sent_tokenize
from nltk.corpus import stopwords
from nltk.stem import WordNetLemmatizer
# 读取文件内容
with open('example.txt', 'r') as file:
text = file.read()
# 分词
words = word_tokenize(text)
# 去除停用词
stop_words = set(stopwords.words('english'))
words = [word for word in words if not word in stop_words]
# 词性标注
pos_tags = nltk.pos_tag(words)
# 提取形容词
adjectives = [word for word, pos in pos_tags if pos == 'JJ']
# 去重、排序
adjectives = sorted(set(adjectives))
# 输出结果
print(adjectives)
```
上述代码中,我们首先读取了一个文本文件,并使用nltk库中的word_tokenize函数将其分词。接着,我们使用nltk.corpus中的stopwords来去除停用词,以减少干扰。然后,我们使用nltk.pos_tag函数对每个词进行词性标注,以便进一步分析。最后,我们通过筛选出词性为'JJ'的词,来提取文本中的形容词,并通过去重、排序等操作,输出结果。
阅读全文