输入一段英文文章(该段落中包含的特殊符号只有:空格、英文逗号、英文句号、英文单引号四种)。统计该文章中出现次数最多的词汇,并输出。
时间: 2024-02-15 09:06:04 浏览: 227
好的,可以使用Python中的nltk库和collections库来实现这个功能。以下是一个示例代码:
```python
import nltk
from collections import Counter
# 下载nltk中的停用词
nltk.download('stopwords')
# 加载英文停用词
stopwords = nltk.corpus.stopwords.words('english')
# 输入文章
text = input("请输入一段英文文章:")
# 把所有的字母转换为小写
text = text.lower()
# 提取所有的单词
words = nltk.tokenize.word_tokenize(text)
# 去除停用词和特殊符号
words = [word for word in words if word not in stopwords and word.isalpha()]
# 统计词频
word_freq = Counter(words)
# 输出出现次数最多的单词
most_common_word = word_freq.most_common(1)[0][0]
print("出现次数最多的词汇是:", most_common_word)
```
在这个示例代码中,我们首先输入一段英文文章。然后,我们把所有的字母转换为小写,并使用nltk库的word_tokenize函数提取所有的单词。接着,我们去除停用词和特殊符号,并使用collections库的Counter函数统计每个单词出现的次数。最后,我们输出出现次数最多的单词。
需要注意的是,由于输入的文章中只包含空格、英文逗号、英文句号、英文单引号四种特殊符号,所以我们在去除特殊符号时,只保留了字母。如果输入的文章中还包含其他的特殊符号,需要根据具体情况进行修改。
阅读全文