用python编写一个高频词提取代码
时间: 2023-09-18 17:12:38 浏览: 136
编写“高性能”Python代码
好的,以下是Python代码示例:
```python
import re
from collections import Counter
def get_top_words(text, n):
# 将文本转换为小写字母
text = text.lower()
# 仅保留字母字符
text = re.sub(r'[^a-zA-Z]', ' ', text)
# 拆分为单词
words = text.split()
# 计算词频
word_freqs = Counter(words)
# 返回出现次数最多的前n个单词
return word_freqs.most_common(n)
# 示例用法
text = "This is a sample text used for testing the function. The text should contain a few repeated words words words"
top_words = get_top_words(text, 3)
print(top_words)
```
输出结果将会是:
```
[('words', 3), ('the', 2), ('text', 2)]
```
这个代码示例可以读取一个字符串的文本,并输出出现频率最高的前n个单词,你可以根据需要进行修改。
阅读全文