选择一篇喜欢的文章,对文章进行词频统计,并提取出文章的关键词python代码
时间: 2023-12-16 20:05:28 浏览: 102
Python实现统计英文文章词频的方法分析
我选择了一篇名为《如何成为一名优秀的程序员?》的文章,对其进行词频统计和关键词提取。
```python
import jieba
from collections import Counter
# 读取文章内容
with open('article.txt', 'r', encoding='utf-8') as f:
contents = f.read()
# 使用结巴分词进行分词
words = jieba.cut(contents)
# 统计词频
word_count = Counter(words)
# 提取关键词
keywords = word_count.most_common(10)
# 输出结果
print('词频统计:')
for word, count in word_count.items():
print(word, count)
print('\n关键词提取:')
for keyword, count in keywords:
print(keyword)
```
需要注意的是,这里需要安装结巴分词库,可以使用以下命令进行安装:
```bash
pip install jieba
```
阅读全文