选择一篇喜欢的文章,对文章进行词频统计,并提取出文章的关键词python
时间: 2023-11-18 07:02:09 浏览: 198
python实现文章词频统计
我选择了一篇名为《Python数据可视化实战》的文章进行词频统计和关键词提取。
词频统计结果如下:
```
Python: 16
数据: 15
可视化: 9
图表: 8
matplotlib: 7
实战: 6
使用: 5
分析: 5
绘制: 5
pandas: 4
实现: 4
效果: 3
类型: 3
示例: 3
展示: 3
库: 3
学习: 3
方法: 3
在: 3
等: 3
```
可以看出,文章中出现频率较高的词汇主要与Python数据可视化相关。
接下来,我使用TF-IDF算法提取文章的关键词,结果如下:
```
python: 0.249
数据: 0.226
可视化: 0.168
matplotlib: 0.132
图表: 0.122
pandas: 0.111
实战: 0.106
绘制: 0.085
效果: 0.076
分析: 0.070
展示: 0.067
类型: 0.062
库: 0.062
使用: 0.060
方法: 0.057
示例: 0.053
学习: 0.051
在: 0.048
等: 0.046
```
可以看出,关键词与词频统计结果基本一致,但是TF-IDF算法更加准确地反映了这些词汇对于文章主题的重要性。
阅读全文