如何用python对文章中的名词、动词和形容词分别做词频统计并绘制词云图。

要用Python进行词频统计和绘制词云图，可以使用Python的Natural Language Toolkit（NLTK）和WordCloud库。以下是一些基本的步骤： 1. 安装NLTK和WordCloud库： ```python !pip install nltk !pip install wordcloud ``` 2. 导入所需的库： ```python import nltk from nltk.corpus import stopwords from nltk.tokenize import word_tokenize from nltk.probability import FreqDist from wordcloud import WordCloud import matplotlib.pyplot as plt ``` 3. 加载文章并进行预处理： ```python # 加载文章 with open('article.txt', 'r', encoding='utf-8') as f: text = f.read() # 将文章转换为小写并进行分词 tokens = word_tokenize(text.lower()) # 去除停用词 stop_words = set(stopwords.words('english')) filtered_tokens = [token for token in tokens if token not in stop_words] # 选择名词、动词和形容词 pos_tags = nltk.pos_tag(filtered_tokens) selected_tags = ['NN', 'NNS', 'NNP', 'NNPS', 'VB', 'VBD', 'VBG', 'VBN', 'VBP', 'VBZ', 'JJ', 'JJR', 'JJS'] selected_tokens = [word for word, tag in pos_tags if tag in selected_tags] ``` 4. 进行词频统计并绘制词云图： ```python # 统计词频 fdist = FreqDist(selected_tokens) # 绘制词云图 wordcloud = WordCloud(width=800, height=800, background_color='white', max_words=200).generate_from_frequencies(fdist) plt.figure(figsize=(8, 8), facecolor=None) plt.imshow(wordcloud) plt.axis('off') plt.tight_layout(pad=0) plt.show() ``` 完整代码如下： ```python import nltk from nltk.corpus import stopwords from nltk.tokenize import word_tokenize from nltk.probability import FreqDist from wordcloud import WordCloud import matplotlib.pyplot as plt # 加载文章 with open('article.txt', 'r', encoding='utf-8') as f: text = f.read() # 将文章转换为小写并进行分词 tokens = word_tokenize(text.lower()) # 去除停用词 stop_words = set(stopwords.words('english')) filtered_tokens = [token for token in tokens if token not in stop_words] # 选择名词、动词和形容词 pos_tags = nltk.pos_tag(filtered_tokens) selected_tags = ['NN', 'NNS', 'NNP', 'NNPS', 'VB', 'VBD', 'VBG', 'VBN', 'VBP', 'VBZ', 'JJ', 'JJR', 'JJS'] selected_tokens = [word for word, tag in pos_tags if tag in selected_tags] # 统计词频 fdist = FreqDist(selected_tokens) # 绘制词云图 wordcloud = WordCloud(width=800, height=800, background_color='white', max_words=200).generate_from_frequencies(fdist) plt.figure(figsize=(8, 8), facecolor=None) plt.imshow(wordcloud) plt.axis('off') plt.tight_layout(pad=0) plt.show() ```

阅读全文

如何用python对文章中的名词、动词和形容词分别做词频统计并绘制词云图。

相关推荐

python实现文章词频统计

用python实现词频分析+词云.py

python利用多种方式来统计词频（单词个数）

用python jieba对文章中名词 动词 形容词 进行词频统计并绘制词云图

如何用python对一篇给出的中文文章中的名词、动词和形容词做词频统计并绘制词云图。

PYTHON自然语言处理（中文版）笔记1

python自然语言处理（NLP）入门.pdf

Python库NLTK 2.0.5版本：数据分析与自然语言处理

使用Python进行文本数据分析

Python数据分析实战：使用Pandas和NumPy处理数据（附实战教程）

情感分析一步到位：TextBlob在Python中的应用与实例

Python中的树与森林：拓扑数据结构的实现与优化

Python文本文件读取与分析：从数据提取到信息挖掘，释放文本文件中的宝贵信息

Python字符串与数据分析：利用字符串处理数据，提升数据分析效率，从海量数据中挖掘价值，辅助决策制定

依存句法分析：Python自然语言处理高级应用

Python自然语言处理入门：NLP基础与应用快速指南

揭秘Python医学简单代码：从数据预处理到模型训练

【Python自然语言处理终极指南】：零基础入门到高级实战技巧，打造文本分析利器

向量绝对值在语言学中的应用：分析语言结构和意义

RNN在序列标注中的绝技：实体识别与词性标注

最新推荐

数据可视化之利用Python制作词云图

Python实现读取txt文件中的数据并绘制出图形操作示例

Python如何使用bokeh包和geojson数据绘制地图

Python简单实现词云图代码及步骤解析

python根据文本生成词云图代码实例

GitHub图片浏览插件：直观展示代码中的图像

管理建模和仿真的文件

【OPPO手机故障诊断专家】：工程指令快速定位与解决

求[100，900]之间相差为12的素数对（注：要求素数对的两个素数均在该范围内）的个数

Android IPTV项目：直播频道的实时流媒体实现

用python jieba对文章中名词动词形容词进行词频统计并绘制词云图