帮我写一个python词云代码,分析岗位需求最多的行业
时间: 2024-05-05 14:18:04 浏览: 79
好的,为您准备 Python 词云分析代码,分析岗位需求最多的行业:
```python
# 导入所需的库和模块
import pandas as pd
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 读取数据集
df = pd.read_csv("job.csv", encoding="utf-8")
# 定义停用词列表
stopwords = ["有限公司", "责任", "管理", "以上学历", "优先", "会计", "能力", "财务", "采购", "法律", "合同", "相关", "团队", "员工", "文案", "策划", "市场", "设计", "广告", "公司", "岗位职责", "职位描述", "岗位要求", "要求", "职位", "及以上"]
# 分词并去除停用词
words = []
for line in df["job_detail"]:
line = str(line)
segs = jieba.lcut(line, cut_all=False)
for seg in segs:
if len(seg.strip()) > 1 and seg not in stopwords:
words.append(seg)
# 生成词云图
words_str = " ".join(words)
wc = WordCloud(font_path="msyh.ttf", background_color="white")
wc.generate(words_str)
plt.imshow(wc, interpolation="bilinear")
plt.axis("off")
plt.show()
```
请确保您已将数据存储在名为“job.csv”的文件中,并将其放在相同的文件夹中。
请注意,为了更好地生成词云,我用 jieba 库对文本数据进行了中文分词,并用 WordCloud 库生成词云图。在生成词云图之前,还需要定义一个停用词列表,并在分词过程中去除这些停用词。我还使用 matplotlib 库将词云图展示出来。
希望这可以解决您的问题!
阅读全文