import jieba from PIL import Image from wordcloud import WordCloud text = ("".join(i for i in data['房屋卖点'])) # print(text) cut = jieba.cut(text) img = Image.open(r'D:\Program Files\数据分析\扬名立万数据爬取与分析\链家成都二手房爬取与分析\house2.jpg') #打开遮罩照片 img_array = np.array(img) wc = wordcloud.WordCloud( background_color = 'white', height = 800, width = 400, mask = img_array, font_path = 'STXINGKA.TTF' ) wc.generate_from_text(text) plt.figure(figsize=(20,6)) plt.imshow(wc) plt.axis('off') plt.show() data_raw["装修程度"] = data_raw["装修"].str.split("/", expand = True)[1] data_raw.drop(columns=['装修'],inplace=True) data_raw 每句话的意思
时间: 2024-04-09 10:29:37 浏览: 60
Python错题本:from scipy.misc import imread 报错cannot import name imread 的解决方案
这段代码主要是用来生成词云图的。首先,将要生成词云图的文本数据存储在变量text中。然后,使用jieba库对文本进行分词处理。接下来,通过PIL库中的Image模块打开一张遮罩照片,将其转换为数组形式保存在img_array中。然后,创建一个WordCloud对象wc,设置词云图的背景色、大小、遮罩、字体等属性。接着,使用generate_from_text方法根据分词后的文本数据生成词云图。最后,使用matplotlib库将词云图显示出来。
另外,代码中还有一段对数据进行处理的部分。将数据中的"装修"列按照"/"进行拆分,并将拆分后的第二个元素保存在"装修程度"列中。然后,删除原始数据中的"装修"列。
阅读全文