import matplotlib.pyplot as plt from collections import OrderedDict plt.rcParams['font.family'] = 'SimHei' # 正常显示中文 plt.figure(figsize=(5, 4)) # 设置画布大小 plt.bar(['是'], credit['瑕疵户'].value_counts()[1], color='r', width=0.3) plt.bar(['否'], credit['瑕疵户'].value_counts()[2], color='b', width=0.3) plt.ylabel('客户数量', fontsize=12) # 设置y轴坐标和字体大小 plt.title('瑕疵户', fontsize=12) # 设置标题和字体大小 plt.show()

时间: 2023-08-19 17:05:04 浏览: 41

这段代码使用了Python的matplotlib库和collections库。它的作用是生成一个柱状图，展示数据集中有多少个瑕疵户和非瑕疵户。其中，SimHei字体用来正常显示中文，figsize参数用来设置画布大小，bar函数用来绘制柱状图，ylabel用来设置y轴坐标和字体大小，title用来设置标题和字体大小，最后show函数用来展示图形。

from collections import defaultdict import os import re import jieba #加载自定义词典 jieba.load_userdict("user_dict.txt") import codecs import warnings import matplotlib warnings.filterwarnings("ignore") matplotlib.rcParams['font.family']='SimHei' import matplotlib.pyplot as plt import seaborn as sns import pandas as pd import xlrd import openpyxl

你给出的代码是 Python 语言的代码，它导入了许多库和模块，这些库和模块包括了： - `collections`：Python 的标准库，提供了一些特殊的容器类型，如 `defaultdict`。 - `os`：Python 的标准库，提供了一些与操作系统交互的函数。 - `re`：Python 的标准库，提供了一些正则表达式操作函数。 - `jieba`：Python 中常用的中文分词库。 - `codecs`：Python 的标准库，提供了一些编码和解码函数。 - `warnings`：Python 的标准库，提供了一些警告相关的函数和类。 - `matplotlib`：Python 中常用的数据可视化库。 - `pandas`：Python 中常用的数据处理库。 - `xlrd`：Python 中常用的读取 Excel 文件的库。 - `openpyxl`：Python 中常用的写入和修改 Excel 文件的库。这些库和模块中的函数和类可以帮助你完成各种任务，如文本处理、数据分析、数据可视化等。

import numpy as np from sklearn.cluster import KMeans import collections from sklearn import metrics import matplotlib.pyplot as plt plt.rcParams['font.family'] = 'SimHei' # 正常显示中文 # 参数寻优 inertia = [] silhouettteScore = [] # 计算聚类数目为2至9时的轮廓系数值和簇内误差平方和 for i in range(2, 10): km = KMeans(n_clusters=i, random_state=12).fit(ScoreModel) y_pred = km.predict(ScoreModel) center_ = km.cluster_centers_ score = metrics.silhouette_score(ScoreModel, km.labels_) silhouettteScore.append([i, score]) inertia.append([i, km.inertia_]) # 绘制轮廓系数图 silhouettteScore = np.array(silhouettteScore) plt.plot(silhouettteScore[: , 0], silhouettteScore[: , 1]) plt.title('轮廓系数值 - 聚类数目') plt.show() #绘制簇内误差平方和图 inertia = np.array(inertia) plt.plot(inertia[: , 0], inertia[: , 1]) plt.title('簇内误差平方和 - 聚类数目') plt.show()

这段代码使用了 Python 中的 sklearn 库中的 KMeans 算法，对 ScoreModel 进行聚类分析，并绘制了聚类数目与轮廓系数值、簇内误差平方和之间的关系图。首先设置了中文字体，以便在图表中正常显示中文。然后定义了空列表 inertia 和 silhouettteScore，用于保存不同聚类数目下的簇内误差平方和和轮廓系数值。接着使用 for 循环，将聚类数目从 2 到 9，每次分别对 ScoreModel 进行 KMeans 聚类，并计算轮廓系数值和簇内误差平方和。其中，轮廓系数值用于度量聚类结果的质量，簇内误差平方和用于评估聚类的紧密度和密度。最后，使用 matplotlib 库绘制了轮廓系数值与聚类数目、簇内误差平方和与聚类数目之间的关系图，并调用 plt.show() 函数显示图表。

相关推荐

解决matplotlib.pyplot在Jupyter notebook中不显示图像问题

matplotlib.pyplot绘图显示控制方法

3.统计某本小说中人物出场次数，并形成词云图。(至少统计出出场次数最多的前5个人物；词云图与统计的人物次数基本一致)

从网上获取中文时事文本素材 （保存为 txt 文本），利用第三 方库jieba 进行分词，统计词频，将高频词用第三方库 wordcloud 可视化为词云并显示，词云图片效果自定义。

matplotlib做一个豆瓣TOP250导演词云图

python功能模块分析文件“dreamofredmaison.txt”中前 80 回和 后 40 回中常见文言虚实词的词频,分析结果存入文本文件,并将结果可视化

利用Python对/连接的中文字符分词，并统计分词后的频数，并将该频数绘制出直方图

中文词频统计和结果可视化用jieba

利用Python对/连接的中文字符分词，并统计分词后的频数，并将该频数绘制出直方图，并设置图名为电影类型频数直方图

水浒传词频统计python123

利用Python对/连接的中文字符分词，并统计分词后的频数，并将该频数从大到小排序后绘制出直方图，并设置图名为电影类型频数直方图

python，进行词频统计并绘制词云图。

编写Python程序，爬 取 网 页http://www.gov.cn/xinwen/2021-06/13/content 5617433.htm新 闻 内 容 ，并 进 行 分 词 和 词 频 统 计 将 高 频 词 生 成 词 云 显 示。 建议：模块化编程，分为几个函数实现。

请用python编写一个在三国演义的词频分析上，做一个词云效果图

最新推荐

python3常用的数据清洗方法(小结)

BSC绩效考核指标汇总 (2).docx

管理建模和仿真的文件

【进阶】Flask中的会话与用户管理

卷积神经网络实现手势识别程序

BSC资料.pdf

"互动学习：行动中的多样性与论文攻读经历"

【进阶】Flask中的请求处理

transformer模型对话

BSC绩效考核指标汇总 (3).pdf

从网上获取中文时事文本素材（保存为 txt 文本），利用第三方库jieba 进行分词，统计词频，将高频词用第三方库 wordcloud 可视化为词云并显示，词云图片效果自定义。

python功能模块分析文件“dreamofredmaison.txt”中前 80 回和后 40 回中常见文言虚实词的词频,分析结果存入文本文件,并将结果可视化

编写Python程序，爬取网页http://www.gov.cn/xinwen/2021-06/13/content 5617433.htm新闻内容，并进行分词和词频统计将高频词生成词云显示。建议：模块化编程，分为几个函数实现。