import matplotlib.pyplot as plt from collections import OrderedDict plt.rcParams['font.family'] = 'SimHei' # 正常显示中文 plt.figure(figsize=(5, 4)) # 设置画布大小 plt.bar(['是'], credit['瑕疵户'].value_counts()[1], color='r', width=0.3) plt.bar(['否'], credit['瑕疵户'].value_counts()[2], color='b', width=0.3) plt.ylabel('客户数量', fontsize=12) # 设置y轴坐标和字体大小 plt.title('瑕疵户', fontsize=12) # 设置标题和字体大小 plt.show()
时间: 2023-08-19 17:05:04 浏览: 41
这段代码使用了Python的matplotlib库和collections库。它的作用是生成一个柱状图,展示数据集中有多少个瑕疵户和非瑕疵户。其中,SimHei字体用来正常显示中文,figsize参数用来设置画布大小,bar函数用来绘制柱状图,ylabel用来设置y轴坐标和字体大小,title用来设置标题和字体大小,最后show函数用来展示图形。
相关问题
from collections import defaultdict import os import re import jieba #加载自定义词典 jieba.load_userdict("user_dict.txt") import codecs import warnings import matplotlib warnings.filterwarnings("ignore") matplotlib.rcParams['font.family']='SimHei' import matplotlib.pyplot as plt import seaborn as sns import pandas as pd import xlrd import openpyxl
你给出的代码是 Python 语言的代码,它导入了许多库和模块,这些库和模块包括了:
- `collections`:Python 的标准库,提供了一些特殊的容器类型,如 `defaultdict`。
- `os`:Python 的标准库,提供了一些与操作系统交互的函数。
- `re`:Python 的标准库,提供了一些正则表达式操作函数。
- `jieba`:Python 中常用的中文分词库。
- `codecs`:Python 的标准库,提供了一些编码和解码函数。
- `warnings`:Python 的标准库,提供了一些警告相关的函数和类。
- `matplotlib`:Python 中常用的数据可视化库。
- `pandas`:Python 中常用的数据处理库。
- `xlrd`:Python 中常用的读取 Excel 文件的库。
- `openpyxl`:Python 中常用的写入和修改 Excel 文件的库。
这些库和模块中的函数和类可以帮助你完成各种任务,如文本处理、数据分析、数据可视化等。
import numpy as np from sklearn.cluster import KMeans import collections from sklearn import metrics import matplotlib.pyplot as plt plt.rcParams['font.family'] = 'SimHei' # 正常显示中文 # 参数寻优 inertia = [] silhouettteScore = [] # 计算聚类数目为2至9时的轮廓系数值和簇内误差平方和 for i in range(2, 10): km = KMeans(n_clusters=i, random_state=12).fit(ScoreModel) y_pred = km.predict(ScoreModel) center_ = km.cluster_centers_ score = metrics.silhouette_score(ScoreModel, km.labels_) silhouettteScore.append([i, score]) inertia.append([i, km.inertia_]) # 绘制轮廓系数图 silhouettteScore = np.array(silhouettteScore) plt.plot(silhouettteScore[: , 0], silhouettteScore[: , 1]) plt.title('轮廓系数值 - 聚类数目') plt.show() #绘制簇内误差平方和图 inertia = np.array(inertia) plt.plot(inertia[: , 0], inertia[: , 1]) plt.title('簇内误差平方和 - 聚类数目') plt.show()
这段代码使用了 Python 中的 sklearn 库中的 KMeans 算法,对 ScoreModel 进行聚类分析,并绘制了聚类数目与轮廓系数值、簇内误差平方和之间的关系图。
首先设置了中文字体,以便在图表中正常显示中文。然后定义了空列表 inertia 和 silhouettteScore,用于保存不同聚类数目下的簇内误差平方和和轮廓系数值。
接着使用 for 循环,将聚类数目从 2 到 9,每次分别对 ScoreModel 进行 KMeans 聚类,并计算轮廓系数值和簇内误差平方和。其中,轮廓系数值用于度量聚类结果的质量,簇内误差平方和用于评估聚类的紧密度和密度。
最后,使用 matplotlib 库绘制了轮廓系数值与聚类数目、簇内误差平方和与聚类数目之间的关系图,并调用 plt.show() 函数显示图表。