import matplotlib.pyplot as plt # Matplotlib 是Python中的绘图工具 import seaborn as sns from pylab import mpl import pandas as pd file = 'train.csv' data = pd.read_csv(file, encoding='utf-8') print(data.isnull().any()) # 判断哪些列包含缺失值 print(data.isnull().sum()) # 判断每列缺失值的数量 missdata=data.isnull().sum() print(round(missdata.describe())) # 统计缺失值这段代码的意思

这段代码用于读取名为 "train.csv" 的文件，使用 utf-8 编码方式进行解码，并将其存储在名为 "data" 的 pandas 数据框中。接下来，使用 isnull() 函数判断每一列是否包含缺失值，并返回一个布尔型的数据框。使用 any() 函数可以判断哪些列包含缺失值，返回一个包含 True 或 False 的布尔型序列。使用 sum() 函数可以统计每列缺失值的数量。最后，使用 describe() 函数统计缺失值的数量，并使用 round() 函数对结果进行四舍五入，输出缺失值的统计信息。

from sklearn.datasets import load_iris, fetch_20newsgroups import seaborn as sns import matplotlib.pyplot as plt import pandas as pd from pylab import mpl mpl.rcParams["font.sans-serif"] = ["SimHei"] mpl.rcParams["axes.unicode_minus"] = False iris = load_iris() iris_data = pd.DataFrame(data=iris.data, columns=['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width']) iris_data['target'] = iris.target print(iris_data) def plot_iris(iris, col1, col2): sns.lmplot(x=col1, y=col2, data=iris, hue="target", fit_reg=False) plt.xlabel(col1) plt.ylabel(col2) plt.title('鸢尾花种类分布图') plt.show() plot_iris(iris_data, 'Sepal_Width', 'Petal_Length')请根据上述代码写一份详细解析

这段代码主要用于对鸢尾花数据集进行可视化分析。以下是每一部分的详细解析： 1. 导入必要的库 ``` from sklearn.datasets import load_iris, fetch_20newsgroups import seaborn as sns import matplotlib.pyplot as plt import pandas as pd from pylab import mpl mpl.rcParams["font.sans-serif"] = ["SimHei"] mpl.rcParams["axes.unicode_minus"] = False ``` 首先导入了 `load_iris` 和 `fetch_20newsgroups` 模块，用于加载鸢尾花数据集和新闻组数据集。然后导入了 `seaborn` 和 `matplotlib.pyplot` 用于可视化分析，以及 `pandas` 用于数据处理。最后设置了中文字体和负号的显示。 2. 加载鸢尾花数据集 ``` iris = load_iris() iris_data = pd.DataFrame(data=iris.data, columns=['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width']) iris_data['target'] = iris.target print(iris_data) ``` 使用 `load_iris()` 函数加载鸢尾花数据集。然后将数据集转换成 `pandas` 中的 `DataFrame` 格式，并设置列名。最后添加一列 `target`，其中存储了每个样本的类别。最后输出数据集。 3. 可视化分析 ``` def plot_iris(iris, col1, col2): sns.lmplot(x=col1, y=col2, data=iris, hue="target", fit_reg=False) plt.xlabel(col1) plt.ylabel(col2) plt.title('鸢尾花种类分布图') plt.show() plot_iris(iris_data, 'Sepal_Width', 'Petal_Length') ``` 定义了一个名为 `plot_iris()` 的函数，该函数接受三个参数：`iris` 表示数据集，`col1` 和 `col2` 分别表示要绘制的两个特征。函数中使用 `lmplot()` 函数绘制了散点图，并根据 `hue` 参数将不同类别的数据点着上不同的颜色。然后添加了横纵坐标轴的标签和图表标题，并最终显示了图表。最后调用该函数并传入数据集和要绘制的两个特征。在这个例子中，我们绘制了花萼宽度和花瓣长度的散点图。

python数据可视化黑体

### 如何在 Python 数据可视化中使用黑体字体为了使 Matplotlib 和 Seaborn 中的文字显示为黑体，可以通过设置全局字体属性来实现。具体来说，在绘图之前配置 `matplotlib` 的默认参数可以确保所有文本都采用指定的字体样式。 #### 设置全局字体属性通过调用 `rcParams.update()` 方法更新 rc 参数字典中的 'font.sans-serif' 键值对，加入支持中文以及具有粗细调节功能的字体名称列表。对于 Windows 用户而言，“SimHei” 是一种常见的黑体中文字体选项；而对于 Mac 或 Linux 用户，则可能需要安装其他兼容的 TrueType 字体文件[^1]。 ```python import matplotlib.pyplot as plt from pylab import mpl # 导入mpl模块用于解决中文乱码问题 # 解决负号 '-' 显示为方块的问题 plt.rcParams['axes.unicode_minus'] = False # 设置字体为黑体以正常显示中文标签 mpl.rcParams['font.sans-serif']=['SimHei'] ``` 上述代码片段设置了全局字体为 SimHei 黑体，并解决了可能出现的特殊字符（如减号）渲染异常的情况。 #### 应用实例展示下面是一个完整的例子，展示了如何创建带有黑色加粗标题和轴标签的数据图表： ```python import numpy as np import pandas as pd import seaborn as sns sns.set_theme(style="whitegrid") tips = sns.load_dataset("tips") f, ax = plt.subplots(figsize=(6, 15)) # 绘制散点图并应用自定义风格 sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size", palette="ch:r=-.2,d=.3_r", sizes=(10, 200), size="size") # 添加标题与坐标轴说明 ax.set_title('消费金额 vs 小费数额\n(不同人数)', fontsize=24, fontweight='bold') ax.set_xlabel('总账单 (美元)', fontsize=18) ax.set_ylabel('小费 (美元)', fontsize=18) for label in (ax.get_xticklabels() + ax.get_yticklabels()): label.set_fontsize(16) # 调整刻度标记大小 plt.tight_layout() plt.show() ``` 此段脚本不仅改变了整个图形窗口内的字体外观，还特别指定了标题、X/Y 坐标轴描述语句的具体格式，包括字号大小及是否启用加重效果(fontweight='bold')。

阅读全文

python数据可视化黑体

相关推荐

PyPlot.jl：Julia语言中基于matplotlib.pyplot的绘图工具

Matplotlib.pyplot 三维绘图详解及示例

用matplotlib.pyplot实现Fortran绘图模块Pyplot-Fortran

图表库终极对决：Pylab vs Matplotlib，专业选择指南

Matplotlib性能优化圣手：大数据集处理技巧大公开

避免Matplotlib安装陷阱：新手指南及高级配置技巧详解

Matplotlib主题定制：打造专属图表风格，提升项目专业度

科学计算领域的Pylab探索：应用无限，潜力无限

Pylab高级技巧揭秘：如何制作风靡科学界的图表

python绘制图像分割热力图

matplotlib.pyplot教程：基础到高级图表绘制

掌握matplotlib.pyplot接口：设置画布与绘图元素示例教程

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

人脸识别_科大讯飞_Face_签到系统_Swface_1741770704.zip

跟网型逆变器小干扰稳定性分析与控制策略优化simulink仿真模型和代码.zip

大家在看

silvaco中文学习资料

AES128（CBC或者ECB）源码

EMC VNX 5300使用安装

华为MA5671光猫使用 华为MA5671补全shell 101版本可以补全shell，安装后自动补全，亲测好用，需要的可以下载

视频转换芯片 TP9950 iic 驱动代码

最新推荐

掌握Android RecyclerView拖拽与滑动删除功能

【IBM HttpServer入门全攻略】：一步到位的安装与基础配置教程

[root@localhost~]#mount-tcifs-0username=administrator,password=hrb.123456//192.168.100.1/ygptData/home/win mount：/home/win：挂载点不存在

惠普8594E与IT8500系列电子负载使用教程

MATLAB与Python在SAR点目标仿真中的对决：哪种工具更胜一筹？

前端代理配置config.js配置proxyTable多个代理不生效

最小二乘法程序深入解析与应用案例

SAR点目标仿真应用指南：案例研究与系统设计实战

eclipse为项目配置jdk

Matlab读写XML工具包使用说明及安装指导

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集

华为MA5671光猫使用华为MA5671补全shell 101版本可以补全shell，安装后自动补全，亲测好用，需要的可以下载