import pandas as pd import numpy as np # 导入数据 df = pd.read_csv("E:\data2.csv") # 根据label列分组并计数 df_label = df.groupby("LBDSCHSI").size() # 转化为作图所需要的array格式，如：([[ 0, 37536],[ 1, 12322]]) datas = list(zip(df_label.index.to_list(), df_label.to_list())) datas= np.array([[0,2.83],[2.83,5.20],[5.20,6.45],[6.45,8.0]]) # 绘制饼图 import matplotlib.pyplot as plt # 设置字体和编码格式 plt.rcParams['font.sans-serif'] = 'simhei' plt.rcParams['axes.unicode_minus'] = False # 添加数据，标签，比例 plt.pie(datas[:, 1],labels=datas[:, 0],autopct="%.2f%%") # 在右上方添加图例 plt.legend(datas[:, 0], loc="upper right") # 添加标题 plt.title("LBDSCHSI(胆固醇)含量分析") # 展示饼图 plt.show()

时间: 2024-01-16 07:01:56 浏览: 118

用Pandas作图

在数据分析和科学计算中，Pandas是一个强大的Python库，它提供了大量的数据结构和操作工具，特别适合于处理表格数据。而matplotlib是一个Python的绘图库，能够生成各种高质量的静态、动画和交互式的可视化图表。当Pandas和matplotlib结合起来时，我们就可以利用Pandas中封装好的绘图功能，非常便捷地对数据进行可视化。在本篇教程中，我们将介绍如何使用Pandas进行作图，包括作图的基本使用方法以及一些高级特性。 Pandas通过整合matplotlib的相关功能，实现了基于DataFrame的一些作图功能。这意味着，任何已经加载到Pandas DataFrame中的数据，都可以通过简单的调用方法来绘制图表。Pandas中的绘图方法是基于matplotlib的，这使得matplotlib的复杂细节对大多数用户来说是透明的，从而简化了绘图过程。在文章中，首先提到使用Pandas作图，可以通过导入Pandas库并读取数据来开始。例如，通过`pd.read_table()`或`pd.read_csv()`方法加载数据后，可以将DataFrame设置索引，并直接对特定的列进行绘图。例如，`present_year['boys'].plot()`可以绘制一个名为'boys'的数据列的图形。在使用Pandas进行作图时，可以指定不同的绘图类型。文章中展示了多种绘图的类型，比如`line`（折线图）、`bar`（柱状图）、`barh`（水平柱状图）、`kde`（核密度图）、`density`（密度图）、`scatter`（散点图）等。这些图表类型可以通过`kind`参数指定。例如，`present_year[:10].plot(kind='bar')`就会生成一个包含前10行数据的柱状图。除了基本图表类型外，Pandas还允许我们创建堆叠式的图表。在文章的例子中，通过设置`stacked=True`参数，可以将多列数据堆叠在一起，形成堆叠柱状图。这对于展示多维度数据的分布特别有用。 Pandas还提供了一些高级的绘图功能，比如绘制散点图时，可以通过`x`和`y`参数指定横纵坐标的数据列，从而直观地展示变量之间的关系。例如，`present_year.plot(x='boys',y='girls',kind='scatter')`就会绘制一个散点图，展示'boys'列和'girls'列之间的关系。文章中还提到了Pandas在绘图时对数据的聚合和转换。例如，通过对DataFrame使用`.sum(1)`方法，可以对每一行的数据进行求和，得到一个新的Series。然后可以通过`div`方法对这个Series进行归一化处理，再使用`.plot()`方法进行绘图。这种操作对于数据预处理和展示趋势非常有帮助。此外，Pandas支持多种参数来对图形进行格式化和优化，比如可以设置图例的位置（`loc`参数）、调整图形的比例（`figsize`参数）、显示网格（`grid`参数）等。文章中还简单展示了如何从外部数据源如互联网上的公开数据集导入数据，并使用Pandas的`corr`方法来计算数据的相关系数矩阵，进而可以使用热力图等高级绘图技术来可视化变量间的关系。需要注意的是，文章中所提供的代码和数据示例可能由于OCR扫描识别的错误而导致某些细节与实际使用时存在出入，所以在实际应用中，应当注意核对数据和语法的准确性，确保代码能够正常运行。

这段代码使用 Pandas 和 Matplotlib 库，读取了一个 CSV 文件，对其中的数据进行处理，然后绘制了一个饼图。具体来说： - `pd.read_csv("E:\data2.csv")` 读取了一个名为 data2.csv 的 CSV 文件，并将其存储在一个 Pandas 数据帧中。 - `df.groupby("LBDSCHSI").size()` 根据 LBDSCHSI 列中的数值进行分组，并计算每组中的数量。 - `list(zip(df_label.index.to_list(), df_label.to_list()))` 将分组计数结果转化为一个列表，其中每个元素都是一个元组，包含了 LBDSCHSI 值和对应的计数值。 - `np.array([[0, 2.83], [2.83, 5.20], [5.20, 6.45], [6.45, 8.0]])` 提供了一个硬编码的数据 array，用于绘制饼图。其中每个元素都是一个列表，包含了一个区间的起点和终点，以及对应的计数值。 - `plt.pie(datas[:, 1],labels=datas[:, 0],autopct="%.2f%%")` 使用 Matplotlib 的 `pie()` 函数绘制饼图，其中 `datas[:, 1]` 表示用于绘制饼图的数据，`datas[:, 0]` 表示每个数据对应的标签，`autopct="%.2f%%"` 表示在饼图上显示每个区域的百分比。 - `plt.legend(datas[:, 0], loc="upper right")` 在饼图的右上方添加图例，其中 `loc="upper right"` 表示图例的位置在右上方。 - `plt.title("LBDSCHSI(胆固醇)含量分析")` 添加饼图的标题。 - `plt.show()` 展示饼图。

阅读全文

相关推荐

python数据分析与可视化常用函数介绍与使用.docx

Python：雷达图的实现 的 air_data

毕设和企业适用springboot企业数据管理平台类及跨境电商管理平台源码+论文+视频.zip

最新推荐

毕设和企业适用springboot企业数据管理平台类及跨境电商管理平台源码+论文+视频.zip

基于net的超市管理系统源代码（完整前后端+sqlserver+说明文档+LW）.zip

LABVIEW程序实例-公式节点.zip

毕设和企业适用springboot社交应用平台类及用户数据分析平台源码+论文+视频.zip

大米商城开源版damishop(适合外贸)

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

Python：雷达图的实现的 air_data