python数据可视化第九节
时间: 2023-09-02 08:08:36 浏览: 135
Matplotlib 文档
第九节数据可视化主要包括以下内容:
1. 直方图
直方图是一种常用的数据可视化方式,用于显示数据的分布情况。直方图通过将数据划分成一些连续的区间(也称为“箱子”或“桶”),然后统计每个区间内的数据量,并将结果绘制为垂直条形图。
在 Python 中,我们可以使用 Matplotlib 库的 hist() 函数来绘制直方图,例如:
```python
import matplotlib.pyplot as plt
import numpy as np
# 生成1000个随机数,服从正态分布
data = np.random.randn(1000)
# 绘制直方图
plt.hist(data, bins=30, alpha=0.5, color='green')
# 添加标题和标签
plt.title('Histogram of Random Data')
plt.xlabel('Value')
plt.ylabel('Frequency')
# 显示图形
plt.show()
```
2. 箱线图
箱线图是一种用于展示数据分布情况的图表。它由一个矩形和两条“须”组成。矩形表示数据的四分位数范围(第一四分位数、中位数和第三四分位数),上下两条“须”表示数据的最大值和最小值,以及可能的离群值。
在 Python 中,我们可以使用 Matplotlib 库的 boxplot() 函数来绘制箱线图,例如:
```python
import matplotlib.pyplot as plt
import numpy as np
# 生成3组数据,每组100个随机数,服从正态分布
data1 = np.random.normal(0, 1, 100)
data2 = np.random.normal(2, 1, 100)
data3 = np.random.normal(4, 1, 100)
# 绘制箱线图
plt.boxplot([data1, data2, data3], labels=['Group 1', 'Group 2', 'Group 3'])
# 添加标题和标签
plt.title('Boxplot of Random Data')
plt.xlabel('Group')
plt.ylabel('Value')
# 显示图形
plt.show()
```
3. 热力图
热力图是一种用于展示数据密度分布情况的图表。它通常通过不同颜色的方块来表示数据的密度大小,颜色越浅表示密度越大,颜色越深表示密度越小。
在 Python 中,我们可以使用 Seaborn 库的 heatmap() 函数来绘制热力图,例如:
```python
import seaborn as sns
import numpy as np
# 生成10x10的随机矩阵
data = np.random.rand(10, 10)
# 绘制热力图
sns.heatmap(data, cmap='YlGnBu')
# 添加标题和标签
plt.title('Heatmap of Random Data')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
# 显示图形
plt.show()
```
以上就是第九节数据可视化的内容,希望对你有所帮助。
阅读全文