用Python数据可视化划出安斯库姆四重奏
时间: 2024-04-06 09:26:55 浏览: 248
scientific visualization
安斯库姆四重奏是由统计学家弗朗西斯·安斯库姆(Francis Anscombe)在1973年提出的一组数据集,用于展示统计分析中的重要概念。这组数据集包含四个二维数据集,它们在很多统计指标上都非常相似,但是在可视化上却呈现出截然不同的特征。
要使用Python进行数据可视化并绘制安斯库姆四重奏,你可以使用一些常用的数据可视化库,如matplotlib和seaborn。下面是一个简单的示例代码:
```python
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
# 安斯库姆四重奏数据
data = {
'I': [[10, 8, 13, 9, 11, 14, 6, 4, 12, 7, 5], [8.04, 6.95, 7.58, 8.81, 8.33, 9.96, 7.24, 4.26, 10.84, 4.82, 5.68]],
'II': [[10, 8, 13, 9, 11, 14, 6, 4, 12, 7, 5], [9.14, 8.14, 8.74, 8.77, 9.26, 8.10, 6.13, 3.10, 9.13, 7.26, 4.74]],
'III': [[10, 8, 13, 9, 11, 14, 6, 4, 12, 7, 5], [7.46, 6.77, 12.74, 7.11, 7.81, 8.84, 6.08, 5.39, 8.15, 6.42, 5.73]],
'IV': [[8, 8, 8, 8, 8, 8, 8, 19, 8, 8, 8], [6.58, 5.76, 7.71, 8.84, 8.47, 7.04, 5.25, 12.50, 5.56, 7.91, 6.89]]
}
# 创建一个包含四个子图的画布
fig, axes = plt.subplots(2, 2)
# 绘制安斯库姆四重奏
for i, (key, values) in enumerate(data.items()):
row = i // 2
col = i % 2
ax = axes[row][col]
ax.scatter(values[0], values[1])
ax.set_title(key)
# 调整子图之间的间距
plt.tight_layout()
# 显示图形
plt.show()
```
这段代码使用了matplotlib库来创建一个包含四个子图的画布,并使用scatter函数绘制了安斯库姆四重奏的数据点。每个子图代表一个数据集,其中x轴表示第一个特征,y轴表示第二个特征。你可以运行这段代码来查看安斯库姆四重奏的可视化效果。
阅读全文