根据sklearn库中的鸢尾花数据集属性1和属性2所有观测值,使用Python画出散点图,
时间: 2024-12-14 17:14:49 浏览: 12
python导入鸢尾花数据集,使用主成分分析函数对鸢尾花数据集降维数据集和原始数据集分别进行线性判别比较分析的准确率
在Python中,我们可以使用`scikit-learn`库中的`Iris`数据集以及`matplotlib`库来绘制散点图。以下是一个步骤示例:
首先,确保已安装了所需的库,如果没有,可以使用pip安装:
```bash
pip install numpy matplotlib pandas scikit-learn
```
然后,导入必要的模块并加载鸢尾花数据集:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
# 加载鸢尾花数据
iris = load_iris()
X = iris.data[:, :2] # 我们只取前两个属性作为x轴和y轴的值
y = iris.target
```
接下来,将数据分为训练集和测试集,以便我们有样本点绘制散点图:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
最后,创建散点图:
```python
plt.figure(figsize=(8,6))
for i in range(len(iris.target_names)):
plt.scatter(X_train[y_train == i, 0], X_train[y_train == i, 1],
label=iris.target_names[i])
plt.title('Iris Dataset - Attributes 1 and 2')
plt.xlabel('Attribute 1')
plt.ylabel('Attribute 2')
plt.legend()
plt.show()
```
这个代码会生成一个散点图,每个鸢尾花品种都用不同颜色表示,展示了属性1和属性2之间的分布。
阅读全文