怎样用Python加载鸢尾花数据集
时间: 2024-09-25 16:06:57 浏览: 49
python导入鸢尾花数据集,使用主成分分析函数对鸢尾花数据集降维数据集和原始数据集分别进行线性判别比较分析的准确率
在Python中,你可以使用sklearn库中的`load_iris`函数来加载鸢尾花数据集。这个数据集是一个经典的分类数据集,包含150个样本,每个样本有4个特征(萼片长度、萼片宽度、花瓣长度和花瓣宽度)以及一个目标变量(表示鸢尾花的种类)。
以下是加载鸢尾花数据集的步骤:
```python
from sklearn.datasets import load_iris
# 加载数据
iris = load_iris()
# 数据分为三个部分:数据集本身、目标变量(target)、特征名称(feature names)
# 数据集(含特征和目标):
X = iris.data
y = iris.target
# 特征名称:
feature_names = iris.feature_names
# 类别名称(目标变量的标签):
class_names = iris.target_names
# 打印数据集的一些信息
print("Data shape:", X.shape)
print("Feature names:", feature_names)
print("Class names:", class_names)
```
这里的`X`就是数据矩阵,每行代表一个样本,每列对应一个特征;`y`是目标变量,通常作为分类任务的目标;`feature_names`和`class_names`分别是特征名和类别名列表。你可以直接使用这些数据进行数据分析、模型训练等操作。
阅读全文