对鸢尾花数据集进行划分
时间: 2024-06-13 17:08:17 浏览: 96
基于MATLAB的鸢尾花数据集分类
5星 · 资源好评率100%
对鸢尾花数据集进行划分,一般是将数据集分为训练集和测试集两部分。训练集用于训练模型,测试集用于评估模型的性能。
以下是对鸢尾花数据集进行划分的Python代码示例:
```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
# 加载鸢尾花数据集
iris = load_iris()
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=0)
# 输出划分后的数据集大小
print("训练集大小:", X_train.shape[0])
print("测试集大小:", X_test.shape[0])
```
上述代码中,首先使用`load_iris()`函数加载鸢尾花数据集。然后使用`train_test_split()`函数将数据集划分为训练集和测试集,其中`test_size`参数指定测试集所占的比例,`random_state`参数指定随机种子,保证每次划分的结果相同。最后输出训练集和测试集的大小。
阅读全文