# 导入所需的库和数据集 from sklearn.ensemble import RandomForestClassifier from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report, confusion_matrix # 加载鸢尾花数据集 iris = load_iris() # 数据预处理 # 检查数据集的特征和标签 X = y = # 划分数据集 X_train, X_test, y_train, y_test =
时间: 2024-02-12 19:05:16 浏览: 62
RandomForest_sklearn.zip_sklearn_sklearn RF_southern9qq_随机森林
这段代码使用了scikit-learn库中的鸢尾花数据集,将数据集划分为训练集和测试集。
具体的代码如下:
```
# 导入所需的库和数据集
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix
# 加载鸢尾花数据集
iris = load_iris()
# 数据预处理
# 检查数据集的特征和标签
X = iris.data
y = iris.target
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
其中,`load_iris()`方法加载了鸢尾花数据集,将特征保存在`X`中,将标签保存在`y`中。
`train_test_split()`方法将数据集划分为训练集和测试集,其中`test_size=0.3`表示将数据集划分为70%的训练集和30%的测试集,`random_state=42`表示设置随机种子,保证每次划分的结果相同。返回的四个变量分别是训练集的特征、测试集的特征、训练集的标签和测试集的标签。
阅读全文