GBDT训练Iris数据集
时间: 2023-07-06 21:41:25 浏览: 121
IRIS数据集
下面是使用Python的scikit-learn库训练GBDT模型对Iris数据集进行分类的示例代码:
```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import accuracy_score
# 加载Iris数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 初始化GBDT模型
gbdt = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, max_depth=3)
# 训练模型
gbdt.fit(X_train, y_train)
# 预测结果
y_pred = gbdt.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
上述代码中,首先使用`load_iris()`函数加载Iris数据集,然后使用`train_test_split()`函数将数据集划分为训练集和测试集。接着,使用`GradientBoostingClassifier()`函数初始化GBDT模型,设置超参数`n_estimators`、`learning_rate`和`max_depth`。最后,使用`fit()`方法对模型进行训练,使用`predict()`方法对测试集进行预测,使用`accuracy_score()`函数计算预测结果的准确率。
需要注意的是,Iris数据集是一个三分类问题,因此需要使用分类器进行训练和测试。同时,还需要根据具体的问题进行模型调参,以获得更好的性能和效果。
阅读全文