K折交叉验证python代码
时间: 2023-07-09 14:23:05 浏览: 91
k折交叉验证寻找KNN模型的最佳k值Python代码
下面是使用 scikit-learn 库进行 K 折交叉验证的代码示例:
```python
from sklearn.model_selection import KFold
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
import numpy as np
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 定义 K 折交叉验证器
kf = KFold(n_splits=5, shuffle=True, random_state=42)
# 定义模型
model = LogisticRegression()
# 进行 K 折交叉验证
score_list = []
for train_index, test_index in kf.split(X):
# 获取训练集和测试集
X_train, X_test = X[train_index], X[test_index]
y_train, y_test = y[train_index], y[test_index]
# 训练模型
model.fit(X_train, y_train)
# 评估模型
score = model.score(X_test, y_test)
score_list.append(score)
# 计算平均得分和标准差
mean_score = np.mean(score_list)
std_score = np.std(score_list)
print("Mean score:", mean_score)
print("Std score:", std_score)
```
在上面的代码中,我们使用 `load_iris()` 加载了一个经典的鸢尾花数据集,并使用 `KFold` 定义了一个 5 折交叉验证器。然后,我们定义了一个逻辑回归模型,并在 K 折交叉验证过程中对模型进行了训练和评估。最后,我们计算了所有折的得分的平均值和标准差。你可以根据实际情况修改代码,进行 K 折交叉验证。
阅读全文