自己的数据集进行k折交叉验证python代码
时间: 2023-07-26 20:31:48 浏览: 136
在进行K折交叉验证时,需要将数据集分成K个子集,并对每个子集进行训练和测试。以下是在Python中使用自己的数据集进行K折交叉验证的示例代码:
```python
from sklearn.model_selection import KFold
from sklearn.linear_model import LogisticRegression
import numpy as np
# 加载自己的数据集
X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])
y = np.array([0, 1, 0, 1])
# 创建逻辑回归分类器
clf = LogisticRegression(random_state=42)
# 使用K折交叉验证
kf = KFold(n_splits=2, shuffle=True, random_state=42)
for train_index, test_index in kf.split(X):
print("TRAIN:", train_index, "TEST:", test_index)
X_train, X_test = X[train_index], X[test_index]
y_train, y_test = y[train_index], y[test_index]
clf.fit(X_train, y_train)
print("Accuracy:", clf.score(X_test, y_test))
```
在上面的代码中,我们首先创建了一个包含4个样本和2个特征的数据集`X`,以及一个包含4个标签的目标数组`y`。然后我们创建了一个逻辑回归分类器,并使用`KFold`函数创建了一个K折交叉验证对象,将`n_splits`参数设置为2,表示我们将数据集分成2个子集。接下来,我们使用`split`函数来生成训练集和测试集的索引,并使用这些索引来将数据集分成训练集和测试集。最后,我们拟合模型并计算模型的准确性得分。重复这个过程K次,并将结果打印出来。
阅读全文