写一段python代码用EasyEnsemble的方法解决样本欠采样
时间: 2024-01-27 17:03:45 浏览: 132
好的,以下是一个使用EasyEnsemble算法进行样本欠采样的Python代码示例:
```python
from imblearn.ensemble import EasyEnsemble
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
# 创建一个不平衡的二分类数据集
X, y = make_classification(n_samples=10000, n_classes=2, weights=[0.9, 0.1], random_state=42)
# 将数据集分成训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 使用EasyEnsemble算法进行欠采样
ee = EasyEnsemble(n_estimators=10, random_state=42)
X_resampled, y_resampled = ee.fit_resample(X_train, y_train)
# 训练决策树分类器
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_resampled, y_resampled)
# 在测试集上进行预测
y_pred = clf.predict(X_test)
# 输出预测结果
print(y_pred)
```
在这个示例中,我们使用了`imblearn.ensemble`库中的`EasyEnsemble`算法来进行欠采样。我们首先创建了一个不平衡的二分类数据集,并将其分成训练集和测试集。然后,我们使用EasyEnsemble算法对训练集进行欠采样,生成了多个子数据集。接着,我们使用这些子数据集来训练决策树分类器,并在测试集上进行了预测。最后,我们输出了预测结果。
阅读全文