乳腺癌数据集随机森林
时间: 2023-10-16 18:05:38 浏览: 84
乳腺癌数据集是一个常用的机器学习数据集,用于预测乳腺癌的发生与否。随机森林是一种强大的机器学习算法,常用于分类和回归问题。可以使用随机森林算法对乳腺癌数据集进行建模和预测。
下面是使用Python中的scikit-learn库进行乳腺癌数据集的随机森林分类的简单示例代码:
```python
# 导入必要的库和数据集
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
# 加载乳腺癌数据集
data = load_breast_cancer()
X = data.data
y = data.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建随机森林分类器模型
rf_model = RandomForestClassifier()
# 拟合模型
rf_model.fit(X_train, y_train)
# 预测测试集
y_pred = rf_model.predict(X_test)
# 输出预测结果
print(y_pred)
```
以上示例代码使用了scikit-learn库中的RandomForestClassifier类来创建随机森林分类器模型,并使用乳腺癌数据集进行训练和测试。你可以根据自己的需求对代码进行修改和优化,以得到更好的结果。