乳腺癌数据集分析决策树 用代码举例
时间: 2023-10-31 15:04:11 浏览: 120
以下是一个使用决策树算法对乳腺癌数据集进行分类的Python代码示例:
```python
from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 加载乳腺癌数据集
data = load_breast_cancer()
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.3, random_state=42)
# 初始化决策树分类器
model = DecisionTreeClassifier()
# 训练模型
model.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = model.predict(X_test)
# 计算模型在测试集上的准确率
accuracy = accuracy_score(y_test, y_pred)
print("模型在测试集上的准确率为:", accuracy)
```
这段代码使用了`sklearn`库中的`load_breast_cancer`函数加载乳腺癌数据集,并使用`train_test_split`函数将数据集划分为训练集和测试集。然后使用`DecisionTreeClassifier`类初始化决策树分类器,并使用训练集对模型进行训练。最后,在测试集上进行预测并计算模型在测试集上的准确率。
阅读全文