sklearn库自带的乳腺癌数据集记录有569行数据,对应记录了30个特征,以及乳腺癌分类,部分说明如下表。 请基于乳腺癌数据,编写Python代码完成下列操作。 (1)使用sklearn库加载乳腺癌数据集(breast_cancer)存为cancer,将特征数据存为data,标签数据存为label。(4分) (2)将特征数据和标签数据划分成训练集和测试集,训练集和测试集的样本数比例为8:2,并将训练集数据、测试集数据、训练集标签数据和测试集标签数据分别存为data_train、data_test、label_train和label_test。(4分) (3)导入逻辑回归函数LogisticRegression构建逻辑回归模型,存为lr,并进行模型训练。(5分) (4)对测试集数据进行预测,预测结果存为test_pred,并打印查看结果。(3分) (5)导入numpy库,计算模型预测测试集的准确率,并打印查看结果。(4分)
时间: 2024-03-25 17:35:37 浏览: 61
```python
# (1) 加载乳腺癌数据集
from sklearn.datasets import load_breast_cancer
cancer = load_breast_cancer()
data = cancer.data
label = cancer.target
# (2) 划分训练集和测试集
from sklearn.model_selection import train_test_split
data_train, data_test, label_train, label_test = train_test_split(data, label, test_size=0.2, random_state=42)
# (3) 构建逻辑回归模型并训练
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(data_train, label_train)
# (4) 对测试集数据进行预测
test_pred = lr.predict(data_test)
print(test_pred)
# (5) 计算模型预测测试集的准确率
import numpy as np
accuracy = np.mean(test_pred == label_test)
print("Accuracy:", accuracy)
```
注:以上代码中的random_state用于指定随机数生成器的种子,保证每次运行代码得到的结果一致。
阅读全文