利用sklearn库中的逻辑回归算法logisticregression()对乳腺癌数据集load-barest-cancer()进行建模
时间: 2024-11-20 14:35:45 浏览: 34
在Python的Scikit-learn库中,逻辑回归是一种常用的二分类模型,用于预测离散结果。首先,你需要导入必要的库并加载乳腺癌数据集:
```python
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# 加载乳腺癌数据
data = load_breast_cancer()
X = data.data # 特征矩阵
y = data.target # 目标变量(0 或 1)
# 将数据分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建逻辑回归对象
logreg = LogisticRegression()
# 训练模型
logreg.fit(X_train, y_train)
# 预测测试集
y_pred = logreg.predict(X_test)
# 评估模型性能
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")
# 如果需要,你可以进一步调整参数或查看其他评价指标
```
在这个例子中,我们首先划分了数据集,然后用训练数据训练了一个逻辑回归模型。通过`predict()`函数对测试集进行预测,并使用`accuracy_score()`计算预测准确率。
阅读全文