逻辑回归分析乳腺癌数据python代码
时间: 2024-06-16 18:03:10 浏览: 129
逻辑回归是一种常用的分类算法,适用于二分类问题。在乳腺癌数据分析中,可以使用逻辑回归来预测患者是否患有乳腺癌。下面是一个简单的逻辑回归分析乳腺癌数据的Python代码示例:
```python
# 导入所需的库
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# 读取数据
data = pd.read_csv('breast_cancer_data.csv')
# 划分特征和标签
X = data.drop('diagnosis', axis=1)
y = data['diagnosis']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建逻辑回归模型
model = LogisticRegression()
# 拟合模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)
```
请注意,上述代码仅为示例,实际应用中可能需要进行数据预处理、特征选择等步骤。另外,需要将乳腺癌数据文件(例如`breast_cancer_data.csv`)替换为实际的数据文件路径。
阅读全文