请给出机器学习代码:肿瘤分类与预测
时间: 2023-12-29 13:04:48 浏览: 34
这里提供一个Python代码示例,使用机器学习算法对肿瘤进行分类和预测。这个示例使用了一个著名的机器学习库scikit-learn,用于进行数据预处理、模型训练和测试等操作。
```
# 导入所需的库
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv('breast_cancer.csv')
# 数据预处理
X = data.iloc[:, 2:].values
y = data.iloc[:, 1].values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=0)
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
# 模型训练和测试
lr = LogisticRegression(random_state=0)
lr.fit(X_train, y_train)
y_pred_lr = lr.predict(X_test)
print("Logistic Regression accuracy:", accuracy_score(y_test, y_pred_lr))
dt = DecisionTreeClassifier(random_state=0)
dt.fit(X_train, y_train)
y_pred_dt = dt.predict(X_test)
print("Decision Tree accuracy:", accuracy_score(y_test, y_pred_dt))
rf = RandomForestClassifier(random_state=0)
rf.fit(X_train, y_train)
y_pred_rf = rf.predict(X_test)
print("Random Forest accuracy:", accuracy_score(y_test, y_pred_rf))
```
这个示例代码针对的是一个名为"breast_cancer.csv"的数据集,里面包含了肿瘤患者的一些生理特征和诊断结果。代码首先对数据进行了预处理,将特征进行了标准化处理,然后使用三种不同的机器学习算法进行训练和测试,分别是逻辑回归、决策树和随机森林。最终输出了三种算法的准确率进行比较。