线性模型对糖尿病风险预测代码
时间: 2023-10-02 12:12:10 浏览: 79
下面是一个简单的使用线性模型(Logistic Regression)预测糖尿病风险的 Python 代码示例:
```
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv('diabetes.csv')
# 划分数据集
X = data.drop(columns=['Outcome'])
y = data['Outcome']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建模型并训练
model = LogisticRegression()
model.fit(X_train, y_train)
# 预测并评估模型
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
其中,`diabetes.csv` 是一个包含糖尿病患者信息的数据集,包含 8 个特征和 1 个二分类标签(0 表示未患病,1 表示患病)。代码首先读取数据集,然后使用 `train_test_split` 将数据集划分为训练集和测试集。接着,使用 `LogisticRegression` 创建模型并在训练集上进行训练。最后,使用测试集进行预测,并使用 `accuracy_score` 评估模型的准确率。
阅读全文