使用一元线性回归糖尿病预测算法模型
时间: 2023-11-14 22:23:15 浏览: 97
用-SPSS-Modeler-建立线性回归预测模型
5星 · 资源好评率100%
一元线性回归是一种机器学习算法,是用于预测一个变量(因变量)与另外一个变量(自变量)之间的关系的一种方法。在糖尿病预测中,我们可以将血糖(自变量)作为输入,将是否患有糖尿病(因变量)作为输出,来建立一元线性回归模型。
以下是使用Python实现一元线性回归糖尿病预测算法模型的示例代码:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 读取数据
df = pd.read_csv('diabetes.csv')
# 分离自变量和因变量
X = df['Glucose'].values.reshape(-1, 1)
y = df['Outcome'].values.reshape(-1, 1)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 建立模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测测试集结果
y_pred = model.predict(X_test)
# 计算均方根误差
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
print('RMSE:', rmse)
# 绘制预测结果和真实结果的散点图
plt.scatter(X_test, y_test, color='red')
plt.plot(X_test, y_pred, color='blue', linewidth=3)
plt.xlabel('Glucose')
plt.ylabel('Outcome')
plt.show()
```
其中,我们使用了糖尿病数据集(diabetes.csv),该数据集包含了768个样本,每个样本有8个自变量和1个因变量。我们只选择了血糖(Glucose)作为自变量,是否患有糖尿病(Outcome)作为因变量。通过将数据集分为训练集和测试集,我们使用训练集训练模型,使用测试集评估模型的预测性能。最后,我们绘制了预测结果和真实结果的散点图,以直观地展示模型的预测效果。
阅读全文