心脏病数据集使用多元回归模型
时间: 2023-09-09 14:08:17 浏览: 131
心脏病数据集是一个常用的多元回归建模数据集,以下是使用Python实现的一个简单的多元回归模型示例:
```python
# 导入必要的库
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
# 读取数据集
heart_data = pd.read_csv("heart.csv")
# 筛选出特征和标签列
X = heart_data.iloc[:, :-1].values
y = heart_data.iloc[:, -1].values
# 将数据集按照7:3的比例分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建线性回归模型
lr = LinearRegression()
# 将训练集数据和标签用于训练线性回归模型
lr.fit(X_train, y_train)
# 使用测试集数据预测结果
y_pred = lr.predict(X_test)
# 计算R平方值
r2 = r2_score(y_test, y_pred)
print("R平方值:{:.2f}".format(r2))
```
在这个示例中,我们使用pandas库读取一个名为"heart.csv"的数据集,然后使用train_test_split函数将数据集按照7:3的比例分为训练集和测试集。接着,我们创建一个LinearRegression对象,使用训练集数据和标签训练线性回归模型,并使用测试集数据预测结果。最后,我们使用r2_score函数计算R平方值(用于评估模型的拟合程度),并将结果打印出来。
需要注意的是,这只是一个简单的多元回归模型示例,如果要得到更好的预测结果,需要进行更多的数据清洗、特征选择和调参等工作。
阅读全文