基于logistic回归模型对心脏病数据集进行建模的代码
时间: 2023-07-28 07:02:53 浏览: 117
下面是基于Logistic回归模型对心脏病数据集进行建模的代码示例:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# 读取心脏病数据集
heart_data = pd.read_csv('heart_data.csv')
# 提取特征和标签
X = heart_data.drop('target', axis=1)
y = heart_data['target']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练Logistic回归模型
model = LogisticRegression()
model.fit(X_train, y_train)
# 在训练集上进行预测
train_predictions = model.predict(X_train)
train_accuracy = accuracy_score(y_train, train_predictions)
print("训练集的准确率:", train_accuracy)
# 在测试集上进行预测
test_predictions = model.predict(X_test)
test_accuracy = accuracy_score(y_test, test_predictions)
print("测试集的准确率:", test_accuracy)
```
以上代码中,首先我们使用`pandas`库读取心脏病数据集。然后我们提取特征和标签,其中特征`X`是除去目标列`target`以外的其它列,标签`y`是目标列`target`。
接下来,我们使用`train_test_split`函数将数据集划分为训练集和测试集,其中`test_size`表示测试集的比例,`random_state`用于设置随机种子以确保划分的一致性。
然后,我们创建一个Logistic回归模型对象,并使用训练集上的数据来训练模型。
最后,我们可以使用模型来对训练集和测试集进行预测,并计算准确率,其中准确率通过使用`accuracy_score`函数计算。
以上就是基于Logistic回归模型对心脏病数据集进行建模的代码示例。
阅读全文