python心脏病分析代码
时间: 2024-12-18 08:33:18 浏览: 3
Python在心脏病数据分析中可以用于处理大量的医学数据,如心电图、血压记录等,并利用统计学和机器学习算法来进行疾病预测、风险评估和特征工程。以下是一个简单的示例,展示如何使用Python进行基本的心脏病数据预处理和初步分析:
```python
# 导入所需库
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
# 加载数据(假设数据集名为heart.csv)
data = pd.read_csv('heart.csv')
# 数据清洗和探索
data.isnull().sum() # 检查缺失值
data.describe() # 描述性统计
# 特征工程
# 假设"age", "cholesterol", "thalach"是重要的输入变量
features = ['age', 'cholesterol', 'thalach']
X = data[features]
y = data['target'] # 目标变量
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 数据标准化
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
# 使用模型(例如线性回归、决策树或深度学习模型)
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
# 预测和评估
predictions = model.predict(X_test)
accuracy = model.score(X_test, y_test)
#
阅读全文