uci甲状腺疾病逻辑回归模型
时间: 2023-06-12 07:03:15 浏览: 72
UCI甲状腺疾病数据集是一个二分类问题,其中包含了甲状腺疾病和健康人群的数据。逻辑回归是一种常用的二分类模型,可以用于解决此类问题。
以下是一个简单的逻辑回归模型的代码示例:
```python
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取数据
data = pd.read_csv('thyroid.csv')
# 数据预处理
data = data.drop(['TSH_measured', 'T3_measured', 'TT4_measured', 'T4U_measured', 'FTI_measured'], axis=1)
data = data.dropna()
X = data.drop(['Class'], axis=1)
y = data['Class']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 定义模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测
y_pred = model.predict(X_test)
# 评估模型准确率
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
在上面的代码中,我们使用了Pandas库和Scikit-learn库来读取和处理数据,划分训练集和测试集,定义逻辑回归模型,训练模型,预测结果并评估模型准确率。
需要注意的是,在数据预处理部分,我们删除了一些缺失值较多的特征。同时,我们可以根据实际问题调整模型参数,或者使用其他机器学习算法来进行建模。