图二
.
用于提供临床数据库数据的程序界面。
向量机(
SVM
)、决策树(
DT
)、人工神经网络(
ANN
)和朴素
贝叶斯。选择这些模型是因为它们是最先进的分类方法,预计会得
到有希望的结果。最后,记录开发的模型并在新数据上进行测试,
并使用受试者工作特征(
ROC
)分析进行性能评估
[41]
。此外,除
了准确度值之外,还使用分类错误、
AUC
、精确度、召回率和
F
分数
度量来验证每个模型
3.1.
数据集
本研究中使用的数据是从Düzce大学研究和应用医院获得的实际患者
数据,
图三
.
目前工作的流程图。
医院伦理委员会的使命。根据土耳其保护个人数据的法律,必须告知
道德委员会我们希望使用的数据类型因此,我们咨询了一位经验丰富
的医学专家,并确定了她用于诊断贫血类型的属性。数据集中使用的
所有属性如表
2
所示。
除了表
2
中所示的属性之外,原始数据集中还有其他属性,这些属
性使我们能够组织数据。档案编号是用于在医院记录中识别患者的唯
一属性从病人的入院号其他信息包括未作为本研究属性纳入的患者病
史我们的数据只包含
30
个属性。如上所述,其中四个没有使用。诸
如患者年龄、性别、症状和慢性疾病的存在等信息血液分析中的胆红
素值用于评估肝脏和胆囊功能。
C
反应蛋白(
CRP
)提供有关体内炎
症存在的信息血液中的铁值用于评估所有类型的贫血、缺铁和铁中
毒。铁蛋白值用于诊断缺铁性贫血、慢性病贫血和地中海贫血,对于
监测铁负荷治疗也很重要叶酸是指血液中的叶酸值,用于评估巨幼细
胞和肉眼可见的贫血,以及用于监测叶酸缺乏性贫血的治疗。血细胞
比容(
HCT
)显示血液中存在血红蛋白(
HGB
)显示血液中存在的
血红蛋白总量,是全血细胞计数参数研究中指示贫血的第一个值。血
液中的肌酐值用于评价肾功能。平均细胞血红蛋白(
MCH
)显示红
细胞中血红蛋白的总量。平均细胞血红蛋白浓度(
MCHC
)是红细
胞中血红蛋白浓度的百分比。平均红细胞体积(
MCV
)是携带氧气
的红细胞的平均大小。
NEUT
是血液中中性粒细胞的数量,
PLT
是
血小板的数量,其功能是使血液凝结。红细胞计数(
RBC
)是血液
中存在的红细胞数量,红细胞分布宽度(
RDW
)显示血液中红细胞
的分布宽度。总铁结合力(
TIBC
)和游离铁结合力(
UIBC
)也是
诊断贫血类型的重要参数。维生素
B12
是造血和正常神经功能的必需
维生素。在低维生素
B12
的情况下,可以考虑维生素
B12
缺乏白细胞
计数(
WBC
)是血液中白细胞这些作为身体
数据集中有1663个数据项的分布
根据诊断的这些数据在表
3
中给出。贫血相关疾病的分布是不规则和不
平衡的。在我们的数据集中有
1109
名女性和
554
名男性患者。众所周
知,妇女贫血的发病率很高,这些数据证实了这一情况。缺铁性贫血
占数据集的
21%
,是该地区最常见的贫血类型,而最不常见的是地中
海贫血。然而,应记住,为了获得这些数据用于我们的研究,
ICD
代
码限于
D50
和
D64.9
之间,属性限于
30
个不同的特征。因此,诊断贫
血相关疾病所需的属性是根据经验丰富的医学专家的建议选择的。
专家。
本研究在土耳其黑海西部地区的
Düzce
省进行这里列出的贫血类
型是
12
个最