或无关的信息。在预特征约简过程中,对原始特征进行特征约简,得到
变换后的特征。减少的变换特征被传递到分类(Das等人,2020; Sahoo
等人,2020年,用于预测疾病。这个过程的主要缺点是由于丢失了一些
完整的变换特征而丢失了一些信息。在预处理阶段被丢弃的特征可能包
含一些重要信息。在模型中处理之前直接丢弃这些变换的特征,这可能
导致信息丢失。然而,在这方面, 在后特征约简过程中,不是丢弃完
全变换的特征,而是允 许所有变换的特征参与模 糊化过程(Mrs.和
Mitra,1992)。该模糊化过程将为每个输入特征产生重要或不重要的
模糊化变换特征。有效的模糊变换特征在医学决策过程中起着关键作
用。然而,不重要的模糊化变换特征仅包含不相关或冗余的模糊化变换
特征。因此,有必要丢弃这些不重要的模糊化变换特征,而不是完整的
变换特征,并且在决策过程中允许所有重要的模糊化变换特征。在神经
模糊(NF)模型的类相似性模糊化过程中(Ghosh等人,2009),它
在决策过程(用于分类)中考虑重要和不重要的模糊化变换特征。对模
型贡献不大的模糊化变换特征应该被丢弃,以减少模型的计算时间。
本研究的动机是,大多数传统
模型在任何分类模型的预处理阶段使用特征缩减技术,这有助于减
少冗余或不相关的特征。在这些传统的模型中,首先使用特征约简
来过滤掉重要特征,然后将这些重要特征传递到模型进行分类。这
种传统的模型的主要缺陷是丢失了完整的特征,这可能会丢失一些
信息,从而影响分类模型的性能。为了克服这个问题,应该设计一
个模型来丢弃一些模糊化的变换特征,而不是完全丢弃特征。这项
研究的目的是,一个弱的功能可能有一些显着的,以及不显着的模
糊化转换功能。将模糊化的不重要的变换特征丢弃,而不是完整的
特征。为了解决上述问题,在
NF
模型的模糊化过程(后特征约简)
之后,将特征约简算法进行在该模型中,在
NF
模型的模糊化过程之
后应用特征约简算法以减少模糊化变换特征的数量。该模型允许所
有输入特征参与模糊化过程。该模糊化过程基于类别标签将每个输
入特征扩展为其它增加了模型的复杂性,需要更多的时间来训练模
型。为了克服这一缺点,特征约简算法被用来只选择相关的模糊化
变换的
fea-tures
是显着贡献的模型。它还消除了那些模糊化的转换
功能,是不相关的和冗余的性质,以产生减少模糊化的功能。这种
减少的模糊化特征再次被传递到基于神经网络(
NN
)的疾病分类模
型主要的观察结果是,运行所提出的
NF-FR
模型所需的总时间减
少,并且通过使用特征约简算法大大提高了分类本文的其余部分组
织如下:第
2
介绍了相关的工作,第
3
节介绍了基本概念,如类相似
性模糊化过程、特征约简过程
采用LDA、ANN-BP分类过程、问题陈述和本文提出的模型,第4节介
绍了所研究和提出的模型的实验设置和结果分析,第5节描述了所有分
类模型的统计分析,最后第6节总结了本文的工作和未来的范围。
2.
相关工作
机器学习(Alpaydin,2009年)是一种基于智能的技术,能够自动
从经验中学习某些类别的问题,并在没有明确编程的情况下提高性能。
它有能力 从数据中自动学习,以检测模式,并在最小的人为干预下做
出决策。近年来,各种机器学习技术的发展,例如预测(Makhoul,
1975)、聚类(Jain等人,1999)和分类(Duda等人,2012年)对决
策过 程有 很 大影 响。 分 类( Das等 人,2015,2018; Sahani等人 ,
2018)是一种监督学习方法,从现实世界的问题中提取知识。它构建了
一个模型,准确地预测目标类从数据到不同的类水平。许多这样的单独
的技术,如模糊逻辑(FL)(Zadeh,1965),神经网络(Haykin,
1994),由于其结构的复杂性和庞大性,在性能上并没有表现得更好。
NN模型的主要挑战是存在不精确和模糊的输入信息,因此在分类过程
的任何阶段都可能出现一些不确定性(Zadeh,1996,1997)。在这方
面,FL是最适合处理不同方面的不完整性或不确定性的现实世界的问
题。 在FL中,每个特征都与成员值相关联,该成员值包含对该类的归
属度。它可以很容易地处理不确定和不精确的信息,其中的数学模型是
太复杂。FL的显著特点是,与其他数学模型相比,它可以有效地工作,
即使是不完整或不精确的数据集。因此,必须将两种单独的技术(FL和
NN)集成以形成称为NF模型的混合系统(Ghosh等人, 2014年)。
NF
模型使用类相似性模糊化过程
(Kazakhstan和Mitra,1999年; Kazakhstan和Ghosh,1996年)来
处理不确定性问题。它具有适应人类感知问题的方式以及学习能力的能
力,并且还成功地应用于若干应用中(Kar等人,2014年)。NF模型
从2000年到2017年的详细发展见(Shihabudheen和Pillaib,2018)。
这种NF模型提供了更好的性能比个别技术,但它增加了计算时间,由
于大量的冗余功能。这些冗余特征可能是由于输入模式的模糊扩展而产
生的。还应注意的是,所有模糊扩展特征可能并不总是对NF模型有显
著贡献(Meher,2017; Meher等人,2017)由于不相关和冗余的功能
(Azar和Hassanien,2015)影响模型的性能。因此,有必要通过使用
特征约简技术来消除这些冗余特征,以提高性能并减少模型的计算时
间。为了解决这个问题,一组特征约简算法,例如PCA(Smith,2002;
Wold等人, 1987; Abdi和Williams, 2010 ) 和 LDA ( Mika 等 人 ,
1999; Tharwat等人,2017)已被用于任何分类模型的预处理阶段。
Chattopadhyay(2017)提出了一种基于某些症状诊断人类抑郁症
的NF模型。该模型在预处理阶段使用主成分分析进行特征约简,只保
留与疾病识别决策过程相关且有意义的特征。Wang和Paliwal(2003)
提出了基于维数的特征提取方法