神经影像分类的多路多级核模型

35 浏览量更新于2023-10-15 收藏 1.09MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

356神经影像分类的多路多级核模型何丽芳1，陆春达2，丁浩3，王申2，沈琳琳1，菲利普S.Yu2，4，Ann B.Ragin51 ShenzhenUniversity，深圳，中国2University of Illinois at Chicago，Chicago，IL，USA3北京邮电大学，中国北京4清华大学，北京，中国5西北大学，芝加哥，IL，美国{lifanghescut，haoding.tourist}@ gmail.com，llshen@szu.edu.cn{clu29，swang224，psyu}@ uic.edu，ann-ragin@northwestern.edu摘要由于突出作为一种诊断工具，用于探测认知的神经相关，神经成像张量数据一直是激烈的调查的焦点。虽然已经提出了许多有监督的张量学习方法，但它们要么不能捕获张量数据的非线性关系，要么不能保留复杂的多路结构信息。本文提出了一种多路多级核（MMK）模型，该模型能够提取出具有区分性、非线性和结构保持性的张量数据表示。具体来说，我们引入了核CP张量因式分解技术，这相当于在一个可能更高维的空间中执行低秩张量因式分解，该空间由核函数隐式定义我们进一步采用多路非线性特征映射来导出对偶结构保留核，其与核机器（例如，SVM）。对真实世界神经图像的大量实验表明，所提出的MMK方法可以有效地提高对各种大脑疾病（即，阿尔茨海默1. 介绍在许多神经系统和神经精神疾病中，脑受累（包括不可逆的脑组织损失和认知功能恶化[14]）对判断和功能有严重影响。对于脑部疾病的诊断和早期异常的检测，近年来已经见证了无创性神经成像技术的密集发展，例如：功能磁性这项工作是在第一作者在芝加哥伊利诺伊大学时完成的。†通讯作者。共振成像（fMRI）和结构扩散张量成像（DTI）。神经成像样本自然是由3D体素组成的三阶张量，并且每个体素包含与脑体积中相应位置发射的信号强度成比例的强度值[4]。由于3D图像通常在高维空间中指定（张量中每个模式的维度呈指数），因此传统的基于向量的方法易于过拟合，特别是对于小样本量问题[5，35]。如何从原始的张量数据中提取出紧凑的、有区别的表示是神经影像分析研究中的一个重要问题。在文献中，已经提出了几种监督张量学习算法。早期可以保留张量结构的方法是基于线性模型[8，9，12，37]，而神经成像数据通常不是线性可分的。最近，已经开发了几种基于张量的核方法[25，28，29，36]。他们中的大多数专注于通过沿着张量数据的每个模式的向量/矩阵展开来学习内核。然而，多路结构信息，如体素的空间排列将在展开过程中丢失。为了捕获张量数据中的潜在模式，张量因式分解方法已被广泛使用[4，17，19]。然而，现有的工作大多集中在无监督的探索性分析或处理基于线性张量的模型。最近， [13] 采用 CAN- DECOMP/PARAFAC（CP）分解来促进核方法在监督张量学习中的使用。虽然CP分解提供了对原始张量数据的良好近似，但它只涉及多线性方程。因此，张量对象中的非线性关系很难被建模。在本文中，我们提出了一种新的多路多级核（MMK）模型来学习判别，非线性，357KX核CP分解K（ X′，Y′）本文的其余部分组织如下。在第二节中，我们简要回顾了核学习和张量因子化的相关工作。我们在第三节介绍了初步的概念。然后，我们在第4节中给出了问题公式并提出了建议的MMK方法。在第5节中，我们报告了实验结果。最后，我们在第6节中结束了本文。2. 相关工作张量因子分解是一种高阶扩展的矩阵因子分解，它引出内在的多路结构并捕获张量数据中的底层模式有图1. MMK概述。给定两个输入张量数据X和Y，MMK首先应用核化CP因子分解来提取非线性表示X′和Y′，通过共享核质量，在分解过程中，每个模式的三个值分别为KX、KY和KZ然后提取的表示是em-嵌入到对偶结构保持核中。用于脑部疾病分类的3D神经成像数据的结构保留表示。图1展示了所提出的MMK模型。与传统方法不同的是，该方法基于核化张量因式分解，能充分捕捉张量数据的多向非线性受Representer's Theo- rem [26]的启发此外，我们采用了多路非线性特征映射，以获得在张量积特征空间的对偶结构保持核。导出的内核与内核机器（例如，、SVM）来解决张量数据分类问题。本文的主要贡献概括如下：• 我们提出了一种新的、系统的分解任意阶张量的方法所提出的KCP能有效地捕捉张量模之间复杂的非线性关系。• 我们介绍了MMK模型，它集成了KCP因子化和张量核方法，用于实际的张量数据分类。• 对三种不同疾病（阿尔茨海默病、ADHD和HIV引起的脑损伤）的神经系统疾病预测的广泛实证研究表明张量因式分解的许多优秀作品[3，4，17，38]两种最常用的因式分解技术是CP和Tucker [17，27，32]。与Tucker相比，CP由于其唯一性和简单性的特性而更常用[12，15，31]。关于张量因式分解的全面调查可以在[17]中找到。然而，实验工作主要是基于多线性分解方案，并且难以建模非线性关系和发现数据中的复杂模式。监督张量学习近年来得到了广泛的研究。例如，[31]提出了一个监督张量学习框架，它通过构建多线性模型将标准线性SVM学习框架扩展到张量模式。在这种学习框架下，开发了几种基于线性张量的模型[2，9，12，18，37]，而如何直接在张量数据上构建非线性模型的问题为了对张量数据应用核建模，已经提出了几项工作[25，28，29，36]然而，这种转换将导致以下两个问题：1）打破原始数据中的自然多路结构和相关性[7，22]; 2）导致维数灾难和小样本量问题[11，35]。如何直接在张量数据上建立核模型的问题还没有得到很好的研究。在这个方向上的最新尝试与[13]中提出的CP分解有关，但它具有与CP分解相同的缺点。3. 预赛在本节中，我们简要介绍张量代数的一些初步知识。对于概念和术语的更深入介绍，我们参考[17]。表1总结了重要的符号，以供参考。3.1. 记法和基本运算为了便于区分，标量用小写字母（a，b，· · ·;α，β，· · ·）表示，向量用粗体小写字母（a，b，· · ·）表示，矩阵用粗体小写字母表示。XX′Φ（X′）公司简介核CP分解ΦYY′Φ（Y′）Φ358Fi=/i=1i=/表1. 重要注释为了获得CP因子（A（1），···，A（N）），目标是最小化以下估计误差：L= minA（1），···， A（N）A（1），···，A（N））（三）然而，L不是联合凸的w.r.t. A（1），···，A（N）. 一种广泛使用的优化技术是交替最小二乘（ALS）算法，其交替地最小化每个变量的L，同时固定另一个变量，即，A（n）←argmin<$X（n）−A（n）（<$NA（i）T-2（四）A（n）在F中（A，B，···），以及由书法字母（A，B，···）表示的张量。其中，nA（i）= A（N）<$···A（n−1）<$A（n+1）···<$A（1）。张量的阶数是维度的数量，也称为模式或方式。一个N阶张量表示为A ∈ RI1 ×I2 ×···×IN，其中In是它的n阶模的基数，n ∈ {1，2，···，N}. 向量a、矩阵A或张量A的元素由ai、ai、j、ai、j、k等表示，这取决于模式的数量外积、Khatri-Rao积和内积表示为：分别为100、100和100·、····给定两个张量X= x（1）<$··<$x（N）和Y=y（1）···y（N），它认为，4. 方法在一个典型的神经成像分类任务中，我们给出了M 个训练样本的集合 {Xi ， yi}M<$X×Y ，其中Xi∈RI1×I2×···×IN是第i个神经成像样本的输入，yi是相应的类标签。神经影像分类的任务是找到一个函数f：X→Y，该函数正确地预测了一个不可见的神经影像样本X ∈RI1×I2×···×IN的标签。在内核学习场景中，这个问题可以用公式表示为以下优化问题：.公司简介X， Y=. x（i），y（i）（一）.f=arg minCΣV（f（Xi），yi）+<$f<$2（五）i=1f∈HMi=1矩阵化或展开是将一个张量转换成矩阵，使得沿着某个模式的所有列被重新排列以形成矩阵[16]。张量X∈RI1×I2×···×IN的模n矩阵化表示为：其中，C用于控制经验风险和正则化项之间的权衡，H是形成希尔伯特空间（假设空间）的一组函数，并且V（·）是规定的损失函数，其测量f有多好地符合X（n）∈RIn×NnIi，可以通过置换得到数据通过使用表示定理[26]，我们经典地X的维数为[In，I1，···，In−1，In+1，···，IN]然后将置换后的张量重塑成一个大小为我公司简介 [38]第一卷。获得：ΣMf（X）=ci κ（Xi，X）（6）ni/=nii=13.2. CP分解CANDECOMP/PARAFAC（CP）分解是一种广泛使用的探索和提取多路数据的底层结构的技术，这对我们提出的方法的发展至关重要。基本上，给定一个N阶张量X∈RI1×I2×···×IN，CP因子化通过N个加载矩阵A（1），···，A（N）来逼近该张量，使得ΣR其中c i是系数，κ（·，·）是正定（再生）核函数，由κ ：X× X → R 定义，其中 κ（Xi ， Xj ）=<$ Φ（Xi），Φ（Xj）<$，其中Φ：X→H是特征映射函数。注意，内核函数成为学习系统的唯一因此，在这种情况下，必须设计一个内核，充分封装预测所需的所有信息。在下文中，我们首先提出了一个核CP分解模型来学习潜在的结构特征。然后我们展示Xa（1）···a（N）=A（1），···，A（N））（2）R rr=1其中，φ·）被定义为CP因子分解操作。对于简写和每个加载矩阵A（n）=[a（n），···，a（n）]，n∈{1，2，···，N}的大小为In×R，并且如何设计一个好的内核，利用提取的la-帐篷结构特征4.1. 核CP分解虽然张量提供了一个自然的表示，1RR被称为张量X的秩[6]，表明因素的数量多路数据，不能保证它会有效，用于内核学习。学习才会成功H符号定义和描述a或αaAA小写字母代表比例黑体字代表矢量黑体字代表矩阵书法字母代表张量⊗表示外积⊙表示Khatri-Rao乘积，表示内积（1）表示CP分解Φ（·）表示特征映射M359XYZri=1i，r Xinrk=1X如果核函数可以识别出数据背后的隐藏信息。从前面对多路数据的分析中，我们注意到张量中包含的基本信息嵌入其多路结构中。因此，基于张量的核学习的一个重要方面是用易于操作的关键结构特征来表示张量，并根据这些特征设计核。根据CP分解的原理，设计了一种既保持了张量对象原有的多路结构，又能提供更紧凑、更有意义的表示的CP分解方法。然而，它只提供了一个很好的近似，算法1核化CP（KCP）分解输入：张量对象X ∈RI×J×K和秩R输出：{A，B，C}1：分配KX、KY、KZ2：使用标准CP因子化计算矩阵{A，B，C}3：集合A ←K−1A4：集合B ←K−1B5：集合C ←K−1C使用等式（8），以下拟合准则成立：（即，代表性的、区别性的和非冗余的）特征。此外，标准的CP分解仅仅是构造的。ΣIg：=argming∈GRJ ΣK（xi，j，k−g（xi，yj，zk））2多线性公式，因此很难捕捉张量对象中的非线性关系。到i=1j=1k=1=最小值<$X −<$KXA， KY B，KZ C）<$2（九）利用核学习的成功，我们在利用张量特征和特定于模式的知识的基础上定制了核化CP（KCP）因子分解。为了简单起见，不失一般性，我们考虑三阶张量X∈RI×J×K。受[1]启发，将X的三向结构看作是分别位于可测空间X、Y、Z中的三个变量x、y、z的函数是有益的。要获得内核版本的给定CP分解X A，B，C），其中十-A、B、C、F其中核矩阵KX=[κX（x1），· · ·，κX（xI）]∈RI×I，KY=[κY（y1），···，κY（yJ）]∈RJ×J，且KZ=[κZ（z1），· · ·，κZ（zK）] ∈RK×K.当量当通过选择 κX （ · ， · ）、 κY （ · ， · ）和 κZ（·，·）作为克罗内克δ函数（即，相应的核矩阵是单位矩阵）。本质上（9）得到所寻求的非线性低秩近似分类元素xi，j，kΣRr=1 ai，rbj，rck，r，我们定义低秩方法g（x，y，z）在方程。（八）、我们参考Eq。（9）作为KCP函数g属于以下族GR：= {g：X×Y×Z→RΣRg（x，y，z）›→ ar（x）br（y）cr（z）r=1S.T. a r（x）∈HX，b r（y）∈HY，c r（z）∈HZ}（7）其中HX、HY和HZ分别是由X、Y和Z中的指定核κX（·，·）、κY（·，·）和κZ（·，·）构造的希尔伯特空间这里，x、y、z可以被视为模式的索引通过递归地使用表示定理，我们有a（x）=Iα κ（x，x），Jb（y）=βκ （y，y），因子分解，矩阵{A，B，C}作为潜在因子ma-与CP法的加载矩阵相区别注意，我们没有核化张量数据X，而是核化潜在因子中的成员关系。此外，很容易将该结果推广到高阶情况。4.2. KCP优化基本上，Eq。（9）具有与等式（9）中的CP因子化相同的结构。（3），所以我们有一个类似的更新规则来求解KCP分解。在这里，我们陈述以下定理来有效地求解Eq。（九）、整体算法总结在算法1中。定理1. 设X ∈RI1×I2×···×IN是一个任意的张量，并假设我们有X的CP分解，X=rj=1j，r Yjc（z）=Kγk，rκ Z（zk，z）.A（1），···，A（N））满足Eq. （3）保持。那么下面的问题解决定义向量κT（x）：=[κX（x1，x），···，κX（xI，x）]，T TminX−（一），···，KNA（N））100 （10）FκY（y）：=[κ Y（y1，y），· · ·，κ Y（y J，y）]和κZ（z）：=[κZ（z1，z），· · ·，κZ（zK，z）]，以及矩阵A∈RI×R：ai，r：=αi，r，B∈RJ×R：bj，r：=βj，r，和C∈RK×R：ck，r：=γk，r，则得出A（1），···，A（N）是A（n）=K−1A（个）（十一）g（x，y，z）=ΣRr=1ΣRar（x）br（y）cr（z）其中n∈ {1，2，···，N}，Kn∈RIn×In是已知正的定矩阵Pr oof. 设A（n）=KnA（n），其中n∈{1，2，···，N}.当应用ALS方法求解Eq. （10）我们有=（κT（x）ar）（κT（y）br）（κT（z）cr）（8）~（n）~（n）N（i）T 2=360X Y Zr=1A ←argminimum X（n）−AA（n）（i/=nA）中国（12）361）））九龙12号Ri/=nKxu1 u2 uRXu111ΦΦ（u 1）Φ（v1Φ（w1）Φ（X）′u222ΦΦ（u2Φ（vKz12RuRRRΦΦ（uR）ΦΦ（wR）多路非线性映射的核CP图2. 多路多级内核建模。其中，A（i）=A（N）···A（n−1）<$A（n+1）···<$A（1）。映射到希尔伯特空间H，由于（12）中的目标函数是严格凸的，因此该问题存在唯一解也就是说，A（n）也是Eq.的解（12）和A（n），A（n）. 更进一步，因为Kn是一个正定矩阵，它的逆存在。因此，我们得出定理1。根据定理1，它证明了Eq.（9）可以通过首先计算X的CP因子化，然后获得加载矩阵上的潜在因子矩阵的解来求解有很多有效的-Φ：X×Y×Z→RHX×HY×HZ（13）其中RHX×HY×HZ是三阶张量希尔伯特空间。基于核函数的导数，它是不确定的。重要的是要注意，Hilbert空间是一个高维空间的原特征空间，配备了相同的操作。因此，我们可以直接在希尔伯特空间中对张量数据进行与原始特征空间相同的因子分解。这相当于考虑以下多路非线性映射：用于求解CP分解的经典算法[17]，便于KCP分解的实现。我们使用[24]的方法（和代码）来计算CPΣRΦ：r=1arbrcr›→ΣRr=1Φ（ar）Φ（br）Φ（cr）（14）基于ALS算法的因式分解，使用线搜索方案来加速收敛。4.3. 多路非线性映射为了将不同数据样本之间的先前已知相似性结合起来，我们使用KCP分解来通过共享每个模式的核矩阵来提取每个输入张量对象的紧凑表示。通过这种方式，构造了有利于分类任务的判别潜在因子矩阵。在下面，我们在这方面，它对应于将潜在张量映射到保留多路结构的高维张量更一般地，它可以被视为将张量数据映射到张量希尔伯特空间中，然后在希尔伯特空间中执行CP因式分解。在将潜在张量映射到希尔伯特空间（本质上也是张量积空间）之后，核就是该空间上张量的标准内积。因此，我们可以导出对偶结构保持核函数如下：说明如何使用这些提取的潜在结构特征来演化用于神经成像分类的合适的核设X，Y ∈RI×J×K的KCP分解为X=<$KXA，KYB，KZC）和Y=<$KXU，KYV，KZW），10 - 12 -2000）;10-2000）;10-2000）;ΣRΣRr=1arbrcr，ΣRΣRr=1（urvrwr）分别潜在因子矩阵是多模态的，每个因子矩阵与一个模态相关联。在一个10 - 20的矩阵中，=0.0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000ΣR362r=1arbrcr），Φ（ r=1urvrwr）ΣR通过外积运算符对时尚进行排序。通过这种方式，我们将带来不同的潜在因素矩阵，=r=1Φ（ar）<$Φ（br）<$Φ（cr），r=1Φ（ur）Φ（vr）Φ（wr）模式到一个张量，不仅带来自己的解释，而且还包括多路功能。我们R=κ（ai，uj）κ（bi，vj）κ（ci，wj）（15）定义X和Y的潜张量为X′=<$A，B，C）和Y′=<$U，V，W），它们的大小与X和Y相同。受双重结构保留克尔的成功启发nel（DuSK）方法[13]，我们假设潜在张量是i=1j=1通过对它的推导，我们看到这样的核函数可以考虑张量柔度中的多路结构。一般来说，这个内核是一个扩展363将向量空间中的常规核函数中的一个或多个应用到张量空间，并且每个向量核函数可以在该框架中应用于与核机器结合的张量分类（例如，SVM）。不同的核函数指定不同的假设空间，甚至是数据的不同特别地，它可以被认为是在l次连续应用非线性映射Φ（·）之后计算内积：（一）2-模式（b）κl（x，y）=κΦ（Φ（···Φ（x），Φ（Φ（··· Φ（y）κ（16）`x` x图3.（a）从四个角度对功能磁共振成像图像进行可视化，（b）l次l次功能磁共振成像图像的三阶张量图示。直观地，如果的基地内核功能 κ（x，y）=Φ（x），Φ（y）模拟了单层网络中的计算（16）应该模拟多级网络中的计算。最后，通过将所有内容放在一起，我们获得了多路多级内核（MMK）建模的通用版本，如图1和图2所示。与DuSK方法[13]相似，DuSK方法[13]通过在低秩近似上使用单级内核（即，加载矩阵），所提出的方法不仅在张量样本之间而且在张量样本本身内对非线性和结构信息进行建模，这是通过对潜在结构特征（即，潜在因子矩阵）。5. 实验和结果为了经验性地评估所提出的MMK方法在解决神经成像分类的有效性，我们进行了广泛的实验，在三个现实生活中的神经成像（fMRI）数据集，并与8个现有的国家的最先进的在下文中，我们介绍了我们分析中使用的数据集，并描述了实验设置。然后，我们提出的实验结果以及分析。5.1. 数据采集和预处理我们考虑三个静息态fMRI数据集如下：• 阿尔茨海默我们下载了所有33个记录的静息态fMRI图像，并应用SPM 82进行预处理数据。对于每个个体，前十个体积被移除，功能图像被重新对齐到第一个体积，切片定时被校正，并且空间平滑1http://adni.loni.usc.edu/2http://www.l.ion.ucl.ac.uk/spm/software/spm8/具有8mm FWHM高斯核，并归一化到MNI模板。然后，我们采用REST 3来执行时间带通滤波（0。01-0 08Hz），去除时间序列的线性趋势。在此之后，我们在时域上对每个个体进行平均，得到33个大小为61×73×61的样本。我们将AD+MCI作为阴性组，正常脑作为阳性组。最后，在[13]之后，我们将每个个体缩放到[0，1]。请注意，标准化对于群体分析非常重要，因为每个人的大脑都是不同的。• 人类免疫缺陷病毒感染（HIV）：该数据集收集自西北大学的芝加哥早期HIV感染研究[33]，其中包含83张早期HIV感染患者（阴性）和正常对照（阳性）的fMRI脑图像。我们使用了与ADNI数据集相同的预处理步骤，得到了 83个大小为61×73×61的样本。• 注意缺陷多动障碍（ADHD）：该数据集收集自ADHD-200全球竞赛数据集4，其中包含200名受试者的静息状态fMRI图像，包括ADHD患者（阴性）或正常对照（阳性）。我们在时域上对每个个体进行平均，得到大小为58×49×47的200个样本。5.2. 基线和指标我们考虑高斯RBF核和SVM 分类器作为我们的MMK方法的组成部分进行比较，并使用以下八种方法作为基线。• SVM：首先，我们实现了一个朴素的基线，基于高斯RBF核的SVM，这是最广泛使用的基于向量的分类方法。在下面的方法中，如果没有明确说明，我们使用具有高斯RBF核的SVM作为分类器3http://resting-fmri.sourceforge.net4http://neurobureau.projects.nitrc.org/ADHD200/单模态364表2.比较方法的总结C是折衷参数，σ是核宽度参数，R是张量因子分解的秩方法SVM/SVM+PCA[25]第二十五话sKL[36][28]第二十八话Dusk[13]STTK[23]3D CNN[10]MMK数据后处理相关性的开发内核探索单向矢量单级单向矢量单级矩阵单向单级矩阵单向单级3D张量多路单级4D张量多路单级3D张量多路多层次3D张量多路多层次参数C，σC，σC，σC，σC、σ、RC，σ，R，ERt许多 *C、σ、R• SVM+PCA：我们还实现了一种基于向量的子空间学习算法，该算法首先使用主成分分析（PCA）来降低输入维数，然后输入SVM模型。该方法通常用于处理高维分类，特别是fMRI分类[30，34]。• K 3rd：它是一种基于矢量展开的张量核方法，旨在利用沿每个模式的输入张量来捕获结构信息，并已用于与高斯RBF核一起分析fMRI数据[25]。• sKL：这是一种基于对称Kullback-Leibler发散定义的基于矩阵展开的张量核方法，已用于重建3D运动[36]。• FK：它也是一个基于矩阵展开的张量ker-nel方法，但基于多线性奇异值分解（MLSVD）定义。构成核来自高斯RBF核类[28]。• DuSK：它是基于CP因子分解的最新张量核方法，已用于与高斯RBF核一起分析fMRI数据[13]。• STTK：它是用于全脑fMRI分类的DuSK方法的变体，将fMRI数据视为在不同条件/会话下观察到的4D时空对象[23]。• 3D CNN：它是一个3D卷积神经网络，从2D版本扩展而来[10]，使用卷积核。卷积核是从数据中学习的三次滤波器，其具有小的感受野，但延伸到输入体积的整个深度表2总结了比较的方法。我们进行了5重交叉验证，并使用分类准确度作为评估指标。对所有方法重复该过程50次，并将平均值报告为结果。我们使用LibSVM作为SVM工具。采用网格搜索法确定了各方法的最佳参数。最佳折衷参数选自C∈{2−8，2−7，· · ·，28}，核宽度参数选自σ∈{2−8，2−7，· · ·，28}，最佳秩R选自{1，2，· · ·，10}。参数ERt表3.分类准确度比较（平均值±标准差）ADNI艾滋病毒ADHDSVM0的情况。49± 0。020的情况。70± 0。010的情况。58± 0。00SVM+PCA0的情况。50± 0。020的情况。73± 0。030的情况。63± 0。01K3路0的情况。55± 0。010的情况。75± 0。020的情况。55± 0。00SKL0的情况。51± 0。030的情况。65± 0。020的情况。50± 0。04FK0的情况。51± 0。020的情况。70± 0。010的情况。50± 0。00黄昏0的情况。75± 0。020的情况。74± 0。000的情况。65± 0。01STTK0的情况。76± 0。020的情况。76± 0。010的情况。68± 0。013DCNN0的情况。52± 0。030的情况。75± 0。020的情况。68± 0。02MMK0的情况。81± 0。010的情况。79± 0。010的情况。70± 0。01for STTK默认设置为0。二、3D CNN的最佳参数，即、感受野（R）、零填充（P）、输入体积尺寸（宽×高×深，或W×H×D）和步幅（S）按照[10]进行调整。协方差核矩阵KX，KY，KZ假定已知.5.3. 分类性能表3显示了不同方法在三个数据集上的平均分类精度和标准差，其中最佳结果以粗体突出显示根据比较结果，我们有以下观察结果。首先，每种方法在不同数据集上的分类精度可能有很大差异。然而，所提出的MMK方法在所有三个数据集上始终优于所有其他方法。这主要是因为MMK可以学习嵌入在张量中的非线性潜在子空间，同时考虑不同数据样本之间的先验知识，而其他方法无法探索张量对象中的非线性关系在ADNI数据集上，MMK算法的性能明显优于其他算法.背后的原因是，这些数据是非常高维的，但样本量很小。在神经成像任务中，分类算法很难在ADNI数据集上达到中等的分类精度。特别是，从结果中可以看出，3D CNN在ADNI数据集上实现了相对较低的准确性，这是因为深度学习方法需要大量的训练数据来训练深度神经网络。由于隐私问题，医学神经成像数据集没有足够的训练数据。然而，通过利用张量的性质，我们能够提高分类性能。此外，它可以是3650.80.80.80.60.60.60.40.40.40.20.20.202 4 6 810秩R(a) ADNI02 4 6 810秩R(b) 艾滋病毒02 4 6 8 10秩R(c) ADHD图4. 测试准确度与三个神经成像数据集上的R。发现MMK总是比DuSK表现得更好，这从经验上表明了高维张量数据中特征提取的有效性，而不是近似。基于这些结果，我们可以得出结论，将张量展开为向量或矩阵会丢失张量数据中的多路结构信息，导致性能下降。而对于高维张量数据分析，张量运算比向量和矩阵运算有效得多实验结果表明，本文提出的方法在fMRI数据分类研究中是有效的，具有一定的优势。5.4. 参数敏感性虽然我们提出的MMK中的参数的最优值是通过网格搜索找到的，但是看到MMK对KCP因子化R的秩的敏感性仍然很重要。为此，在本节中，我们演示了不同R∈ {1，2，· · ·，10}上的灵敏度研究，其中最佳核宽度参数和权衡参数仍然从C∈{2−8，2−7，· · ·，28}，σ∈{2−8，2−7，· · ·，28}。很明显，当R增加时，MMK的效率会降低，因为更高的R值意味着更多的项被包括到内核计算中。因此，我们只展示了三个数据集上不同R的测试准确度如图4所示，秩参数R对检验精度有显著影响，R的最佳值取决于数据。尽管如此，R的最佳值一般位于2≤R≤5的范围内，这可以为预先选择R提供很好的总之，参数敏感性研究表明，MMK的分类性能依赖于参数R，并且很难预先指定R的最佳值。然而，在大多数情况下，R的最优值位于一个小的值范围内，如[12]所示，并且在实际应用中使用网格搜索策略找到它并不耗时。6. 结论与展望本文介绍了一种多路多级核（MMK）方法，并将其应用于神经图像分类。与传统的核学习方法不同从KCP中提取的非线性表示嵌入到对偶结构保持核中，与SVM结合使用来解决神经图像分类问题。对三种不同神经系统疾病预测任务的广泛实证研究表明，所提出的方法优于现有的最先进的方法。在未来，我们将探索机器学习中使用张量因子分解的情况，例如，多源和多任务学习[20，21]，并研究如何应用KCP和MMK方法来提高学习性能。致谢本研究得到了国家自然科学基金 61503253 、61672357和61672313的部分资助，国家自然科学基金IIS-1526499和CNS-1626432的部分资助，国家卫生研究院R 01-MH 080636的部分资助，广东省科学基金2014 A030313556的部分资助。引用[1] J. A.巴泽尔克湾Mateos和G. B.吉安纳基斯非参数低秩张量插补。在SSP，第876-879页[2] B.曹湖，加-地他，X。孔，S. Y. Philip，Z. Hao，和A.B. Ragin基于张量的多视图特征选择及其在脑疾病中的应用。在ICDM，第40-49页[3] B. 曹湖，加-地他，X。魏，M 。Xing，黑顶山P.S. Yu，H.Klumpp，以及A. D.利奥t-bne：基于张量的大脑网络嵌入。在SDM，2017年。精度精度精度366[4] A. 奇奇奇张量分解：大脑数据分析的新概念Journal ofControl Measurement ， and System Integration ， 6（7）：507[5] 戴维斯和我。S.狄伦高维问题的结构化度量学习。在KDD，第195-203页[6] L. De Lathauwer，B. De Moor和J.范德瓦尔在最佳秩-1和秩-（r1，r2，...，rn）高阶张量的近似SIAM Journalon Matrix Analysis and Appli-cations，21（4）：1324[7] X. Geng，K.史密斯-迈尔斯，Z. H. Zhou和L.王.基于缺失值的多线性子空间分析人脸图像建模 IEEETransactions on Systems，Man，and Cybernetics，Part B（Cybernetics），41（3）：881[8] T.郭湖，加-地汉湖，澳-地他，还有X。杨基于遗传算法的线性支撑高阶张量机特征选择与参数优化神经计算，144：408[9] W.郭岛科齐亚和我帕特雷回归的张量学习。IEEETransactions on Image Processing，21（2）：816[10] A.古普塔，M。Ayhan和A.梅达自然的图像库来表示神经成像数据。ICML，第987-994页，2013年[11] X.汉，Y。钟湖，加-地他，S. Y. Philip和L.张某用于神经影像数据分类的无监督分层卷积稀疏在BIH，第156[12] Z.豪湖，澳-地他，B.陈，和X。杨一种用于分类的线性支撑高阶张量机。 IEEE Trans-actions on ImageProcessing，22（7）：2911[13] L. 他，X。孔，S.Y. Philip，A.B. Ragin，Z.浩X.杨Dusk：一个用于监督张量学习的双重结构保持内核，并应用于神经图像。在SDM，2014年。[14] R. Heaton，D. Clifford，D. Franklin，S. 伍兹角阿克F.瓦伊达河Ellis，S. Letendre，T. Marcotte，J. Atkinson等人hiv相关神经认知障碍在强效抗逆转录病毒治疗时代持续存在。神经病学，75（23）：2087[15] A. 朱基岛 Kopr iv a和A. 奇奇奇典范多元分解在蛋白质谱无监督线性特征提取中的应用。在EUSIPCO，第1-5页[16] T. G.科尔达高阶分解的多线性算子。美国的能源部，2006年。[17] T. G. Kolda 和 B. W. 巴德张量分解及其应用。 SIAMreview，51（3）：455[18] I. Kotsia，W.郭和我。帕特雷更高的等级支持视觉识别的十分类机器。Pattern Recognition，45（12）：4192[19] X. Liu，T.郭湖，加-地他，还有X。杨基于低秩近似的半监督分类的直推支持张量机。IEEE图像处理，24（6）：1825[20] C.- T. 卢湖，加-地他，H.Ding，和P.S. Yu. 通过结构因子分解机从多视图结构数据中学习arXiv预印本arXiv：1704.03037，2017。[21] C.- T.卢湖，加-地他，W。绍湾Cao和P.S. Yu.多任务多视角学习的多线性分解机在WSDM，第701-709页[22] H. Lu，K. N. Plataniotis和A. N. Venetsanopoulos。张量对象的多线性主成分分析。IEEE Transactions on NeuralNetworks，19（1）：18[23] G.马湖，加-地他，C.- T.卢，P.S.于湖，加-地Shen和A.B. Ragin全脑功能磁共振成像分类的时空张量分析。在SDM中，第819-827页[24] D. Nion和L.德·拉索尔复值张量分解的一种增强线搜索方案。在DS-CDMA中的应用。Signal Processing，88（3）：749[25] S. W.公园功能磁共振脑成像图像分类的多因素分析--以主题与运动任务为例。电气和计算机工程技术报告，卡内基梅隆大学，2011年。[26] B. Schoül k opf河Herbrich和A. J. 斯莫拉一个广义表示定理。计算学习理论国际会议，第416-426页，2001年[27] W. 绍湖，澳-地他和S。Y. Philip. 基于张量建模和因子分解的多源不完全数据聚类在PAKDD，第485-497页[28] M.西尼奥雷托湖De Lathauwer和J. A.苏肯斯基于核函数的张量数据分析框架。神经网络，24（8）：861[29] M. Signoretto，E.奥利韦蒂湖De Lathauwer和J. A.苏肯斯基于累积量核函数的多通道信号分类。IEEE信号处理学报，60（5）：2304[30] S.宋，Z.詹，Z. Long，J. Zhang，and L.耀结合体素选择的支持向量机方法在fmri数据对象类别分类中的PloSone，6（2）：e17191，2011.[31] D. Tao，X. Li，X.吴，W. Hu和S. J·梅班克监督张量学习。知识与信息系统，13（1）：1[32] S.王湖，加-地赫利湖，加-地Stenneth，P. S. Yu和Z.李利用社交媒体进行全市范围的交通拥堵评估InGIS，page 34，2015.[33] X. Wang，P.福雷河Ochs，J.H. 钟，Y。Wu，T.Parrish和A. B. Ragin人类免疫缺陷病毒感染早期静息状态功能连接异常Brain connectivity，1（3）：207[34] S.- y.谢河，巴西-地郭，N.- F. Li，G. Wang和H.- t.赵基于主成分分析和支持向量机相结合的脑功能磁共振图像处理与分类。在IJCNN，第3384-3389页[35] S. Yan，杨氏D.徐，智-地扬湖，澳-地Zhang，X.Tang和H.-J. 张某人脸识别的多线性判别分析。 IEEETransactions on Image Processing，16（1）：212[36] Q. Zhao，G.Zhou，T.阿达利湖Zhang和A.奇奇奇用于多路数据分析的基于张量的模型的核化：多维结构化数据的处理。IEEE Si

下载后可阅读完整内容，剩余1页未读，立即下载