基于眼动数据的机器学习在发展性阅读障碍检测中的诊断优化研究

101 浏览量更新于2023-12-06 收藏 687KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

阵列12（2021）100087基于眼动数据的机器学习在发展性阅读障碍检测中的Peter Raatikainena，Jarkko Hautalab，Otto Lobergc，Tommi Kärkkäinena，Paavo Leppänend，帕沃·涅米宁芬兰于韦斯屈莱大学信息技术学院，邮政信箱35，FI 40014b芬兰于韦斯屈莱大学Niilo Mäki研究所，邮政信箱35，FI 40014c伯恩茅斯大学心理学系，Talbot Campus，Fern Barrow，Poole，BH 12 5BB，United Kingdomd于韦斯屈莱大学教育与心理学系心理学系，邮政信箱35，FI 40014，芬兰A R T I C L E I N F OMSC：68T0568T10保留字：支持向量机随机森林阅读障碍A B S T R A C T阅读障碍是一种常见的神经认知学习障碍，如果不及早发现和治疗，会严重阻碍个人的愿望。在不久的将来，通过嵌入式眼动跟踪技术提供的阅读过程中的眼动自动分析，可以轻松识别阅读障碍，而不是由专家进行昂贵的诊断评估。然而，诊断机器学习方法首先需要优化。然而，以前的机器学习研究在识别有阅读障碍的读者方面非常成功，使用了诊断和良好读者之间表现差异很大的对照组。一个实际的挑战是确定具有边缘技能的个人。在这里，使用机器学习方法来识别阅读流畅性表现较低的个体（低于正态分布的10个百分点），使用他们的阅读眼动记录。随机森林用于选择最重要的眼动特征，以用作支持向量机分类器的输入。这种混合方法能够可靠地识别不流利的读者，它也提供了对所使用的数据的洞察。我们最好的模型达到了89.7%的准确率和84.8%的召回率因此，我们的研究结果建立了自动在自然阅读情况下检测阅读障碍。1. 介绍阅读障碍是一种神经认知学习障碍，其特征是尽管智力正常，但阅读和拼写障碍[1]。它是最常见的学习障碍之一[2]，估计患病率为5%至12% [3，4]。阅读障碍通常会对个人的学业和职业成功[5]，自尊[6]和社会情感发展[7]产生负面影响。研究[6，8，9]表明，越早发现阅读障碍并在教学中给予支持，其负面影响就越能减轻[10]。一种新兴的教育技术是眼睛跟踪，其是测量用户在例如，基于瞳孔运动和眼睛视频上的红外线诱导角膜反射的分析的计算机屏幕。阅读中的两种主要眼动类型是200至300 ms的停留凝视时刻，称为注视[11与典型的阅读者相比，患有阅读障碍的阅读者表现出完全不同的眼球运动[14]，即表现出实质上更多和更长的注视，更短的扫视持续时间，长度，以及更多的向后扫视，即回归，比典型的读者[13眼球运动异常的根本原因被认为是由于人在解码和识别印刷文字方面的困难[14，16]。眼动跟踪的长期承诺是将其与计算方法相结合，以提供个人认知过程的细粒度信息实现这一承诺的一个重要步骤是创建方法来可靠地识别阅读困难的眼球运动。机器学习方法已经成功地应用于从眼球运动中检测阅读障碍，[17- 19 ]和[ 20 ]的结果很有有关综述，请参见[211.1. 相关工作即使儿童阅读障碍的患病率为5%这种直接回避阶级不平衡问题的做法，由Franck Patrick Vidal撰写。∗ 通讯作者。电子邮件地址：paavo.j. jyu.fi（P. Nieminen）。https://doi.org/10.1016/j.array.2021.100087日期：2021年6月4日;接受日期：2021年8月24日在线预订2021年2590-0056/© 2021作者。爱思唯尔公司出版这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表阵列期刊主页：www.elsevier.com/locate/arrayP. Raatikainen等人阵列12（2021）1000872学习算法的性能，阻碍了训练模型到群体水平的推广[24]。例如，在[17]中，对97名参与者（年龄在10-54岁之间）进行了对照试验，其中48名被诊断为诵读困难。评估设置包括由每个参与者用西班牙语阅读12个60个单词。使用支持向量机（SVM）模型，作者获得了80.2%的10倍交叉验证准确率来识别阅读障碍，使用基于试错法的阅读时间，平均注视时间和参与者年龄的选择作为特征。在另一项研究[18]中，共研究了185名瑞典儿童（9- 10岁），其中97名阅读能力较差（单词解码能力第5百分位），88名具有平均或高于平均水平单词解码能力的典型阅读者。毫不奇怪，由于各组之间的阅读技能存在很大差异，并且组大小几乎相等，SVM分类器的10倍交叉验证准确率为95.6%。在分析中使用了一组不同的眼球运动特征，这些特征与渐进和回归扫视长度及其相应的注视持续时间有关。在[19]中，使用基于粒子群优化（PSO）的混合核SVM-PSO方法重新分析了相同的数据集，最终再次获得了95%的分类准确率。在这项研究中，眼动特征转化为主成分。在[20]中，研究了69名希腊儿童（8-12岁），其中32名（46%）被临床诊断为患有阅读障碍。两组之间的阅读技能差异很大，因为对照组的儿童也被临床证实没有阅读问题。在阅读两篇文章期间收集眼动，总计324个单词。使用SVM和LASSO技术进行特征选择，使用扫视长度、短向前移动的数量和多注视单词的数量在高等教育中，[25]报道了一项雄心勃勃的研究，试图将高技能的大学生与低技能的学生在阅读时的眼动中的识字熟练程度区分开来（=61）。有趣的是，这两组学生的整体眼动参数，如平均注视时间或扫视长度没有差异，但识别是基于更微妙的眼动模式相关的阅读理解过程。这些特征是句子或段落特定的前向注视时间，第一遍重读时间，第二遍注视时间和回归路径阅读时间，导致SVM方法的分类准确率为80.3%。最近，发表了两项关于年轻阅读障碍者的大型测试组的研究。在[26]中，对2679名儿童（7-9岁）的评估得出结论，注视时间与阅读速度和准确性的相关性最高。在[27]中报告了一种不利用眼球运动的方法，其中处理了3644名受访者（7-17岁）的在线游戏化测试中的阅读练习，其中包括32个西班牙语语言练习。392名（10.8%）参与者被诊断为阅读障碍。随机森林（RF）分类器具有总共196个特征的丰富集合，其中4个代表人口统计学特征，192个表现特征来自游戏期间的交互，在阅读障碍/无阅读障碍分离中的10倍交叉验证中得分为79.7/79.1%的精确度和80.4/78.4%的召回率。RF模型的分析表明，两个最重要的特点是性别和西班牙语类的一般性能。[28，表3]中关于眼动跟踪技术和应用的新评论总结了SVM作为最常用的技术，卷积神经网络和深度学习技术的日益普及，但仅确定了三项使用随机森林技术的初步研究1.2. 我们的贡献先前关于眼动跟踪和机器学习的研究的有希望的结果在很大程度上依赖于使用临床诊断的诵读困难者的小的、平衡的组与严格不同的非诵读困难者的对照组我们目前的研究扩展了机器学习方法，以确定阅读困难的基础上任意的，虽然相当普遍使用，切断标准的阅读流畅性连续。虽然对检测造成最大的困难，但这种识别任务也具有最大的实际重要性。在大多数临床和教育环境中，诊断是基于类似的一般使用的任意截止评分（例如，在标准化阅读测试中低于10%的表现）在正态分布的技能中[29]。这个问题特别涉及阅读流畅性，这是透明拼写中阅读障碍的标志，其中阅读障碍的特征是缓慢但相当准确的单词阅读[30]。相反，在不透明的拼写中，阅读障碍的特征是大量的单词阅读错误，这是由于口语和书面语言之间的复杂对应关系[31]。重要的是，基于阅读困难正态分布的截止分数决定学生是否有资格接受特殊教育服务[32]。在第2节中，我们描述了我们使用的数据集和机器学习方法。在第3节中，我们给出了我们的计算结果，这些结果将在第4节中进一步讨论。第五节简要总结了本文。方法和结果最初是作为第一作者的硕士论文的一部分创建的在本文中，我们提炼和澄清了论文工作的主要发现2. 材料和方法2.1. eSeek互联网阅读技能数据本研究中使用的数据集是由于韦斯屈莱大学心理学系的eSeek项目收集的。该项目研究了有学习障碍和没有学习障碍的芬兰学生的互联网阅读技能。这些数据是在三年的时间里从165名平均年龄为30岁的年轻人12.5年它包括互联网阅读技能测试的结果，眼动数据，以及对这些数据的部分分析。这些学生是从大约400名学生中挑选出来的。在被选中的学生中， (18%）满足基于选择阅读流畅性表现得分的第10个最差百分位数的阅读障碍的标准。这一标准被用来将学生标记为阅读障碍或典型的阅读者。使用采样频率为1000 Hz的EyeLink 1000眼动仪记录参与者的眼球运动。Dell Precision T5500工作站，配备华硕VG-236显示器（1920 × 1080，120 Hz，52 × 29 cm），观看距离为60 cm用于显示刺激。在实验之前进行设备的校准，并在试验之间重复校准，如果进行了可见的头部运动，在用于跟踪眼睛运动的研究人员的屏幕上检测到漂移[三十四]在实验过程中，参与者完成了一个练习任务，然后10个模拟的信息搜索任务。这些任务包括阅读一个上下文问题，然后选择一个搜索结果（从四个选项中），这将有助于他们回答问题。例其中一个问题是[三十四]眼动数据从向参与者展示的问题页面获得。图1显示了一个问题页面，其中显示了四句话和“继续”按钮。第二句和第三句起着重要的作用;一句包含了这个信息搜索的任务（问题），另一句则是一个带有无关信息的干扰词。这些任务的位置各不相同，即，任务也可以在第三行上，而干扰物在第二行上。第一句和最后一句为任务分配提供了一些背景和叙述。像干扰词一样，这些句子包含的信息与上下文相关，但与任务无关与图1、分心物是第三句。第一句话是第二句话，也就是任务，写着分心句翻译成P. Raatikainen等人阵列12（2021）1000873图1.一、任务期间显示的问题页面示例（芬兰语）。濒临灭绝的大熊猫花时间寻找食物和休息。最后，最后一句话是“与正常的熊相反，大熊猫不冬眠”。为了避免与“任务完成”混淆我们还使用简写符号T1，T2，.. . ，T11指的是这11项试验中的每一项在本研究中使用之前，我们删除了阅读流畅性测试结果不完整或试验记录技术失败的参与者。经过这样的清理，161名学生留在了数据文件中。其中，30个（即，18.6%）被认为有阅读障碍的基础上，他们的阅读流畅性的表现得分是在第10个最低百分位。2.2. 机器学习方法在选择阅读流畅性的任意阈值（本研究中为百分之十）并相应地标记试验之后，我们的目标变成了使用监督机器学习创建二元分类器。虽然存在大量的替代品，但我们找到了使用下面讨论的替代品支持向量机（SVM）[35]对我们来说是一个非常明确的首选，因为它已被用于所有先前基于眼动跟踪的阅读障碍检测工作中，我们在第1.1节中发现并概述了这一点。因此，使用SVM作为基线方法使我们处于与正在开发的其他系统相当的区域。SVM通过选择的非线性映射将其输入向量映射到高维特征空间中，然后找到一个最佳超平面以最大限度地分离类别，从而减少泛化误差[36]。在这项研究中，我们使用了Python模块Scikit-learn [37]中的SVM实现，该模块在内部应用了LIBSVM库[38]随机森林（RF）[39]是一种分类器，包括随机决策树的集合，它们对类别进行联合决策。与SVM一样，RF已在各种任务中取得了良好的效果[40]。我们使用RF的理由很多。首先，我们想将SVM与至少一种其他流行的方法进行比较。我们项目的时间表不允许对每种可用的方法进行全面的比较，所以我们选择了一种最有前途的方法。除了其已证明的实用性外，我们还对基于决策树的方法中嵌入的鲁棒性，泛化能力和内在特征选择机会感兴趣[41，42]。在这项研究中，我们还从Scikit-learnPython模块[37]中选择了RF实现，就像我们对SVM所做的那样2.3. 超参数优化为了生成具有最佳性能的模型，需要适当配置超参数。为了在足够的性能和探索超参数空间所花费的时间之间达成妥协，我们选择在两种方法中使用网格搜索两个有影响的参数，并留下其他参数。Scikit-learn中的默认设置。在这种低维设置中，网格搜索被认为在效率和可靠性方面优于手动搜索[43]。对于这项研究，我们选择使用Scikit-learn的默认内核类型，即径向基函数。对最合适的内核类型的彻底搜索被故意排除在我们当前的范围之外。对于两个超参数C（正则化成本）和gamma（径向基宽度），执行网格搜索对于RF，我们选择了两个我们认为最有影响力的参数。森林中树的数量由n_estimators参数定义。拥有更多的树通常更好，但这也增加了模型的计算时间[41]。拆分时决策树中的节点，用于分割的特征从特征的随机子集选择到此子集由max_features参数确定[41]。RF的其他参数保留为Scikit-learn的默认设置2.4. 交叉验证虽然10倍交叉验证是常见的[44]，但根据使用场景[45]，可以使用其他倍数。我们选择使用5倍，以节省计算时间，并增加每倍中代表性不足的选择不良病例的数量（6而不是3）。后一种效应使折叠方式结果的探测更容易理解，这在本文报告的早期方法开发阶段是有用的。我们在创建褶皱时使用分层子采样2.5. 训练和评估算法算法1用于同时训练和评估模型并搜索最优超参数。我们使用Python和Scikit-learn以及Pandas模块实现了它，用于输入数据处理。源代码可在https://r.jyu.fi/DHV上获得。培训和评估是分周期进行的;每个周期包括：训练模型并获得结果。cycles常量确定整个交叉验证周期的完成次数。 p1和p2是两个被选择用于优化的超参数（SVM的C和gamma;RF的n_estimators和max_features算法1训练和评估交叉验证。对于i = 1，.，周期做forp1，p2 in hyperParametersdo为每个交叉验证折叠创建五个交叉验证折叠do创建分类器用数据存储结果预测计算和存储混淆矩阵首尾相接端根据召回分数对结果模型进行超参数的组合通过性能度量彼此进行比较。在我们的案例中，我们使用阅读障碍者的回忆分数预测。召回率是正确预测样本在所有正类样本中的比例。这被选为本研究中的性能指标，因为它被认为更重要比一般的读者更能正确地发现阅读障碍。除了召回分数，我们还观察了模型的整体准确性。仅仅使用准确性分数是不够的，因为我们的数据中的类是不平衡的。只要将所有测试对象都声明为典型读者，就有可能获得81.4%的准确率。这会给模型的性能一个错误的画面在RF的情况下，该算法还计算在交叉验证折叠中创建的每个模型的特征重要性。我们将在2.7节中回到使用RF的特征选择的主题。P. Raatikainen等人阵列12（2021）1000874图二. 复杂程度不断增加的特点标记为TM的特征集分别包含每个试验的这16 + 8 = 24个特征，因此数据集大小为每161名参与者240个特征。对于特征集TR，我们还重新措辞并重新标记了分类任务，以识别个体试验而不是参与者，因此我们为每1610个个体试验提供24个特征为进行评价，图三. 本研究中使用的转换矩阵示例。2.6. 特征提取这项研究的一个主要部分是探索可能的特征，即，分类器输入，使我们的二进制分类任务的歧视。图2概述了我们的过程中创建的功能集越来越复杂，基于早期的研究（第1.1节），也有一些新设计的想法。图2的左侧介绍了最明显和最简单的特征集，在稍后的结果分析中标记为AVG。AVG集包含在眼睛跟踪记录中观察到的注视和扫视的简单平均值和总和。每161名参与者有4个功能。扫视幅度和扫视持续时间部分地彼此相关，因为幅度越大，扫视持续时间越长在图的中心。在图2中，我们首先计算了表示参与者的注视从一个感兴趣区域（AOI）的过渡的过渡矩阵[11]，即，一句话，另一个。与传统相反，我们在对角线上包括视线在一个AOI。这被认为是相关的，因为阅读障碍者在阅读时有更多的注视。缩写F、T、D和L分别表示第一句、任务、干扰项和最后一句。图3示出了转换矩阵的示例。我们可以看到，参与者的眼睛在第一句话内移动了11次，从第一句话移动到任务1次，第一句话移动到干扰物2次，等等。我们认为，句子之间的转换可以用来区分有困难的读者和典型的读者。原因是阅读障碍者比普通读者更难从四个句子中找到任务句子。这将导致他们在句子之间有一个更不稳定的凝视运动，通过比较转换矩阵，应该可以注意到这种差异。我们的标记为TMA的特征集包含每个感兴趣区域（AOI）内的转移矩阵值（16个特征）的平均值和注视持续时间平均值以及囊振幅平均值，即，每个句子（+8个特征）在所有试验中平均。平均背后的意图是降低特征集的维度，并可能减少噪音。参与者一半的人都这么说图中最右边的特征集。2，标记为TMH，不包括平均值，但5箱直方图的3个值：固定持续时间，扫视持续时间，和扫视幅度。在每10次试验中，分别为每4个句子创建直方图。TM的160个转换矩阵值也包含在TMH中。这使得特征集对于每161个参与者具有5 × 3 × 4 × 10 + 160 =760个特征。通过将整个数据值范围均匀划分为五个相等大小的分区，预先计算bin间隔。每个特征在使用前都被2.7. 特征选择除了第2.6节中描述的特征集之外，我们还通过特征选择创建了一些简化的特征集[46]。其基本思想是使用RF分类器选择最重要的特征，然后将其提供给SVM，以类似于[47]的方式对数据进行分类：我们计算每个折叠，每个循环和每个超参数组合的RF特征重要性。在这些特征重要性中，10个最重要的特征在每次折叠旋转时被保存。一旦找到了具有阅读障碍类的最佳召回值的超参数组合，就将最频繁的特征挑选到它们自己的特征集中，其中，最频繁的特征是所选择的特征的数量��我们尝试了=10、20、30、35和40，以搜索最佳特征集。在结果分析中，我们分别使用标签RFF10、RFF20、RFF30、RFF35和RFF40。3. 结果我们应用了2.5节的方法，对各种分类器和特征集进行了100次循环和5次交叉验证。表1显示了最佳结果的概述。“方法"列指示用于生成模型的机器学习方法。 '' Bal ''标签表示Scikit-learn库SVM的类权重是通过与类频率成反比地调整来平衡的。“Feat "列包含第2.6节和第2.7节The‘‘Accuracy’’ column holds the average fractionP. Raatikainen等人阵列12（2021）1000875TR 86.4% ± 1.8%55.7% ± 6.4%SVM Bal RFF35 89.7% ± 4.0%84.8% ± 14.0%射频RFF 35 86.9% ± 4.6%54.0% ± 20.4%表2使用随机森林选择的特征的SVM结果壮举.准确度召回C��RFF 10 85.7% ± 5.7% 57.5% ±20.6% 8000 0.05RFF 20 86.5% ± 5.0% 61.4% ±20.6% 30 1.0RFF 30 89.9% ± 4.6% 73.8% ±17.5% 30 1.1RFF 35 89.8% ± 4.7% 75.9% ±17.1% 30 1.09RFF 40 89.5% ± 4.7% 74.5% ±17.1% 30 0.9RFF 35 bal 89.7% ± 4.0% 84.8% ±14.0% 1 1见图4。每句话表3结果支持向量机使用功能集除了RFF-SVM。壮举.准确度召回C��平均值85.0% ± 2.1% 42.8% ±18.1% 100000 0.05TMA 80.9% ± 2.8% 46.5% ±19.6% 500 0.09TM 78.2% ± 3.9% 38.5% ±19.3% 1000 0.001TMH 85.0% ± 3.1% 41.6% ±19.5% 200 0.009TR 86.4% ± 1.8% 55.7% ±6.4% 50000 0.1表4使用生成的特征集的RF结果壮举.精度召回maxF估计数AVG80.7% ± 5.5%50.2% ± 19.2%410TMATMTMH83.6% ± 5.0%81.7% ± 5.3%84.5% ± 4.6%41.3% ± 19.2%36.9% ± 20.1%39.9% ± 19.2%18240550302020TRRFF3586.7% ± 1.1%85.4% ± 1.1%36.3% ± 5.1%42.6% ± 19.7%2452020算法周期给出的误差是这些准确度分数的标准差。类似地，支持向量机的最佳结果是通过RFF SVM特征集实现的。这些结果见表2。第一列保存功能集的名称。最后两列包含产生最佳结果的SVM hyperparam- eter值。通过平衡类权重，RFF35模型的召回分数显著提高，准确率略有下降。表3显示了通过使用其余特征集使用SVM获得的结果。TR特征集获得了最佳的准确率和召回率分数随机森林分类器获得的最佳结果显示在表4中。最后两列包含使用网格搜索优化并由每个模型使用的超参数。可以看出，结果不如SVM好。然而，使用RF作为特征选择机制使我们能够使用SVM找到最佳预测4. 讨论分析RFF测试集中获得的最相关的特征使我们能够进行观察，这些观察可能对设计未来的阅读障碍筛查测试感兴趣。图4显示了与每个句子相关的特征的数量，这些特征被选择用于每个折叠旋转的前10个最重要的特征。选择的要素总数为10 × ×��10 × 5 × 100 = 5000。其中，2900个（58%）与任务问题页面上的第一句话有关。这种关系意味着该特征是从第一句话中的凝视活动生成的。其他几句话的效果要小得多。这一发现可能与阅读中语境信息了解上下文有助于图五. 每一次审判的重要性。读者阅读速度更快，因为他们能够预测即将到来的单词[48]。在第一句话中，上下文尚未建立，因此读者必须主要依靠他们的单词识别，解码和句法语言技能，这些技能在阅读障碍中主要受到影响。换句话说，这一发现表明，诵读困难的读者可能会在阅读中相对更多地依赖上下文作为补偿性阅读策略[49]。不同的试验T2-T11似乎是特征重要性的另一个因素。图5呈现了与为顶部10的每个折叠旋转选择的每个试验相关的特征的数量。生成的要素T2数据（即，第一次实际试验）最常发生（32%），表明正确分类两类的重要性很高。对于其余的试验，特征计数保持在相同的范围内，在T6和T9处具有低点。T2的高重要性被推测是参与者尚未建立信息搜索任务的上下文和认知图式的结果。同样，诵读困难者比流利的阅读者更容易不知道文本的上下文。这可以解释T2试验特征在区分两类中的重要性;此时，参与者还没有看到足够的试验来建立问题页面文本的上下文和形式。后来在实验中，语境是建立的，因此更难区分困难读者和典型读者。图 6显示最重要的特征被选取的次数。我们可以看到，与第一句（由“F”表示）有关的特征此外，通过查看特征名称中的直方图箱数，我们还可以看到，在扫视特征的情况下，最频繁的箱是第一个。相应地，对于从固视数据创建的特征，最重要的仓是最后一个。这些观察结果表明，最短的扫视和最长的注视有助于分类。这一结论与文献[13，15]的结果一致我们还可以注意到，从扫视数据中提取的特征比从注视数据中提取的特征更重要，尽管也有相反的模式被报道[26]。过渡矩阵的使用对分类没有很大贡献;在35个最重要的特征中，只有一个特征来自传统的过渡矩阵。该列表中的其他三个特征（T2 F-F，T10 T-T和T3 D-D）是在指定句子中进行的注视表1最佳模特方法用他们准确的技艺。 y和回忆分数。精度召回SVMRFF3589.8% ± 4.7%75.9% ± 17.1%P. Raatikainen等人阵列12（2021）1000876见图6。细粒度特征的重要性。5. 结论在这项研究中，我们开发了一个分类器来识别阅读障碍的读者从眼动数据。重要的是，我们在这里通过阅读流畅度分数中的任意阈值来定义阅读障碍，这是一个现实且实际重要的选择，导致了一个固有的困难分类任务。我们的特征提取增强了传统上使用的过渡矩阵，通过使用AOI和直方图内的凝视模式，而不是固定和扫视措施的普通平均值。使用RF选择的最相关的眼动特征的SVM分类器满足89.7%的准确率和84.8%的召回分数。结果是有希望的，更深入的分析功能的重要性提供了洞察力，可用于指导未来的研究快速和可靠的阅读障碍筛查工具。竞合利益与本文相关的作者没有披露任何潜在的或相关的冲突，可能会被认为与这项工作即将发生冲突。有关完整披露声明，请参阅https://doi.org/10.1016/j.array.2021.100087。致谢这项研究得到了芬兰科学院的支持，资助号为 #274022 ，#311877和#317030。附录A. 补充数据与本文相关的补充材料可以在网上找到上https://doi.org/10.1016/j.array.2021.100087。引用[1]弗雷泽M，编辑。阅读障碍：前景，挑战和治疗方案。新星科学出版公司; 2016年。[2]联合技术报告-学习障碍、阅读障碍和视力。儿科2011;儿科2010。[3]Shaywitz诵读困难症新英格兰医学杂志1998;338（5）：307-12。[4]Katusic SK，Colligan RC，Barbaresi WJ，Schaid DJ，Jacobsen SJ. 1976-1982年明尼苏达州罗切斯特市基于人群的出生队列中阅读障碍的发生率在：梅奥诊所程序，卷。76，Elsevier; 2001，p.1081-92.[5]Morris D，Turnbull P.阅读障碍对英国注册护士职业发展影响的调查探索。《护士管理杂志》2007;15（1）：97[6] GlazardJ.阅读障碍对学生自尊的影响。支持学习。2010;25（2）：63-9.[7]温德姆一项对挪威儿童阅读障碍成年人的13年随访研究：阅读发展和教育水平阅读障碍2009;15（4）：291-303。[8] SnowlingMJ，Hulme C.儿童语言和识字干预措施困难IntJ Lang Commun Disord 2012;47（1）：27-34.[9]Torgesen JK.阅读早期干预的个体差异- 治疗抵抗者的挥之不去的问题。学习.禁用。保留操作2000;15（1）：55-64.[10] Vellutino FR，Fletcher JM，Snowling MJ，Scanlon DM.特殊阅读障碍（阅读障碍）：我们在过去四十年中学到了什么？ J. 儿童心理学精神病学2004;45（1）：2[11] [10]张晓刚，王晓刚. 眼动追踪：方法和措施的综合指南。牛津大学出版社，2011年。[12] 杨文忠，杨文忠，杨文忠.眼动和阅读的差异有阅读障碍的孩子和正常的孩子。Vis Res 1994;34（10）：1345[13] Deans P，O'Laughlin L，Brubaker B，Gay N，Krug D.眼动追踪在注意缺陷多动障碍和阅读障碍鉴别诊断中的应用Psychology2010;1（04）：238.[14] 雷纳湾阅读和信息处理中的眼动：20年research. Psychol Bull1998;124（3）：372.[15] De Luca M ， Borrelli M ， Judica A ， Spinelli D ， Zoccolotti P. Reading wordsandpseudowords：An eye movement study of developmental dyslexia.布莱恩·朗2002;80（3）：617-26.[16] HyönäJ，Olson RK.阅读障碍者和正常阅读者的眼注视模式：单词长度和词频的影响。 J Exp Psychol：学习记忆认知1995;21（6）：1430.[17] Rello L，Ballesteros M.使用机器学习和眼动跟踪措施检测阅读障碍。第12届Webfor All会议论文集 W4A'15，ACM; 2015，16：1-16：8.[18] 杨志华，陈志华.阅读过程中使用眼动追踪筛查阅读障碍。PLOSONE2016;11（12）：e0165508。[19] Jothi Prabha A，Bhargavi R.使用机器学习从眼球运动预测阅读障碍。IETEJ.Res. 2019;1-10.[20] 2005年10月27日，李文龙，李文龙，李文龙，李文龙. DysLexML：阅读障碍筛查工具，机器学习 2019年，arXiv预印本arXiv：1903.06274。[21] 张文辉，王文辉.现代计算技术在阅读障碍检测中的作用。信息科学与应用（ICISA）2016 Springer; 2016，p. 1465-75年。[22] 纳贾尔·贡杜兹通过机器学习算法分析阅读过程中的眼动：一篇综述论文。在：2018 IEEE Symposium Series on Computational情报（SSCI）。 2018，p. 1069-75[23] Prabha AJ，Bhargavi R.使用机器学习预测阅读障碍-研究旅行见闻。第三届微电子、计算和通信系统国际会议论文集。Springer; 2019，p. 23比34[24] Her H，Garcia EA. 从不平衡的数据中学习。 IEEE传输知识数据工程2009;21（9）：1263-84.[25] Lou Y，Liu Y，Kaakinen JK，Li X. 使用支持向量机器到识别识字技能：来自眼球运动的证据。Behav Res Methods2017;49（3）：887-95.[26] 斯特兰德伯格河瑞典学龄儿童阅读时的眼动和阅读评估：阅读困难的新窗口。In：Proceedings ofthe第11届眼动追踪研究应用会议2019年，p.一比三[27] [10]李国伟，李国伟. 用在线游戏化测试预测阅读障碍的风险。Plos One2020;15（12）：e0241687.[28] Klaib AF，Alssin NO，Melhem WY，Bashtawi HO，Magableh AA.眼动追踪算法、技术、工具和应用，重点关注机器学习和物联网技术。专家系统应用2021;166：114037，（待出版）。[29] 范卑尔根·德容，PF.诊断阅读障碍的问题。In：Segers E，van denBroek P，editors.书面语言和读写能力的发展前景。2017年，p. 349比61[30] 作者：WimmerH，Schurz M.阅读障碍在正规正字法中的表现及治疗因果关系阅读障碍2010;16（4）：283-99。[31] 陈晓，王晓，陈晓，等 .基础识字收购欧洲正字法。 BrJ Psychol2003;94（2）：143-74.[32] Weber MC. IDEA资格混乱。 Buff. L. Rev. 2009;57：83.[33] Raatikainen P.从眼动数据自动检测发育性阅读障碍。于韦斯屈莱大学;2019年。[34] HautalaJ，Kiili C，Kammerer Y，Loberg O，Hokkanen S，莱佩嫩博士六年级学生阅读网路搜寻结果时的评价策略眼动追踪研究行为举止。告知。 Technol. 2018;1-13.[35] CortesC，Vapnik V.支持向量网络。Mach Learn 1995;20（3）：273[36] 瓦普尼克统计学习理论概述。IEEE Trans Neural Netw1999;10（5）：988-99.P. Raatikainen等人阵列12（2021）1000877[37] Pedregosa F，Varoquaux G，Gramfort A，Michel V，Thirion B，Grisel O，Blondel M ， Prettenhofer P ， Weiss R ， Dubsovic V ， et al. Scikit-learn ：Machine learning inPython. JMach Learn Res 2011;12（Oct）：2825[38] Chang C-C ， Lin C-J. LIBSVM ： a library for support vector machines. ACMTransIntell Syst Technol（TIST）2011;2（3）：27.[39] 布雷曼湖随机森林Mach Learn 2001;45（1）：5[40] 作者：A，A，M.使用随机森林挖掘数据：新测试的调查和结果。PatternRecognit 2011;44（2）：330[41] 卢普湾理解随机森林：从理论到实践。2014年，arXiv预印本arXiv：1407.7502。[42] Cutler A，Cutler DR，Stevens JR.随机森林在：Encourage Machine Learning.Springer; 2012，p. 157比75[43] 作者：J.随机搜索超参数优化。J MachLearn Res 2012;13（Feb）：281-305.[44] A study of cross-validation and bootstrap for accuracy estimationand modelselection.在：Ijcai。14，Montreal，Canada; 1995，p. 1137-45[45] Marcot BG，Hanea AM.在离散贝叶斯网络分析中，k折交叉验证中k的最佳值是多少？2020年的统计数据[46] Guyon I ， Elisseeff A. 介绍变量和特征选择。 J MachLearn Res 2003;3（Mar）：1157-82.[47] YangJ，Yao D，Zhan X，Zhan X.基于随机森林和支持向量机特征选择的疾病风险预测。在：生物信息学研究和应用国际研讨会。Springer; 2014，p.1比11[48] 刘晓波，刘晓波，刘晓波 .论快读者和慢读者的前向推理。眼动研究。 SciRep2015;5.[49] K国，Snowling MJ。上下文促进的个体差异：来自阅读障碍和阅读理解障碍的证据。儿童发展。1998;69（4）：996-1011.

下载后可阅读完整内容，剩余1页未读，立即下载