使用机器学习检测发展性阅读障碍：一项调查

199 浏览量更新于2024-01-07 收藏 583KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

⃝可在www.sciencedirect.com上在线获取ScienceDirectICTExpress 6（2020）181www.elsevier.com/locate/icte使用机器学习技术检测发展性阅读障碍：一项调查沙赫里亚尔·凯萨澳大利亚墨尔本皇家理工大学商业信息技术与物流学院接收日期：2020年2月29日;接收日期：2020年4月19日;接受日期：2020年5月4日可于2020年摘要发展性阅读障碍是一种学习障碍，主要发生在儿童早期。阅读障碍儿童在阅读、拼写和书写单词时面临困难，尽管他们的智力处于平均水平或高于平均水平。因此，有阅读障碍的儿童往往会有消极的感觉，如自卑、沮丧和愤怒。因此，早期发现阅读障碍对从一开始就支持有阅读障碍的儿童非常重要。研究人员提出了一系列检测发展性阅读障碍的技术，包括基于游戏的技术，阅读和写作测试，面部图像捕获和分析，眼动跟踪，磁推理成像（MRI）和脑电图（EEG）扫描。这篇调查论文批判性地分析了使用机器学习技术检测阅读障碍的最新贡献，并确定了未来研究的潜在机会c2020年韩国通信与信息科学研究所（KICS）。出版社：Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。关键词：阅读障碍;机器学习;调查;脑电图内容1.导言. 1812.使用机器学习的1822.1.数据收集1822.2.预处理、特征提取和特征选择1822.3.系统培训和分类1832.4.业绩评价3.未来的方向和结论184竞争利益声明184参考文献1841. 介绍“Dyslexia”这个词起源于希腊语，意思是单词困难。诵读困难是一种特殊的学习困难（SLD），其中一个人尽管具有平均或高于平均水平的智力，但仍难以流畅地阅读、拼写和写作[1]。澳大利亚阅读障碍协会（ADA）[2]指出，估计有10%的澳大利亚人口受到阅读障碍的影响，电子邮件地址：shahriar. rmit.edu.au。同行评审由韩国通信和信息科学研究所（KICS）负责https://doi.org/10.1016/j.icte.2020.05.006在其他英语国家，如加拿大和英国，这一数字上升了20%。诵读困难的儿童经常遭受愤怒，沮丧和低自尊[3]。因此，及早识别和采取适当行动，协助有阅读障碍的儿童克服学习困难，是十分重要的。阅读障碍可以分为发育性或获得性[4]。发展性阅读障碍通常在儿童早期发现，而后天性阅读障碍则是由于脑损伤或中风。研究人员已经提出了几种技术，用于检测发展性阅读障碍，2405-9595/2020韩国通信和信息科学研究所（KICS）。出版社：Els e vierB. V. 这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。南182号Kaisar/ICT Express 6（2020）181技术，心理学家在标准化测试中检查参与者的行为方面，如阅读和写作，语音意识和工作记忆。阅读障碍的个体是根据他们在这些测试中的糟糕分数来识别的。然而，这些技术通常是耗时和无效的一个大组的参与者，因为症状因人而异。因此，研究人员使用机器学习方法，这些方法耗时更少，而且通常价格低廉。在这种情况下，广泛的测试，如如阅读[7-12，14，16参与者的年龄在7至62岁，而不同研究中参与者的母语是西班牙语，希伯来语，瑞典语，普通话，法语，德语，波兰语，马来语，英语，希腊语和荷兰语。然而，这些研究中的大多数都是用特定语言进行的，因此基于游戏的语言独立测试[20]在这方面是一个更好的选择。虽然在[20]中使用了与语言无关的数据收集，但它没有使用任何机器学习算法。一些方法还需要在实验室环境中使用定制工具，例如EEG耳机[15]、定制相机[17]、红外角膜反射系统[9]、MRI扫描仪[10]和眼动仪[8收集脑电图或核磁共振扫描数据。虽然这些方法实现了更高的精度，但它们是昂贵的，只能覆盖一小群用户，可能会导致参与者的行为在观察或测试环境下以不寻常的方式。在这方面，基于计算机的阅读或写作测试，图1.一、使用机器学习技术的阅读障碍检测步骤。各种来源，如阅读/写作测试，基于Web的文字游戏，阅读/写作时的眼动跟踪，MRI和EEG扫描，阅读/写作时的视频和图像捕获。最近，机器学习方法在检测阅读障碍方面变得流行，因为它们提供更高的检测准确性和更好的预测结果。虽然一些调查论文已经解决了阅读障碍检测技术[3，5，6]，但它们的主要焦点不是机器学习方法，并且它们没有涵盖使用机器学习的阅读障碍检测的最新进展。这篇调查论文批判性地反映了使用机器学习方法进行阅读障碍检测的最新进展，并强调了未来研究的范围2. 使用机器学习的使用机器学习技术检测发展性阅读障碍使用四个步骤：（i）数据收集，(ii) 预处理、特征提取和特征选择，(iii) 系统培训和分类;（iv）绩效评估。图 1示出了下面讨论的步骤的示意图。2.1. 数据收集阅读障碍检测的第一步是进行用户研究以收集用户数据。对于传统的阅读障碍检测基于游戏的方法可能更有益。如今，智能移动设备越来越流行，因此基于应用程序的数据收集技术也将有助于获得更广泛的用户群。2.2. 预处理、特征提取和特征选择收集的数据在用于机器学习技术之前需要进行预处理和过滤。第一部分需要将数据转换为定量（数字）或定性（文本类别）格式。为了实现这一点，需要将EEG扫描数据转换为高通和低通滤波器。在这种情况下使用不同的小波变换技术，例如，Frid等人[14]使用离散小波变换。一些研究还使用了手动预处理和特征提取[12，16]，而其他研究则使用了FreeSurfer [11]、PANDA [10]等工具。预处理的目的是识别相关属性并删除空值。在预处理之后，完成特征提取，其中相关特征被识别并被分配一系列值。这些值可以是数值或分类值。不同研究中的特征数量不同，12至226 [8，13]。下一步是确定对确定物体类别更重要的一组主要特征。为了实现这一点，一些研究使用手动选择[14]，而其他研究使用技术，如最小绝对收缩和选择算子（LASSO）[17]表1使用机器学习技术的阅读障碍检测S. Kaisar/ICT Express 6（2020）181-184183和SVM-RFE [9]。LASSO可以同时用于提高精度和可解释性，因为它可以同时执行正则化和变量选择。它们适用于回归模型。另一方面，SVM-RFE根据特征对SVM分类器进行分类的重要性来选择特征.这种技术从一个完整的功能集开始，在连续的迭代中。当特征的数量很高时，适当的特征选择是一项重要任务，计算复杂度。然而，不同的特征选择技术的比较性能分析是在现有的作品。2.3. 系统培训和分类在特征选择之后，使用机器学习算法进行系统训练和分类。数据集分为训练和测试部分。现有文献大多采用10折交叉验证，将数据集分为10等份，其中9份用于训练该算法，而另一组用于测试其性能[8，11，13]，而其他组使用不同的分割（例如，五倍[17]、留一交叉验证（LOOCV）[10，11，18]和70由于训练数据集已经包含类别信息，即，有障碍或无障碍，监督分类算法用于测试目的。现有的研究多采用支持向量机（SVM）、朴素贝叶斯（Naive Bayes）、逻辑回归（Logistic regression）、神经网络、K-近邻（K-NN）和线性判别分析（LDA）等机器学习算法对参与者进行分类。SVM是多项研究中最常用的算法。由于该问题本质上是一个二元分类问题，即，识别有阅读障碍和无阅读障碍的用户，SVM预计将提供良好的性能时，数量维数大于样本数，特征空间稀疏。然而，SVM的解释是一项复杂的任务，并且当数据集具有更多噪声时，它不能很好地执行。另一方面，这样的方法因为逻辑回归更容易实现和理解，并有望为二进制提供一个非常好的解决方案。文章年用户数量用户语言数据类型测试类型机器学习技术性能度量图形模型20153137–62希伯来文本阅读LDA和Naive准确性，Lakretz等人[七]《中国日报》Bayes困惑检测读者Rello和20159711–54西班牙眼睛阅读SVM精度巴列斯特罗斯[8]跟踪眼动追踪Benfatto20161859–10瑞典眼睛阅读SVM精度等人[9]跟踪WM连通性20166110-14.7普通话MRI扫描阅读支持向量机，逻辑准确性，等人[10个国家]回归灵敏度，特异性和NPV多参数Plonski20172368.5-13.7法语，MRI扫描阅读支持向量机，逻辑准确性和等人[第十一届]德国和回归和线下面积波兰随机森林曲线D.C. Khan et al. [12个]20188577（平均值）马来文本阅读k-NN精度Dytective Rello等.20182677–60英语文本网络游戏SVM准确性，[13个国家]精确度，召回率ERP Frid和Manevitz201832成绩希伯来脑电图扫描阅读支持向量机，神经混乱[14个]6–7网络矩阵Perera等. [第十五条]201832≥18英语脑电图扫描打字和写作SVM准确度、灵敏度和特异性自适应学习2018307–12马来视频和阅读SVM，初始精度等人[16个]图像贝叶斯和K-NNDysLexML2019698.5-12.5希腊眼睛阅读SVM，初始准确度，MSEAsvestopoulou等人[17]跟踪贝叶斯和K-means脑电局部网络2019443级荷兰脑电图扫描阅读SVM和K-NN准确性，Rezvani等人[18个国家]灵敏度，特异性和精度Handwriting Spoon et al.2019150k-6年级英语图像手写卷积精度南184号Kaisar/ICT Express 6（2020）181分类问题。总体而言，适当分类技术的选择基本上取决于数据本身，因此研究应该产生一个比较性能，以显示不同机器学习模型的结果，而不是报告所选模型的性能在这方面，集成方法的应用也可以有利于实现更好的性能。2.4. 绩效评价现有文献使用MATLAB，WEKA和基于Python的工具进行性能评估。在这种情况下，使用不同的指标来评估使用机器学习方法的阅读障碍检测技术的性能。这包括准确性、灵敏度、特异性、精确度、召回率、均方误差（MSE）、阳性预测值（PPV）、阴性预测值（NPV）和受试者工作特征（ROC）曲线下面积。准确性测量正确分类的对象的数量与对象的总数之比，而敏感性和特异性分别测量正确识别的有阅读障碍和无阅读障碍的用户的比率。精确度或阳性预测值是指相对于识别出的阅读障碍用户的总数，正确识别出的阅读障碍用户的分数，而召回率是正确识别出的阅读障碍用户的总数的分数。基于EEG的方法在不同工作中达到60%-总的来说，如果将来自多个来源的数据组合在一起，那么这些技术的性能会如何变化，这将是很有趣的。表1强调了使用机器学习方法进行阅读障碍检测3. 今后的方向和结论阅读障碍是一种学习障碍，影响着世界上约10%的人口。因此，及早识别有读写困难的儿童，为他们提供适当的学习设施，是十分重要的研究人员已经提出了几种技术来识别阅读障碍儿童。本文总结了现有的阅读障碍检测技术，使用机器学习的方法。虽然这些方法达到了可接受的准确性和成功率，但其性能可以进一步提高。在这方面，从多个来源收集数据（例如，图像、文本、游戏和扫描）可以组合在一起，以使预测模型更好地工作。在这种情况下，制定一种与语言无关的数据收集方法也会有所帮助。看到集成方法的影响会很有趣，其中将多个模型的预测结合在一起，以提高机器学习技术的准确性。总体而言，上述技术的组合有望在检测阅读障碍方面提供更好的结果。竞合利益作者声明，他们没有已知的可能影响本文所报告工作引用[1] 什么是阅读障碍？ 2020 年， https ：//dyslexiaasociation. 奥尔湾au/what-is-dyslexia/，于2020年2月28日访问[2] 阅读障碍在澳大利亚， 2020 年，https ： //dyslexiasociation 。奥尔湾au/dyslexia-in-australia/，于2020年2月28日访问[3] 特别安全局Hamid，N. Admodisastro，A. Kamaruddin，基于计算机的学习模型为诵读困难的学生的研究，在：2015年第9届马来西亚软件工程会议（MySEC），IEEE，2015年，pp. 284-289.[4] 阅读障碍，2020年，https：//www。OPEN.EDU/OPENLEARN/EDUCATION-DELO P M E N T / E D U C A T IO N / U D E R S T A N-DY S L E X I A / C ON T EN T-S ECTI O N-D E LO P M E N T/ED U C A T I O N /U D ER STA N- D Y S L E ND I O P M E N/D U C AT I O N/U D E R S T A N-D YS L E N D I ON-D Y S L X I A/ CONT E N-D S L S E N-D S L S E N-D S L S E N-S ES 7 .第一次会议。2，于2020年2月28日访问。[5] H. Perera，M.F. Shiratuddin，K.W.王，基于脑电图的模式分类框架的阅读障碍，脑信息。5（2）（2018）4.[6] H. Perera，M.F. Shiratuddin，K.W. Wong，现代计算技术在阅读障碍检测中的作用回顾，在：信息科学与应用（ICISA）2016，Springer，2016，pp. 1465-1475年。[7] Y.拉克雷茨湾N.J. Hik，N. Friedmann，M. Rosen-Zvi，阅读障碍的概率图模型，在：第21届ACM SIGKDD知识发现和数据挖掘国际会议论文集，2015年，第101页。1919-1928年。[8] L. Rello，M. Ballesteros，使用机器学习和眼动跟踪措施检测阅读障碍的读者，在：第12届Web for All会议论文集，2015年，pp.1-8号。[9] M.N. Benfatto ， G. Seimyr ， J. Ygge ， T. Pansell ， A. 里德伯角Jacobson，Screening for dyslexia using eye tracking during reading，PLoS One 11（12）（2016）。[10] Z. Cui ， Z. Xia ， M. Su ， H. Shu ， G. Gong ， Disrupted whitematterconnectivity underlying developmental dyslexia ： a machinelearningapproach，20 0 4 。脑图37（4）（2016）1443[11] P. 帕托诺夫斯基，W。格拉德科沃斯基岛阿尔塔雷利湾 Monzal vo ， M.vanErmingen-Marbach ， M. Grande ， S. Heim ， A.Marchewka，P. Bo-gorodzki，F. Ramus等人，发展性阅读障碍神经解剖学基础的多参数机器学习方法。脑图38（2）（2017）900-908。[12] 格勒乌Khan，J.L.A.郑，O.Y.机器学习和阅读障碍：学习障碍儿童的诊断和分类系统（DCS）。J. Eng. Technol. 7（3.18）（2018）97[13] L. Rello，E.罗梅罗湾Rauschenberger，A.阿里，K.北卡罗来纳州比格姆，威廉姆斯，J.P. White，使用hci测量和机器学习筛查英语阅读障碍，在：2018年数字健康国际会议论文集，2018年，pp.80比84[14] A. Frid，L.M. Manevitz，特征和机器学习，用于大脑区域和阅读障碍之间的关联和分类，2018，arXiv预印本arXiv：1812。10622.[15] H. Perera，M.F. Shiratuddin，K.W.黄，K. Fullarton，成人阅读障碍和正常对照之间书写和打字的脑电图信号分析，Int. J. 互动. 多媒体艺术品内特尔第五条第一款（2018年）62项。[16] 特别安全局Hamid，N. Admodisastro，N. Manshor，A.卡玛鲁丁，匿名戒酒会。 Ghani ， Dyslexia adaptive learning model ： studentengagement predicationusing machine learning approach ， in ：InternationalConferenceonSoftComputingandDataMining ，Springer，2018，pp. 372-384.[17] T. Asvestopoulou，V. Manousaki，A.普西斯塔克斯岛Smyrnakis，V.Andreadakis ， I.M. Aslanides ， M. Papadopouli ， Dyslexml ：Screening tool for dyslexia using machine learning ， 2019 ， arXivpreprint arXiv：1903. 06274.[18] Z. Rezv ani，M.Zar e，G.我很抱歉，先生。Bonte，J.Tijms，M.Van derMolen，G.F. González，基于EEG局部网络特征的诵读困难儿童的机器学习分类，2019年，pp. 1[19] K. Spoon ， D. Crandall ， K. Siek ， Towards detecting dyslexia inchildren1比5。[20] M.劳申贝格湖雷洛河Baeza-Yates，J. P. Bigham，使用基于网络的游戏进行语言独立的阅读障碍检测，在：可扩展物联网会议记录，2018年，第100页。1-10。

下载后可阅读完整内容，剩余1页未读，立即下载