没有合适的资源?快使用搜索试试~ 我知道了~
工程科学与技术,国际期刊26(2022)100993完整文章基于词素的填空题干扰词自动生成ShanthiMurugan,Balasundaram Sadhu Ramakrishnan印度泰米尔纳德邦Tiruchirappalli国家技术学院计算机应用系,邮编620015阿提奇莱因福奥文章历史记录:收到2020年2021年3月18日修订2021年4月26日接受2021年9月09日网上发售保留字:MCQ分心词语素学习学习排序词嵌入形态学处理屈折形态学A B S T R A C T自动问题生成有助于评估员评估学生的技能。提出了几种利用不同的相似性度量生成非事实式完形填空干扰词的方法。本文提出了一种基于词缀的泰米尔语填空题干扰词的自动生成方法,主要用于学习泰米尔语语法、形态细节和词汇。在本研究中,基于词缀的干扰词生成被提出为两个步骤的流水线过程:1)干扰词候选收集:该生成主要依赖于在高维空间中的某些隐含地混合了正字法和语义特征的干扰词。2)干扰过滤:过滤被训练为学习排名模型,以保持干扰生成的可靠性使用基于特征的Listwise方法(ListNet和ListMLE),除了相似性度量之外,还使用了caserole实验与注释数据集(TamilMCQs)从5日至12日年级泰米尔语课本。实验结果表明,拼写和语义特征的混合极大地提高了干扰词生成的可靠性,而ListMLE方法比ListNet方法提高了干扰词生成的可靠性。作为一个整体,我们提出的流水线过程增加了可扩展性和可靠性,在distractor生成。©2021 Karabuk University. Elsevier B.V.的出版服务。这是CCBY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍问题是评估学习者知识缺陷的常见形式,但是,人工构造问题生成是耗时的[15]。近年来,利用机器学习的自动问题生成系统得到了广泛的关注,特别是在教育学、心理学和计算机科学领域。问题生成系统可以帮助在各种情境下的学习过程以及评估.在这个方向上,学习词的形态结构是这项工作的重点。填空题已被证明是测试学习者知识水平的一种有效的评估方法。填空题是以一个载体句为基础,对语言的形态范畴进行评估。句子中的一个词是答案,或者是关键字,*通讯作者。电 子 邮 件 地 址 : shanthicse9@gmail.com ( S.Murugan ) , blsundar@nitt.edu(B.Sadhu Ramakrishnan)。由Karabuk大学负责进行同行审查为了使学习者能够自动回答,填空题通常会显示选项,其中包括答案及其干扰项。在我们的工作中,干扰素生成语素为基础的填空实验的粘着语言之一这里,载体句子取自图1中指定的8年级教科书。干扰词与关键词一起生成,以混淆学习者。填空题生成的质量主要取决于干扰项的质量。干扰词不会误导学习者或考生,绝对关键词可以很容易地选择。作为一个整体的结果,干扰项的选择隐含地降低了填空题的质量。因此,需要有效地执行干扰物选择以满足质量参数(即)干扰项必须足够合理,但不能是可接受的答案[7]。一般来说,干扰词生成方法推荐八种不同类型的干扰词用于多项选择题和填空题。适当地,基于词缀的干扰词适合于基于语法的填空项目,而不是其余的干扰词类型[7]。基于词缀的干扰项是https://doi.org/10.1016/j.jestch.2021.04.0122215-0986/©2021 Karabuk University.出版社:Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表工程科学与技术国际期刊杂志主页:www.elsevier.com/locate/jestchS. Murugan和B.萨杜·拉马克里什南工程科学与技术,国际期刊26(2022)1009932在主要用于形态评估和单词整合技能的填空题中,学生的选择性较高。在不同类型的干扰词中,对词缀干扰词的研究很少。通常,干扰词的生成依赖于与问题的关键词或答案的语义相似性度量。除了语义相似性,其他工作已经利用词性(POS标签)和词频来生成干扰项。语义相似性度量是在高维分布式向量空间中计算的。基于语义相似性的干扰词生成部分适用于基于词缀的干扰词生成。因为,词缀干扰词与语义相似性以及拼写特征(拼写相似性)高度相关。在现有的系统中,基于词缀的干扰项是从形态生成器[119]生成的。这些系统高度依赖于语言工具,以及他们遭受可靠性问题。从语言学习的角度来看,大多数关于干扰词自动生成的研究只有少数作品对非英语文本做出了贡献,例如法语的语法练习[18]和保加利亚语文本的词汇练习[16]。在泰米尔语中,问句生成系统很少涉及MCQ,[10]主要关注基于词素和语义特征的事实who-question生成系统。我们的工作产生了基于词缀的干扰词作为两步管道式的方法来解决填空题。在巴斯克语中[19],基于词缀的干扰词生成高度依赖于NLP工具(即)形态发生器在我们的工作中,第一步:使用高维向量空间作为无监督形态学归纳方法生成基于词缀的干扰项候选列表[21]。我们的工作不依赖于形态发生器。现有系统在使用发生器时没有关注干扰器的可靠性[1]。因为,在黏着语的情况下,特别是在塔米语中,词根的不同单词形式可以填补句子的空白其次,为了使生成的干扰项候选列表具有可靠性,我们进一步进行了学习排序方法,从列表中筛选出可接受的答案。一些手工制作的功能用于学习排名方法中的干扰过滤。目前的工作是从学习一门语言的角度,图1示出了具有可能的干扰项的基于词素的填空问题的示例。具体而言,本文的主要贡献如下1. 这是完形填空题干扰词自动生成的首次尝试,也是为语言学习服务的。2. 泰米尔语语法完形填空题特别关注名词/动词的屈折变化类别。3. 为了生成干扰词候选,提出了一种混合的方法,而不是语言工具的拼写相似度和语义相似度。4.对于干扰项过滤,在这个过程中提出了监督学习排名方法。Fig. 1. 泰米尔语填空项目。本文的组织如下:在第2节中的相关工作的分心物生成方法和形态生成的泰米尔语作品进行了讨论。基于词缀的干扰词生成的流水线过程在第3节中讨论。用于第4节所示实验的数据集。第5节描述了干扰项候选集合、干扰项过滤模型的实验设置。第六节的评估结果显示,提出的功能激增的可靠性得分在分心物生成。第七讨论了特征误差分析和总体方法。2. 相关工作现有的DG(分心物生成)的方法大多是基于各种相似性的措施。这些包括基于Word Net的度量,基于嵌入的相似性[9],N-gram共现可能性[8],语音和形态相似性,本体中的结构相似性,上下文相似性,上下文敏感推理,句法相似性,单词难度级别(频率)和POS标签。一般来说,多项选择题在不同类型的问答系统中支持八种类型的正确答案。完形填空题或填空题使用基于完形填空的干扰词(即)用适当的词语或短语说明问题的差距。基于词缀的干扰词通常用于基于语法的问答项目。基于词缀的贬抑词是通过词素的添加或删除来修饰的词[7]。现有的完形填空题生成只利用完形填空干扰词来进行词汇学习,而不需要利用词缀干扰词。但是很少有系统将基于词缀的缩减器用于基于语法的完形填空题生成系统。设计了一个系统来自动生成问题及其干扰词,其中干扰词是通过形态生成器获得的[1]。他们为巴斯克语改编了动词变位和名词变格工具。他们定义了一些参数产生干扰词,如改变主语人称、宾语人称、动词方式、时态、体、单数、复数、变格形式的替换和重复。设计了一个系统来半自动地产生不正确的选择,或干扰[19]。他们主要关注学生的误解类型,通过产生干扰。他们使用JTAG系统形态数据库生成形态变体。形态干扰项不仅用于检测形态处理能力的差异,而且用于识别单词整合技能。但是,我们提出的工作主要集中在词缀为基础的干扰(即相对于正确答案或目标词的形态变体)。基于词缀的干扰词一般是从现有的形态生成器中生成的,而形态生成器主要依赖于监督学习机制和基于规则的系统。泰米尔语中的一些现有形态生成器[2,12,13]以及我们需要指定语法类别细节(形态语法信息)。没有自动生成的形态变异词的干扰生成。形态生成器系统用作泰米尔语语法教学的一部分[6]。无监督形态归纳系统已被用于生成词根的不同词形[21]。该系统使用某些正则性/相似性来生成变形形式、单数、复数及其相对于特定词根的其余类别。所提出的方法侧重于无监督学习的distractor生成通过形态学归纳。在词嵌入空间中,存在一定的相似性/相似性,这些相似性/相似性用于生成关于填空项的目标词的变形形式、单数、复数及其剩余类别。词嵌入算法用于生成可能数量的词形式,这些词形式不特定于有限的语法-S. Murugan和B.萨杜·拉马克里什南工程科学与技术,国际期刊26(2022)1009933JJJJJ1J23nJ1 2 3n数学范畴由于泰米尔语的粘着性质,单词长度被认为是用于生成基于词缀的干扰词。为了在干扰项生成中保持可靠性,存在'n'个过滤方法。对于干扰过滤,涉及三元组和依赖解析器[9]。基本上,基于完形填空的干扰词需要不适合特定的完形填空题,而不是正确的答案。基于逐点排序法的干扰项生成器采用了学习排序方法。在这个方向上,在这种情况下提出了分心过滤。格角色和主语动词一致规则是从现有的干扰词过滤系统中得到启发的。在泰米尔语中,通过改变宾语的词缀,句子的宾语和动词之间可能存在不止一种关系[3]。句子的主语和动词有一致性规则来关联PNG标记[17]。3. 牵开器生成在多项选择题生成中,干扰项的生成必须合理可靠(不是可接受的答案)。问答系统主要关注屈折范畴。由于这一点,在这项工作中,词缀为基础的干扰词生成的关键字或答案。基于词缀的distractor生成遵循两个步骤。整个工作流程示于图 二、1. 基于词缀的干扰词候选生成必须优化干扰词的可扩展性2. 干扰项过滤和选择必须旨在过滤出干扰项候选项,这些干扰项候选项是优化干扰项可靠性的可接受答案。3.1. 牵引器候选集合基于与使用word2vec模型的目标词相关的组合相似性方法(语义和拼写)收集该过程的干扰项候选项[14]。在监督学习的情况下,需要大量的训练用于distrator- tor候选集合。而在无监督模型中,屈折词形式是从原始数据中提取的之一工作中的主要任务是生成特定词根的屈折形式的列表。3.2. 通过学习排序方法过滤和选择干扰物除了目标词或关键词外,词根的其余屈折形式不能成为特定填空题的干扰词。因为多于一个屈折形式适合于填空[3,17]。为了避免一个以上的正确答案作为干扰因素,过滤过程已经通过学习排名方法进行[11]。我们解决干扰过滤排名问题。问题公式化:给定问题和答案及其可能的干扰项候选数据集M={(qi,ki,{di1,............................................................................................................................,其中qi是问题,ai是答案,{di1,.,d}是在干扰项候选收集步骤中生成的干扰项候选列表。对于给定问题,干扰项候选列表可能具有可接受的答案。为了过滤掉干扰项候选列表中的可接受答案,我们使用列表排序函数r:(qi,ki,dis[list]),使得作为可接受答案(满足与主动词/主语动词一致的关系)的干扰项在干扰项列表中具有较低的排序,并且剩余的干扰项在干扰项列表中具有较高的排序。基于特征的LTR模型(即)ListNetListMLE方法[4,22]等,被调查学习排名功能。基于在IR-LISTWISE学习排名方法中,列表方法已用于干扰项过滤和排名。一组问题Q =fq <$1 $>;q<$2 $>;q<$3$>; ;q<$ m<$g及其关键词K =fk=1;k=2;k= 3;;kmg给出。每个查询qi及其关键字与干扰项列表di={di,di;di;;di},其中di表示第j个干扰项,ni表示di的大小。此外,每个干扰项列表都与干扰项列表相关联。判决(分数)yifyi;yi;yi;······:;yig其中yi表示关于问题qi及其关键词ki的干扰项di的判断。yi表示di与qi的相关度,由注释者(人类)明确给出。例如,是基于关于问题qi和答案ki的干扰项di上的特征的数量的相关度。图二. 拟议工作的工作流程图。S. Murugan和B.萨杜·拉马克里什南工程科学与技术,国际期刊26(2022)1009934JJ1/1J123nJJ123n从每个(问题,关键字,干扰项)设置qikid i,i = 1,2,3,.. . ,m; j = 1,2,3,. . ,n.每个列表的特征xix i;xi;xi;···· ··:;x i和3.2.2. 学习方法列表LTR方法(Listnet,ListMLE)使用注释数据{q,k,d[]}问题、关键字和干扰项列表,具有相关性分数。算法1用不同的算法来解释该过程对应1 2 3nlistwise方法。相关性分数列表y=i=f;y=i; y=i;y=i;·······:; y= i; i=iinstance. 训练集可以表示为T =fxi;yi gim。算法1列表学习排序方法然后,我们为每个特征向量xii创建一个排名函数f i。它的关联度fxi。 对于特征向量列表,输入:训练数据{(x(1),y(1)),(x(2),y(2)),(x(3),y(3)),(x(m),y(m))}获取关联度列表Zifxi; f x i;f xi;······:; f xi。基于不同的列表方法定义排名函数学习的目标被形式化为相对于训练数据的总损失最Listnet方法使用交叉熵损失函数,ListMLE方法使用Likestive损失函数。在排名中,当一个新的查询qi,关键字ki及其关联,给定了分散项di,我们从它们构造特征向量xi,并使用训练的排名函数为distracts干扰物。3.2.1. 特征描述给定一个元组(q,a,d[]),基于特征的模型首先将其转换为特征向量(q,k,d[])。以下特征用于distractor滤波,得到n维特征向量。使用的特征I. POS相似度:关键词(k)和干扰项列表d[]之间的词性标签相似度。直觉是关键词和否定词属于同一语法范畴II。公共前缀:k和d[]最长公共前缀的绝对和相对长度.键和干扰项列表已经有了共同的前缀,但是这个特性会在列表中找到最好的一个。III. 语义角色:如果关键词属于名词范畴,则语义角色与该问题的主要动词一致。语义角色或UNL关系规定了根词在句子中基于名词或动词类别的不同屈折词形式[3]。IV. 一致性规则:如果key属于动词类别,则distractor应违反PNG信息(PNG -Person,Number,Gender)中的主谓一致性规则如果它符合主谓一致规则,它可能是一个可接受的答案[17]。V.句子嵌入:具有原始答案的问题与具有干扰词列表的问题之间的句子嵌入相似性[14]。VI. 短语嵌入:包含关键字的短语和带有干扰项的短语之间的短语嵌入相似度[14]。VII. 基于BERT模型的短语嵌入:包含关键字的短语与带有干扰项的短语之间的短语嵌入相似度[20]。VIII.通过微调BERT模型进行句子验证:通过从多语言BERT模型微调的分类模型验证具有干扰句的问题[20]。表1用于列表方法的数据集。数据集火车有效测试平均值(牵引器)TamilMCQs250030020010参数:初始化参数w的初始化次数和学习率gfor t = 1 to T dofor i = 1 to m do输入{x(i),y(i)}到神经网络计算梯度Dw与当前w更新w =w-g*D wend,Listnet使用训练数据集计算交叉熵损失函数ListMLE计算训练数据集结束输出神经网络模型w4. 使用的数据集为了方便我们的实验,我们编译了以下数据集:4.1. 牵引器候选集合OPUS Corpus MTIL Corpus[5]:从平行语料库中提取泰米尔语单语数据来训练泰米尔语单词嵌入。泰米尔语维基百科转储语料库:从泰米尔语维基百科转储中提取句子和单词,用于计算难度级别(词频),拼写相似性和单词共现统计4.2. 牵张滤波Tamil MCQ:在以下数据集上评估了建议的干扰物过滤模型。(i)泰米尔语课本中的填空练习题。这些问题涵盖了印度5年级到12年级的教科书。在教材练习中,只有少数问题是评价词缀基础知识的主要问题。剩下的填空题是一般性的,由于这个事实,我们在学生已经熟悉的相同练习题中,由5名泰米尔学校教师和语言学手动注释空白和干扰项。大多数情况下,空格被认为是名词或动词。在实验中使用了大约3000个泰米尔教科书练习题。将数据集随机分为训练/有效/测试,适当比例为2500:300:200,如表1所示。5. 实验5.1. 基线系统一般来说,干扰词必须与目标词具有相同的词性标记,相似公共前缀即(拼写相似性)方法用于生成与基于词缀的干扰项相似基于词缀的干扰子S. Murugan和B.萨杜·拉马克里什南工程科学与技术,国际期刊26(2022)1009935一般都有共同的词根,但有不同的屈折形式。如果拼写与目标词一致,则来自单词2vec方法的语义相似性[15]生成与基于词缀的干扰词非常相似的干扰词中文填空题的干扰词生成已经使用了语义相似性方法[9]。共现方法用于生成干扰词,但它偏离了我们基于词缀的干扰词方法[8]。基于词缀的干扰词是从语言资源(即)生成的。形态发生器表4ListMLE方法中分心物过滤的排名结果模型R@10时P@1P@3MAP@10NDCG@10列表MLE-C + A + S30.515.215.315.324.5列表MLE-C + A + S30.916.316.416.125.6ListMLE–C + A + S +32.916.917.517.927.9表5各种牵引器生成方法的可靠性和合理性5.2. 牵引器候选集合(训练模型-I)方法可靠性合理性的平均基于语法的问题干扰词候选集是通过混合拼写相似度和语义相似度来生成的。字共-发生100%不合理1不适合在这种方法中,特定词的形态归纳是生成的,像森林一样。干扰词候选集合是从森林中生成的(森林中的形态词形式属于语法类别)。首先,形态变换规则被提取,POS Tag 75% Some What Plausible拼写相似度60%一些什么合理语义相似度63%非常合理1.05部分适用2.25部分适用1.26部分适用词汇表利用余弦和秩函数计算转换规则中的语义相似度最后,形态学词形之间的转换是无向连接的牵引器候选集合63%非常合理2.58合适实验细节示于表2中。语义相似度80%非常合理1.26部分适用5.3. 干扰滤波(训练模型-II)在Listwise方法中,使用张量流实现基于简单线性神经网络的模型使用Adam算法进行优化,学习率为0.001,权重衰减为0.00001。网络模型有150个隐藏单元。基于第3.2.2节中的特征规范,总共从注释数据的{q,a,d[]}生成26个特征向量。6. 结果6.1. 牵张滤波在评价中,我们报告了最高召回率(R@10)、精确度(P@1,P@3 ) 、 平 均 平 均 精 确 度 ( MAP@10 ) 、 归 一 化 折 扣 累 积 增 益(NDCG@10)。ListNet和ListMLE结果如表3所示。ListMLE的性能优于ListNet方法。列表MLE方法的重要性如表4所示,关于某些特征(即)C-大小写角色、POS标签相似性、拼写相似性; A-一致性规则; S-短语之间的语义相似性和句子相似性; F-通过预训练的Bert嵌入模型进行微调的句子验证。表2训练数据大小和诱导形态图。语言泰米尔词汇量520 K提取的规则数(拼写相似度)58 K评估后的规则数(语义相似度)40 K图5 K有向图(基于词缀的干扰器)3 K表3分心物过滤的排名结果模型R@10时P@1P@3MAP@10NDCG@10清单网方法18.613.611.49.714.2ListMLE方法32.916.917.517.927.96.2. 基于专家的评价在可靠性和可扩展性方面,对基线系统和我们的两步流水线工艺进行了评估。我们遵循的评价方法与中文填空干扰词法非常相似对于实验,200泰米尔语填空题从注释数据集(泰米尔语教科书)。对于这200个泰米尔语填空题,使用基线模型的五个标准生成干扰项(即)词性标注、难度(词频)、拼写相似度、语义相似度、词共现法。由精通语法的人类专家评估由基线和两步管道过程(干扰物候选收集和干扰物过滤)生成的选择。专家们用三个分量表评估了干扰物产生的可行性专家评估了由基线和所提出的方法产生在表5中,计算了可靠性评分,并在三点量表内为每种方法规定了可靠性的平均评分最后,基线、所提出的干扰项生成方法适合于基于语法的问题的程度在表6中指定。7. 讨论与误差分析7.1. 分心物过滤方法中的特征分析进行了特征分析,以便对Listwise方法中使用的拟议特征集有更多的了解。词性标注是从干扰词候选列表中的不同词性类别中筛选干扰词的重要特征. Distractor候选集合包含单词及其不同的单词形式。如果关键词是名词,那么干扰词也属于相同的(名词)语法类别。由于该特征,第一级滤波发生在distractor滤波方法中。名词(宾语)和句子中的主要动词之间的格角色关系只在有限的词汇中维持。由于OOV问题,该功能降低了干扰过滤器的性能-S. Murugan和B.萨杜·拉马克里什南工程科学与技术,国际期刊26(2022)1009936表6用于干扰过滤的特征分析。特征可靠性合理性从属资源POS标签没有是的语言资源格角色子动词一致是的部分有限的词汇短语相似性是的部分无监督句子相似度是的部分无监督判决效力是的部分无监督ing.主谓一致规则也出现了同样的问题。包含答案和干扰词的短语之间的语义相似性显示结果的改善。与phrase 2- vec嵌入相比,基于Bert嵌入的语义相似度特征显著提高了搜索结果。关键字问题和干扰词问题之间的句子相似性特征,这稍微改善了结果。句子有效性特征通过分类模型对预训练的BERT嵌入模型进行微调,提高了干扰词的可靠性。此功能支持干扰项生成的可靠性。然而,分散剂生成的可扩展性降低。7.2. 干扰子生成的总体误差分析7.2.1. 可靠性(不是答案)词共现法不适合于生成语法题的贬低词。语义相似性,POS标签方法也不适合为基于语法的问题生成干扰项。当生成的列表与关键字的拼写一致时,它是合适的。拼写相似性方法适用于为基于语法的问题(即)这太常见的前缀而已。拼写和语义相似度的混合方法适用于基于词缀的干扰词生成。我们的工作主要是生成填空题和完形填空题的干扰词。因为不止一种形式的词是可能的,以填补空白w.r.t.语言的可靠性得分降低。候选过滤通过参考Wikipedia语料库消除了三元组过滤方法中给定问题的多个可接受答案作为干扰项提出的Listwise学习方法,在特征集的帮助下提高了可靠性。但是,由于案例角色和协议规则的限制,特征集的缺点是有限的.无监督的句子相似度、短语相似度和句子有效性度量大大提高了信度。7.2.2. 合理性(与答案相似)与语义相似性、拼写相似性、POS标签相比,我们提出的形态学归纳方法(干扰词候选集)在基于词缀的干扰词生成中表现更好。语义相似性方法产生的干扰词在语义上与正确选择相似,但在拼写上不同;拼写相似性方法产生的干扰词在拼写上相似,但在语义上可能不同。我们提出的方法集成了拼写和语义明智的类似干扰。在生成的干扰项候选列表中,需要细化更合理的关键字/答案8. 结论我们提出了第一个研究自动生成的distractor填充在泰米尔语语法问题的空白项目评估表明,基于形态的干扰,体现在高维向量空间实现竞争的可扩展性,语法为基础的填空项目。与现有的三元组方法和依赖关系相比,列表学习排序(LTR)方法实现了干扰项的可靠性。作为未来的工作,基于词缀的干扰词生成需要实现更合理的关键词。竞争利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作。引用[1] I. 马 里 兰 州 阿 尔 达 贝 De Lacalle , M.Maritxalea , E. 马 丁 内 斯 湖 Uria , in :Arikiturri : AnAutomaticQuestionGeneratorbasedonCorporaandNLPTechniques,Springer,Berlin,Heidelberg,2006. 584-594.[2] 上午Kumar,D.V. Rekha,K.P. Soman,S. Rajendran,A小说数据泰米尔语形态生成器的驱动算法,IJCA 6(12)(2010)52-56。[3] J. Balaji,T.V. Geetha,R. Parthasarathi,M. Karky,Morpho-semantic featuresforrule-based Tamil enconversion,Int. J. Comput. Appl 26(2011)11-18.[4] Z. Cao , T.Qin , T.Y.Liu , M.F. 蔡 氏 H.Li, Learning to rank : from pairwiseapproachto listwise approach , in : Proceedings of the 24th InternationalConference onMachine Learning,2007,pp.129比136[5] H. Choudhary,A.K.帕塔克Saha,P. Kumaraguru,英语-泰米尔语的神经机器翻译,在:第三次机器翻译会议论文集:共享任务文件,2018年,第10页。 770- 775[6] Dhanalakshmi , V. , 库 马 尔 , M 。 一 、 雷 哈 河 美 国 、 Soman , K. P. ,&Rajendran,S. (2010,July)。泰米尔语语法教学工具。在2010年国际教育技术会议(pp。85-88)。美国电气与电子工程师协会。[7] H.C.顾德立,外语测试中的分心物效率,《英语测试季刊》(1977)69-78。[8] Hill,J.,锡姆哈河(2016,June)。使用同现似然和Google n-gram自动生成基于上下文的填空练习。在第11届NLP创新使用研讨会的会议记录中,用于构建教育应用程序。23-30)。[9] S. Jiang,J. Lee,中文填空项目的分心物生成,在:第12届NLP创新使用研讨会论文集,2017年,pp.143比148[10] Lakshmana Pandiyan S. , 2013. 基 于 词 素 和 语 义 的 泰 米 尔 语 问 答 系 统 , 在https://shodhganga.inflibnet.ac.in/处理/10603/13419。[11] Liang,C.,中国地质大学,杨,X.,戴夫,N.,Wham,D.,Pursel,B.,Giles,C.L.,2018年,使用学习排名的多项选择题的分心物生成。在第十三届研讨会上的创新使用NLP建设教育应用程序(pp。284-290)。[12] Lushanthan,S.,Weerasinghe,A. R.,Herath,D. L. (2014,12月)。泰米尔语的形态分析器和生成器。在2014年第14届国际会议上在新兴地区的信息和通信技术的进步(ICTer)(pp。190-196)。美国电气与电子工程师协会。[13] Menaka,S.,拉姆,&Devi,S. L.(2010年)。泰米尔语的形态生成器。形态分析仪和发生器知识共享活动的会议记录(2010年3月22日至23日),LDC-IL,迈索尔,印度,82[14] Mikolov,T.,Chen,K.,Corrado,G.,&Dean,J.(2013).向量空间中词表示的有效估计arXiv预印本arXiv:1301.3781。[15] 米特科夫河(2003年)的报告。多项选择题的计算机辅助生成。在HLT-NAACL03研讨会上,使用自然语言处理构建教育应用程序。17-22)。[16] 尼科洛瓦岛(2009,9月)。保加利亚MCTI计算机辅助设计和牵引器选择中的新问题和解决方案。中欧和东欧语言的多语言资源,技术和评估研讨会的会议记录40-46)。S. Murugan和B.萨杜·拉马克里什南工程科学与技术,国际期刊26(2022)1009937[17] 帕达马拉河(2013年)。现代泰米尔语的句法分析问题(博士论文)。检索自http://hdl.handle.net/10603/282077。[18] Perez-Beltrachini,L.加登特角,Kruszewski,G.,2012.生成语法练习。在第七届使用NLP构建教育应用程序研讨会上,147-156)。[19] Pino,J.,Eskenazi,M.,2009.完形填空题的半自动生成学生母语干扰项的影响。教育中的语音和语言技术国际研讨会[20] Pires,T.,Schlinger,E.,Garrette,D.,2019.多语言BERT有多多语言?arXiv预印本arXiv:1906.01502。[21] 索利库特河哦,F.J.,2015.使用词嵌入的无监督形态学归纳。在2015年计算语言学协会北美分会会议论文集:人类语言技术(pp. 1627-1637)。[22] Xia,F.,中国农业大学,Liu,T.是的,王杰,张伟,王伟,Li,H.,2008.学习排名的列表方法:理论与算法。在第25届机器学习国际会议上,1192-1199)。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- BSC关键绩效财务与客户指标详解
- 绘制企业战略地图:从财务到客户价值的六步法
- BSC关键绩效指标详解:财务与运营效率评估
- 手持移动数据终端:常见问题与WIFI设置指南
- 平衡计分卡(BSC):绩效管理与战略实施工具
- ESP8266智能家居控制系统设计与实现
- ESP8266在智能家居中的应用——网络家电控制系统
- BSC:平衡计分卡在绩效管理与信息技术中的应用
- 手持移动数据终端:常见问题与解决办法
- BSC模板:四大领域关键绩效指标详解(财务、客户、运营与成长)
- BSC:从绩效考核到计算机网络的关键概念
- BSC模板:四大维度关键绩效指标详解与预算达成分析
- 平衡计分卡(BSC):绩效考核与战略实施工具
- K-means聚类算法详解及其优缺点
- 平衡计分卡(BSC):从绩效考核到战略实施
- BSC:平衡计分卡与计算机网络中的应用
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功