泰米尔语填空题干扰词生成方法：基于词缀的自动化流程

PDF格式 | 583KB | 更新于2025-01-16 | 47 浏览量 | 举报

"这篇论文提出了一种基于词缀的泰米尔语填空题干扰词生成方法，旨在提高泰米尔语教学中的语法、形态和词汇学习。这种方法包括干扰词候选收集和干扰过滤两个步骤，利用词缀信息和高维空间中的特征混合来生成干扰词，并通过ListMLE方法进行过滤，确保生成的干扰词具有较高的可靠性和语义相关性。实验结果显示，该方法在泰米尔语课本的注释数据集上表现优秀，提高了干扰词生成的效率和质量。" 详细知识点: 1. **自动问题生成**: 自动问题生成系统是利用机器学习技术自动化创建问题的过程，旨在减轻教师的工作负担，同时在教育和评估中提供支持。 2. **填空题**: 填空题是一种常用的评估工具，能够有效地测试学生对语言形态结构的理解，例如词汇、语法和句型。 3. **干扰词**: 在填空题中，干扰词是指除正确答案外，设计用于迷惑考生的其他选项。生成高质量的干扰词对于确保测试的有效性和公正性至关重要。 4. **基于词缀的干扰词生成**: 这篇文章的重点是利用词缀（词的前缀、后缀等）来生成泰米尔语填空题的干扰词，这种方法考虑了语言的形态规则，增强了干扰词的自然性和合理性。 5. **两步流程**: 干扰词生成分为两个步骤：首先收集干扰词候选，这涉及到在高维空间中结合正字法和语义特征；其次，通过干扰过滤步骤，使用ListMLE等方法学习排名模型，以筛选出最合适的干扰词。 6. **ListMLE方法**: ListMLE是一种基于特征的列表级学习方法，用于优化排序任务，如选择最佳干扰词，它在此过程中提高了干扰词生成的可靠性。 7. **特征混合**: 拼写特征和语义特征的结合在生成干扰词时起到关键作用，它们的混合可以增强生成的干扰词在拼写和意义上与正确答案的区分度。 8. **实验与评估**: 论文通过在TamilMCQs注释数据集上的实验，验证了所提方法的有效性，显示了拼写和语义特征融合以及ListMLE方法的优势。 9. **可扩展性和可靠性**: 提出的流水线过程不仅提高了干扰词生成的效率，而且增加了系统的可扩展性，意味着它可以适应不同级别和主题的填空题生成。 10. **教育应用**: 这种方法在泰米尔语教学中具有实际应用价值，能够帮助教师创建更有效的评估工具，促进学生的学习进程和语言技能的评估。总结：本文提出的方法为自动问题生成提供了一个创新的解决方案，特别是对于泰米尔语这样的语言，强调了词缀在生成干扰词中的重要性，并展示了如何结合机器学习技术来提高填空题的质量。这种方法的实施和效果验证为教育领域的自动问题生成研究提供了新的思路。

展开

工程科学与技术，国际期刊

（

2022

）

100993

完整文章

基于词素的填空题干扰词自动生成

Shanthi

Murugan

，

Balasundaram Sadhu Ramakrishnan

印度泰米尔纳德邦

Tiruchirappalli

国家技术学院计算机应用系，邮编

620015

阿提奇莱因福奥

文章历史记录：

收到2020年

2021年3月18日修订

2021年4月26日接受

2021

年

月

日网上发售

保留字：

MCQ

分心词

语素学习

学习

排序词嵌入

形态学处理屈折形态学

A B S T R A C T

自动问题生成有助于评估员评估学生的技能。提出了几种利用不同的相似性度量生成非事实式完形填空干扰词

的方法。本文提出了一种基于词缀的泰米尔语填空题干扰词的自动生成方法，主要用于学习泰米尔语语法、形

态细节和词汇。在本研究中，基于词缀的干扰词生成被提出为两个步骤的流水线过程：1）干扰词候选收集：

该生成主要依赖于在高维空间中的某些隐含地混合了正字法和语义特征的干扰词。2)干扰过滤：过滤被训练为

学习排名模型，以保持干扰生成的可靠性使用基于特征的Listwise方法（ListNet和ListMLE），除了相似性

度量之外，还使用了caserole实验与注释数据集（TamilMCQs）从5日至12日年级泰米尔语课本。实验结果表

明，拼写和语义特征的混合极大地提高了干扰词生成的可靠性，而ListMLE方法比ListNet方法提高了干扰词

生成的可靠性。作为一个整体，我们提出的流水线过程增加了可扩展性和可靠性，在distractor生成。

BY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）。

介绍

问题是评估学习者知识缺陷的常见形式，但是，人工构造问题生成

是耗时的[15]。近年来，利用机器学习的自动问题生成系统得到了广泛

的关注，特别是在教育学、心理学和计算机科学领域。问题生成系统可

以帮助在各种情境下的学习过程以及评估.在这个方向上，学习词的形态

结构是这项工作的重点。

填空题已被证明是测试学习者知识水平的一种有效的评估方法。

填空题是以一个载体句为基础，对语言的形态范畴进行评估。句子中

的一个词是答案，或者是关键字，

通讯作者。

电子邮件地址：

shanthicse9@gmail.com （ S.Murugan ）， blsundar@nitt.edu

（

B.Sadhu Ramakrishnan

）。

由Karabuk大学负责进行同行审查

为了使学习者能够自动回答，填空题通常会显示选项，其中包括答案

及其干扰项。

在我们的工作中，干扰素生成语素为基础的填空实验的粘着语言

之一这里，载体句子取自图

中指定的

年级教科书。干扰词与关键

词一起生成，以混淆学习者。填空题生成的质量主要取决于干扰项的

质量。

干扰词不会误导学习者或考生，绝对关键词可以很容易地选择。作

为一个整体的结果，干扰项的选择隐含地降低了填空题的质量。因此，

需要有效地执行干扰物选择以满足质量参数（即）干扰项必须足够合

理，但不能是可接受的答案[7]。

一般来说，干扰词生成方法推荐八种不同类型的干扰词用于多项

选择题和填空题。适当地，基于词缀的干扰词适合于基于语法的填空

项目，而不是其余的干扰词类型

[7]

。基于词缀的干扰项是

https://doi.org/10.1016/j.jestch.2021.04.012

出版社：

Elsevier B.V.

这是一篇基于

CC BY-NC-ND

许可证的开放获取文章（

http://creativecommons.org/licenses/by-nc-nd/4.0/

）。

可在ScienceDirect上获得目录列表

工程科学与技术国际期刊

杂志主页：

www.elsevier.com/locate/jestch

下载后可阅读完整内容，剩余6页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 5

泰米尔语填空题干扰词生成方法：基于词缀的自动化流程

英语词缀与英语派生词.pdf

基于词缀的维吾尔谚语识别关键技术研究.pdf

英语词根词缀.mdx

词根词缀词典

不择手段背单词、新东方词根词缀词典、超级新华字典、英语词根词缀记忆大全词典-附件资源

西班牙语词根词缀.doc

欧路词典英语词典包（牛津9，剑桥，朗文，词根词缀）

新东方词根词缀大全 词根词缀

英语动词、名词与形容词常见词缀.doc

世界语单词生成器：基于Python的词缀组合创新工具

最新资源

新东方词根词缀大全词根词缀