增强鲁棒性:机器阅读理解与文本问答技术研究

需积分: 50 11 下载量 105 浏览量 更新于2024-08-06 收藏 5.62MB PDF 举报
本文主要探讨了自然语言处理中的机器阅读理解与文本问答技术,特别是在增强模型鲁棒性方面的研究。文章提到了在SQuAD数据集上实现的对抗性训练方法,通过添加对抗样本来提升模型的性能。实验结果显示,这种方法能有效提高学生模型在对抗数据集上的表现,使其超越教师模型,尤其是在AddOneSent和AddSent这两个对抗SQuAD子集上。此外,该方法还改善了在NarrativeQA测试集上的结果,即使单模型和集成模型已经取得最佳成绩,学生模型仍能进一步提升。 在详细内容部分,论文提到了作者胡明昊在导师彭宇行和协助指导教师唐文胜的指导下,对机器阅读理解进行了深入研究。论文涵盖了工学博士学位的要求,包括对计算机科学与技术领域的自然语言处理方向的探索。作者承诺论文中的研究成果是原创的,并且未包含他人已发表或撰写过的内容。同时,作者授权国防科技大学有权保留和使用论文,包括将其数字化并允许被查阅和借阅。 在研究方法上,通过对比传统模型在对抗性数据集上的表现,证明了所提出方法的优越性。在SQuAD数据集的实验中,添加对抗样本使得模型在面对具有误导性答案的场景时,能够做出更鲁棒的预测。而在NarrativeQA测试集上的实验进一步验证了该方法的泛化能力,即使在已经取得高分的情况下,模型仍有提升空间。 这篇论文深入研究了如何通过对抗性训练提高机器阅读理解模型的鲁棒性,特别是在处理复杂和误导性的文本问答任务时。实验结果证明了所提出方法的有效性,并且在多个数据集上展示了良好的泛化性能,对于自然语言处理领域特别是机器阅读理解的研究具有重要价值。