QAConv:信息性对话的问答数据集与模型提升

0 下载量 121 浏览量 更新于2024-06-19 收藏 22.71MB PDF 举报
QAConv是一项重要的研究,它聚焦于信息性对话的问答数据集和模型开发。相较于开放领域的闲聊和任务导向对话,信息性对话如商务邮件、在线会议和工作聊天室具有独特的特性,如长篇幅、复杂性、非实时性和涉及深厚的专业知识。研究者们从10,259个多样化的对话中提炼出34,204个问答对,这些问题涵盖了不同类型的挑战,如跨段落的问题、自由形式提问和难以回答的问题,其中包括人工设计和机器自动生成的问题。 数据集的收集过程中,通过将长对话划分为可管理的块,并利用问题生成器和对话摘要生成器工具来创建多跳问题,旨在模拟真实世界的信息查询场景。数据集提供了两种测试模式:块模式和完整模式,前者要求模型仅依赖当前对话块中的信息,后者则允许模型利用整个对话历史。这反映了实际应用中可能遇到的不同情景。 实验结果显示,目前最先进的QA系统在面对信息性对话的零样本迁移学习时表现不佳,往往无法准确处理这类对话中的问题。通过在QAConv数据集上进行微调,可以显著提升系统的性能,例如在块模式和完整模式下分别提高了23.6%和13.6%的准确率。 QAConv的研究填补了对话理解和文档理解之间的空白,强调了对话数据格式和语言风格对模型训练的重要性。尽管对话AI领域的研究先前更多关注于对话问答,但QAConv的数据集和研究方法为更深入地探究信息性对话的问答问题提供了有价值的资源。这对于构建能够适应各种情境,特别是需要综合运用领域知识的智能问答系统具有重要意义,有助于推动人工智能技术在实际商业应用中的发展。