提高中文摘要准确率：融合复制机制与input-feeding的seq2seq模型

需积分: 13 126 浏览量更新于2024-08-13 收藏 1.29MB PDF 举报

本文主要探讨了一种融合复制机制和input-feeding方法的中文自动摘要模型，针对中文自动摘要准确率不高的挑战。传统的自动摘要模型通常依赖于基于序列到序列（seq2seq）架构，然而，这种模型在处理出现于源文本中的Out-of-Vocabulary (OOV)词汇时可能效果不佳。为了解决这个问题，研究人员在基础seq2seq模型的解码器中引入了创新策略。首先，模型采用了指针网络（Pointer Network）。指针网络是一种能够从源序列中直接选择和复制元素的技术，特别适用于处理OOV词。它允许模型在生成过程中直接从源文本中选取合适的词汇，从而提高摘要的准确性。通过这种方式，模型能够确保生成的摘要包含原文中关键的OOV词，增强摘要的忠实度。其次，引入了input-feeding方法。这是一种增强模型性能的技术，它允许模型在解码阶段利用已生成的序列信息来调整注意力机制。通过这种方式，模型能够更好地理解和记忆已生成部分的上下文，使得后续生成的句子更符合整体的语义连贯性，进一步提高了摘要的精确度。作者们在NLPCC2018数据集上进行了详尽的实验，对比了融合复制机制和input-feeding方法的模型与基础seq2seq模型的性能。实验结果显示，新提出的模型在ROUGE得分方面显著优于基础模型，这证实了融合这两种方法的有效性和模型在中文自动摘要任务中的优越性。这篇论文提出了一种创新的中文自动摘要模型，通过结合指针网络和input-feeding方法，有效地提升了模型在处理OOV词和保持上下文一致性方面的性能。这项工作对于改进中文自动摘要技术，尤其是在处理非标准词汇和保持生成摘要质量方面具有重要的实践价值和理论贡献。

　　收稿日期：２０１９０３０１；修回日期：２０１９０４１７　　基金项目：国家自然科学基金资助项目（６１４０２２２０，６１５０２２２１）；湖南省哲学社会科学基

金资助项目（１６ＹＢＡ３２３）；湖南省自然科学基金资助项目（２０１５ＪＪ３０１５）；湖南省教育厅青年项目（１５Ｂ２０７）

　　作者简介：农丁安（１９９２），男，广西钦州人，硕士，主要研究方向为信息检索与自然语言处理；欧阳纯萍（１９７９），女（通信作者），湖南衡阳人，

教授，博士，主要研究方向为语义网与社交网络（ｏｕｙａｎｇｃｐ＠１２６．ｃｏｍ）；阳小华（１９６３），男，湖南衡阳人，教授，博导，主要研究方向为信息检索与知

识发现．

融合复制机制和ｉｎｐｕｔｆｅｅｄｉｎｇ方法的

中文自动摘要模型



农丁安，欧阳纯萍



，阳小华

（南华大学计算机学院，湖南衡阳４２１００１）

摘　要：针对中文自动摘要准确率不高的问题，在含有注意力机制的序列到序列（ｓｅｑｕｅｎｃｅｔｏｓｅｑｕｅｎｃｅ，

ｓｅｑ２ｓｅｑ）基础模型的解码器中融合了复制机制和ｉｎｐｕｔｆｅｅｄｉｎｇ方法，提出了准确率更高的中文自动摘要模型。

首先，该模型使用指针网络将出现在源序列中的ＯＯＶ（ｏｕｔｏｆｖｏｃａｂｕｌａｒｙ）词扩展到固定词典，以实现从源序列复

制ＯＯＶ词到生成序列中；其次，ｉｎｐｕｔｆｅｅｄｉｎｇ方法用于跟踪已生成序列的注意力决定信息以提升模型输出准确

率。在ＮＬＰＣＣ２０１８数据集上的实验结果表明，与基础模型相比，所提出模型获得了更高的ＲＯＵＧＥ得分，验证了

该模型的可行性。

关键词：自动摘要；复制机制；ｉｎｐｕｔｆｅｅｄｉｎｇ方法；指针网络；序列到序列；注意力机制

中图分类号：ＴＰ３９１．１　　　文献标志码：Ａ　　　文章编号：１００１３６９５（２０２０）０８０３２２３９５０５

ｄｏｉ：１０．１９７３４／ｊ．ｉｓｓｎ．１００１３６９５．２０１９．０３．００６５

Ｃｈｉｎｅｓｅａｕｔｏｍａｔｉｃｓｕｍｍａｒｉｚａｔｉｏｎｍｏｄｅｌｏｆｃｏｍｂｉｎｉｎｇｃｏｐｙｉｎｇ

ｍｅｃｈａｎｉｓｍａｎｄｉｎｐｕｔｆｅｅｄｉｎｇａｐｐｒｏａｃｈ

ＮｏｎｇＤｉｎｇ’ａｎ，ＯｕｙａｎｇＣｈｕｎｐｉｎｇ



，ＹａｎｇＸｉａｏｈｕａ

（ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒ，ＵｎｉｖｅｒｓｉｔｙｏｆＳｏｕｔｈＣｈｉｎａ，ＨｅｎｇｙａｎｇＨｕｎａｎ４２１００１，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：ＴｈｉｓｐａｐｅｒｐｒｅｓｅｎｔｅｄａｎｏｖｅｌｍｏｄｅｌｆｏｒｔｈｅｌｏｗｅｒａｃｃｕｒａｃｙｉｓｓｕｅｉｎＣｈｉｎｅｓｅａｕｔｏｍａｔｉｃｓｕｍｍａｒｙｗｈｉｃｈｍｅｒｇｅｄｃｏｐｙ

ｉｎｇｍｅｃｈａｎｉｓｍａｎｄｉｎｐｕｔｆｅｅｄｉｎｇａｐｐｒｏａｃｈｉｎｔｏｔｈｅｄｅｃｏｄｅｒｏｆｓｅｑｕｅｎｃｅｔｏｓｅｑｕｅｎｃｅ（ｓｅｑ２ｓｅｑ）ｂａｓｉｃｍｏｄｅｌｗｉｔｈａｔｔｅｎｔｉｏｎ

ｍｅｃｈａｎｉｓｍ．Ｆｉｒｓｔｌｙ，ｉｔｕｓｅｄｐｏｉｎｔｅｒｎｅｔｗｏｒｋｓｔｏｅｘｔｅｎｄｔｈｅｓｏｕｒｃｅ’ｓＯＯＶｗｏｒｄｓｔｏａｆｉｘｅｄｄｉｃｔｉｏｎａｒｙｔｏｃｏｐｙＯＯＶｗｏｒｄｓｆｒｏｍ

ｔｈｅｓｏｕｒｃｅｉｎｔｏｔｈｅｇｅｎｅｒａｔｅｄｓｅｑｕｅｎｃｅ．Ｓｅｃｏｎｄｌｙ

，ｉｔｕｓｅｄｔｈｅｉｎｐｕｔｆｅｅｄｉｎｇａｐｐｒｏａｃｈｔｏｔｒａｃｋｔｈｅａｔｔｅｎｔｉｏｎｄｅｃｉｓｉｏｎｉｎｆｏｒｍａｔｉｏｎ

ｏｆｇｅｎｅｒａｔｅｄｓｅｑｕｅｎｃｅｆｏｒｉｍｐｒｏｖｉｎｇｔｈｅｍｏｄｅｌｏｕｔｐｕｔａｃｃｕｒａｃｙ．ＥｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｏｎＮＬＰＣＣ２０１８ｄａｔａｓｅｔｓｓｈｏｗｔｈａｔｔｈｅ

ｐｒｏｐｏｓｅｄｍｏｄｅｌｏｂｔａｉｎｓａｈｉｇｈｅｒＲＯＵＧＥｓｃｏｒｅｔｈａｎｔｈｅｂａｓｉｃｍｏｄｅｌ，ｗｈｉｃｈｃｏｎｆｉｒｍｓｔｈｅｆｅａｓｉｂｉｌｉｔｙｏｆｔｈｉｓｍｏｄｅｌ．

Ｋｅｙｗｏｒｄｓ：ａｕｔｏｍａｔｉｃｓｕｍｍａｒｉｚａｔｉｏｎ；ｃｏｐｙｉｎｇｍｅｃｈａｎｉｓｍ；ｉｎｐｕｔｆｅｅｄｉｎｇａｐｐｒｏａｃｈ；ｐｏｉｎｔｅｒｎｅｔｗｏｒｋｓ；ｓｅｑｕｅｎｃｅｔｏｓｅｑｕｅｎｃｅ

（ｓｅｑ２ｓｅｑ）；ａｔｔｅｎｔｉｏｎｍｅｃｈａｎｉｓｍ

　　随着互联网技术的不断发展，数据量也在不断增大，信息

过载现象开始变得明显。如何有效解决人们快速、准确地获取

文本中的主题信息已成为自然语言处理领域的一个研究热点。

自动摘要作为一种文本解释的重要工具，其通过对源文本进行

压缩和精炼，可提取出能概括源文本主题的关键信息，为下游

应用（如新闻摘要、搜索引擎以及报告生成等领域）提供有效

支持，极大提高了用户获取信息的效率。通常，自动摘要可分

为抽取式摘要和生成式摘要两类

［１］

。抽取式摘要指的是不对

源文本句子进行修改，而是直接抽取出关键句子组成摘要，基

本思想是先通过一定的方法对源文本中每个句子计算其得分，

选出得分较高的句子组成摘要；而生成式摘要则是计算机通过

对源文本进行充分理解后，对文本进行抽象，然后使用语义相

近的词或短语重新组织句子生成摘要，其形式类似于人工编写

的摘要，更符合人们的阅读习惯。自动摘要现已成为自然语言

处理领域的研究热点之一。

１　相关工作

自动摘要传统的研究技术是基于抽取式方法

［２］

。Ｃａｒｂｏｎｅｌｌ

等人将相关性和新颖性相结合，提出了最大边际相关（ｍａｘｉｍａｌ

ｍａｒｇｉｎａｌｒｅｌｅｖａｎｃｅ，ＭＭＲ）算法，该方法可有效减少摘要的冗

余；

Ｍｉｈａｌｃｅａ等人提出了一种图排序的ＴｅｘｔＲａｎｋ算法，与其他

抽取式方法相比，所构建的模型优势更明显；Ｅｒｋａｎ等人使用

图对句子进行表示，通过特征向量中心性的概念计算句子重要

性，在

ＤＵＣ２００４数据集上评估得到了排名第一的成绩；余珊

珊等人

［３］

将标题、段落等信息引入ＴｅｘｔＲａｎｋ网络图中，提出的

ｉＴｅｘｔＲａｎｋ算法提高了抽取式方法的摘要准确率；刘彼洋等

人

［４］

提出了一种将矩阵分解与子模最大化相结合的面向微博

短文本自动摘要方法，有效改善了基线系统的摘要性能。

近年来，基于神经网络的编码器—解码器模型在解决

ｓｅｑ２ｓｅｑ

［５］

问题上表现优异，如机器翻译

［６，７］

、文本生成

［８］

等任

务都在这类模型上取得了成功，因此，基于神经网络的生成式

方法已成为现今自动摘要的研究热点。Ｒｕｓｈ等人

［９］

将词袋模

型（ｂａｇｏｆｗｏｒｄｓ）、ＣＮＮ（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋ，ＣＮＮ）和基

于注意力（ａｔｔｅｎｔｉｏｎ）的三种不同编码器用于编码源序列，在

ＤＵＣ２００４数据集上得到了基准摘要模型；Ｃｈｏｐｒａ等人

［１０］

则采

用基于注意力的卷积编码器，实现了解码过程中目标序列和源

序列词的对齐，改善了文献［９］的基准模型；Ｈｕ等人

［１１］

构建了

第３７卷第８期

２０２０年８月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ．３７Ｎｏ．８

Ａｕｇ．２０２０

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38657984

粉丝: 4
资源: 943

提高中文摘要准确率：融合复制机制与input-feeding的seq2seq模型

alexa_dog-feeding-tracker：喂狗时跟踪Alexa的技能

android-coco2d-snake-feeding-game:用 coco2d 制作的喂蛇游戏

无监督异常检测论文集

R语言怎么写读取一个叫flucs的Excel表，并构建feeding～toughness广义线性模型，得出结论

data:{ "id": "序", "feeding_age": "日龄(天)", "feeding_total_feeding": "日总饲喂量(L)", "feeding_up": "早占比(%)", "remark": "备注", }微信小程序中怎么去掉data中的id

ValueError: When feeding symbolic tensors to a model, we expect the tensors to have a static batch size. Got tensor with shape: (None, 16)

帮我用HTML写一个宠物喂养页面

paddle.fluid模块通过什么方法实现网络构建，请代码示例

使用JAVA先说明由几个类；然后确定类和类（接口）的关系，画出类图；再编程来实现模拟一下开心牧场；农场中有农户，各种动物（牛，马，羊，鸡等），农户可以喂养动物；

最新资源