摘要提取方法设计与评价

8 浏览量更新于2023-12-10 收藏 844KB PDF 举报

原创文章

机器学习技术

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

埃及信息学杂志（2013年）14，195开罗大学埃及信息学杂志www.elsevier.com/locate/eijwww.sciencedirect.com原创文章通过摘录摘要提高阅读困难K. Nandhini*，S.R. 巴拉孙达拉姆印度Tirucirappalli国家技术学院计算机应用系接收日期：2013年4月8日;修订日期：2013年7月3日;接受日期：2013年2013年10月19日在线提供摘要本文描述了一种帮助有阅读困难的学习者的摘要提取方法的设计和评价。由于现有的摘要方法固有地将更多的权重分配给重要的句子，因此我们的方法以良好的准确性预测对目标受众重要且可读的摘要句子。我们使用有监督的机器学习技术来提取科学和社会主题的摘要，教育文本。从文本中提取用于预测重要句子的现有文献中的各种独立特征和用于预测可读句子的建议学习者依赖特征，并用于自动分类。我们对该方法进行了内外部评价，其中内部评价采用F-测度和可读性分析。外部评价包括使用Likert量表的学习者反馈和使用方差分析的辅助摘要对提高阅读困难学生的可读性的效果。结果显示，使用辅助摘要后，目标受众的可读性显著提高。©2013制作和主办由Elsevier B.V.代表计算机与信息学院开罗大学。1. 介绍在过去的五十年里，文本摘要的研究在信息检索、情报收集、信息抽取、文本分析等*通讯作者。电子邮件地址：nandhinikumaresh@yahoo.co.in（K. Nandhini）。开罗大学计算机和信息系负责同行审查。挖掘和索引[1自动文档摘要是在保留重要语义内容的前提下减小文档大小的过程。其目的是在不阅读整个文档的情况下识别文档的摘要。摘要的主要目的是在文档中以较少的空间呈现主要思想。摘要技术在普通读者中有着广泛的应用，如概述、要点、概念图等.当专注于特定的受众群体时，需求和目的也会相应地变化。在包括电子学习在内的各种应用程序中，都可以考虑对摘要的需求。最近，在大多数学术部门中，电子材料的使用有了巨大的增长。许多机构为课程准备课堂讲稿和阅读材料，并提供这些材料1110-8665© 2013由Elsevier B. V.代表开罗大学计算机与信息学院制作和主办。http://dx.doi.org/10.1016/j.eij.2013.09.001制作和主办：Elsevier关键词文本摘要;抽取式摘要;机器学习;朴素贝叶斯分类器;辅助阅读196 K。 Nandhini，S.R. 巴拉孙达拉姆这些材料的主要问题之一是它们必须简单，可读和所有人都能理解。许多有学习困难的学生在阅读理解方面普遍存在缺陷，这表明了系统的学习策略指导的重要性。摘要在理解文本中的作用对于有阅读困难的学习者是重要的[4]。有学习困难的学生性质各异，包括阅读困难、数学困难、写作困难或任何其他与学习过程有关的问题。由于阅读是生活中不可或缺的一部分，我们主要关注有阅读困难的学习者。阅读困难的学生在理解和组织文本信息方面面临着重大挑战。[5]或者是作为几种策略之一[6]，总结被证明可以提高理解和回忆所读的内容[7]。作为一种在阅读过程中或阅读后执行的策略，总结有助于读者专注于已经教授的主要思想或其他关键技能概念，而忽略不相关的概念[8]。理解的行为需要三个基本要素：（1）读者，（2）文本，（3）活动。对于有阅读困难的学习者，可以使用活动（总结）来帮助他们进行阅读理解。然而，学习者的问题无法治愈，但可以通过补救或支持性工具来治疗。有各种各样的工具来补救或提高技能，如单词识别，互惠教学[6]，触发词教学[11]，图形组织者[12]等，并不是所有的工具都可以通过补救教学受益，因为能力，年龄和适合性。在这种情况下，提供支持是绕过残疾的下一个替代解决办法。当学员在辅导课程下没有显著成效时，另一个选择是通过辅助工具为学员提供支持。有许多辅助工具，以支持，仅举几例是BrowseAloud，SpeakOut等。但阅读的最终目的是理解文本，这是较少探索的。为了理解给定的文本，摘要是学习者必须应用的重要策略之一[13]。如果学习者在应用摘要策略方面有问题，那么他/她将受益于替代解决方案，即从文本中提取重要内容摘要系统的设计和评价必须与三类上下文因素有关，即输入因素、目的因素和输出因素[9]。大多数可用的摘要系统都是为通用而设计的。针对盲人[14]、聋人[15]等残疾人的文摘存在多种专门版本，其受众和目的主要决定了系统的设计和评价[16]。我们的目标受众是有阅读困难的学习者，他们能够解码，但难以更好地理解内容。这些学生中的许多人在寻找主要思想和重要的支持细节方面存在困难。未能采用适当的学习策略往往是学习障碍的关键组成部分[17]。辅助摘要的目的是帮助阅读困难者提高文本的可读性，从而更好地理解内容。目标受众难以理解文本的主要原因考虑到诸如不熟悉的词汇[18]、触发词[11]、多音节词[19]和名词实体[20]，以减少工作分类的困难。我们的方法深入研究提取的句子是重要的，以及可读的目标受众。我们的目标是提取包含重要，可读句子的摘要。为了解决这个问题，我们提出了一套学习者相关的可读性相关的功能，结合现有的功能集提取重要的句子。使用朴素贝叶斯分类器，将句子分类为摘要或非摘要，并根据比率基于个体特征的加权得分提取句子。我们进行了两种类型的评估，以评估摘要的表现，特别是外部评估，阅读困难的理解任务。本文的其余部分组织如下。在第二节中，我们讨论了文本摘要的相关工作。第3节介绍了摘要提取的拟议方法。在第4节中，从所提出的方法的结果进行了分析，使用内在和外在的评价。2. 相关工作各种文本摘要方法的研究已经提出和评估。摘要的任务主要有两种方法，即提取和抽象[3]。提取涉及将从语料库中提取的内容连接成摘要，而抽象涉及从从语料库中提取的信息生成新颖的句子。提取摘要技术可以进一步分为两类：依赖于预先存在的文档摘要对的监督技术，以及基于从文本中导出的属性和分类的非监督技术。监督提取摘要技术将摘要任务视为句子级别的两类分类问题[21，22]。通过利用句子的不同特征和关系，已经开发了许多用于文档摘要的无监督方法[23，24]。早期的文本摘要研究利用了各种特征，如词频[1]，句子位置[25]，提示短语[26]，句子长度和大写字母[21]，通过利用机器学习技术，可以从文档语料库及其相应的摘要中学习规则。基于语料库的方法的主要优点是易于实现。目前所做的大量摘要工作还没有涉及摘要使用，摘要使用主要决定了系统的设计。摘要的主要缺点是可读性差.由于可读性是文本摘要的重要组成部分[29]，因此提取摘要缺乏衔接和句子顺序。为了达到可读性的摘要，提取的句子必须适当排序[29，30]。Yeh等人提出了一种使用朴素贝叶斯分类器的改进的基于语料库的方法[22]。我们的想法是将学习者相关的特征与现有特征和使用GA计算的特征权重相结合。文本摘要的评价可以分为内在评价和外在评价两种。的Qj1通过为有阅读困难的学习者提供摘录摘要来提高可读性197摘要的质量可以直接基于各种标准进行评估，如摘要的简洁性[32，33]、源文件中规定的“关键/基本思想”的覆盖范围外部评估根据摘要对其他任务完成的影响来衡量摘要的质量。举几个例子，问题2.1. 基于语料Kupiec等人提出了一种监督机器学习算法，使用朴素贝叶斯分类器训练摘要器[21]。对于每个句子S，在给定N个特征的情况下，它被归类为摘要句Naive Bayes规则如下：Ps 2 S j F 1; F 2;. Fn3.1. 特征提取摘要的特征提取主要取决于摘要的目的和目标受众。这些特征必须代表文本的重要性，学习者的困难因素和应用的动机。为了从文本中识别重要的句子，可以使用句子位置[25]，中心性[36]，标题相似性[21]和关键字出现等”[26]他说。摘要的使用是为了帮助阅读困难。由于可读性是要考虑的主要因素之一，我们使用了Flesh-Kincaid[37]和FOG[38]指标使用的特征，例如每个句子的平均单词，每个单词的平均由于工作记忆的限制，具有更多实体的句子对于用户来说更难进行语义编码[20]。因此，特征名词出现率衡量的是读者为了理解句子而必须记住的每个句子的平均实体数量。正如学习者可能有PF1; F 2;. Fn j s 2 SPs 2 SPF 1; F 2;. Fn假设特征的统计独立性：QnPFjjs2SPs2Sð1Þ在映射触发词的问题[11]中，每个句子的平均触发词被认为是另一个特征。学习者相关特征的重要性在[39]中详细讨论。其目的是提取重要的和可读的意义-作为总结。教育教科书Ps2SjF 1;F 2;... 简体中文nj¼1 PFj用于评估。文件的内容被分割成句子。然后我们从每句话中提取出来P（s€S）是常数，P（F j|s∈S）和P（F j）可以被估计。直接从训练集中通过计数事件进行配对。这产生了一个简单的贝叶斯分类函数，该函数为每个S标记-，这是一个分数，可以用来选择要包含在生成的摘要中的句子。Yeh等人提出了使用可训练摘要器的改进的基于语料库的方法，该方法考虑了句子位置、关键词、中心性和标题相似性等特征，并使用遗传算法计算特征权重[22]。Fattah和Ren研究了每个句子特征对摘要任务的影响，并将所有特征组合起来训练遗传算法（GA）和数学回归（MR）模型，以获得合适的特征权重组合。3. 拟议方法使用可训练摘要器，提取现有的特征，如句子位置，关键字，标题相似性和中心性以及建议的特征，如句子长度，触发词，多音节词和名词出现。句子得分使用特征的加权组合来计算，其中权重使用遗传算法来计算。这项工作的主要目标是总结给定的文本。每个句子都由一组预定义的特征（F1，F2，.）表示。，Fn），然后使用监督学习算法来训练摘要器，以基于特征向量来提取重要且可读的句子。为了执行这种提取，需要潜在的特征，分类器和文档摘要对的训练语料库。摘要提取的流程图见图10。1.一、考虑以下特征，因为它们考虑提取摘要句子的重要性和可读性时态，并将每个句子表示为实义词的向量，带有名词或动词标记的词被认为是实义词。3.1.1. 信息特征3.1.1.1. F1-句子位置。句子位置是决定句子在文献中重要性的一个重要因素[25，26]。句子位置的意义在各个领域都起着重要的作用。摘要中包含的重要句子通常位于特定位置。在教育文本中，边界承载着重要的信息。3.1.1.2. F2-标题与句子的相似性。标题包含一组单词，这些单词提供了关于文本概念的重要线索[21，26]。如果句子与标题词有较高的交集，则使用表1中给出的公式计算句子的分数。3.1.1.3. F3-中心性。句子的中心性意味着它与其他句子的相似性[36]。如果一个句子具有更高的中心度，那么这些句子是被包括在摘要中的最佳候选者。3.1.1.4. F4提示短语。句子包含提示短语，如定义为，所谓的，重要的，手段，重要的，等等，包含将被添加到重要类别类别中的重要定义[26]。3.1.1.5. F5-关键字。单词的重要性由其词频决定，词频计算如下：¼--表1信息特征。S. 1号特征F1：句子位置式SP最大值;.Σ1 1i n- in 12F2：标题与句子相似度TS¼ pP pPni¼1μA ×i¼1μ BPn1/1ﬃﬃﬃ AiXBi2n23F3：中心性简体中文i中的单词[其他S中的单词]i中的j个单词\其他中的单词Sj45F4：提示短语F5：关键词如数据库TFi¼ PTinTKNnik¼1;ISF¼log评分=TF*ISF表2S. 6号可读性特征。特征F6：句子长度式美国手语#我的世界#我的世界#长度Si7F7：触发词PTW¼ #触发器r字在Si中8F8：多音节词PPSY¼长度Si#多音节词中的Si长度Si9 F9：名词出现PNE¼#在Si中的属性名硅长度198 K。 Nandhini，S.R. 巴拉孙达拉姆图1汇总过程。为了表明这些特征是有贡献的，并且是相互独立的。分析了个体特征在摘要句预测中的相关性。在可读性研究中，分析的重点是相关性。相关系数（r=）是描述性统计量，范围为+1.00至0.0或0.0至1.00。+1.00和1.00表示完全相关，取决于元素是正相关还是负相关。为了研究这些特征之间的关系，我们分析了原文和摘要版的文本。第4.2节解释了摘要提取中个体特征（信息特征）的相关性。3.1.2. 可读性特征由于目标受众有阅读困难，提取易于理解的句子的功能有助于他们阅读，从而更好地理解文本。3.1.2.1. F6-句子长度。造成语篇理解困难的主要原因是个体的工作记忆问题。读者无法整合句子中出现的单词的语义。当句子长度较大时，学习者可能无法完全整合。由于短期记忆和测序困难，通过摘录摘要提高阅读困难学习者的可读性199学生在理解课文时可能会迷失方向，因为他们没有记住重要的事实，因此不能完全理解课文。3.1.2.2. F7触发词。出现更多的重复单词会分散阅读障碍者的注意力[41]。具有较高触发词数量的句子被认为是难句。文本中触发词的百分比可以使用表2中给出的公式计算。3.1.2.3. F8-多音节词。包含较长和频繁（难）词的句子很难理解。具有较高数量的难词的句子被认为是难句。更难解码的单词将增加理解的难度平均音节数和平均句子长度被用来确定文本的阅读难度，如SMOG[19]。因此，一个单词中的音节数也是衡量单词难度的一个指标。本文中多音节词的百分比可按表2计算。3.1.2.4. F9-名词出现。在文本中引入的名词的数量与其目标读者的工作记忆负担有关，例如阅读障碍[20]。名词在单个句子中的一般来说，含有较多专有名词的句子是一个重要的句子，它最有可能被包括在总结中。但对于有困难的读者来说，更多的名词会造成混乱。3.2. 概要生成句子得分可以通过所有特征的线性加权组合来计算。在这项工作中，特征提取的文本。摘要生成可以被视为使用朴素贝叶斯分类器的两类分类问题[21]，其中如果句子属于提取参考摘要，则将其标记为摘要，否则将其标记为非摘要。4. 评价4.1. 数据集本研究以四年级至七年级的教育教材为研究对象，共收集了一百篇文章。文本主要来自科学和社会学科，因为社会学科和充满抽象概念的科学概念的数量是阅读困难所面临的挑战。文本基本上属于语言的两个层次，一个是从[42]第二种是经典，第三种是经典。语料库的统计数据如表3所示。本文的参考摘要由三个独立的人工注释者手动创建。其中一个根据句子的重要性进行排名，另一个根据句子的难度进行排名，第三个分数是它是容易的、困难的或平均的。参考摘要分类时考虑相对分数摘要中包含的每个句子的重要性得分最高的句子将根据。4.2. 特征相关性为了证明单个特征的效果，每个特征必须是独立的，并且特征和类之间的相关性要好。为了预测特征的相关性，需要考虑gold summary和注释者等级。对于信息特征，特征与黄金摘要之间存在正相关关系.各种特征的相关系数见表4。可读性特征与类之间存在负这表明，当特征得分增加时，进入摘要类的可能性较小。各种可读性特征的相关系数如表5所示。负相关表明，如果这些特征值增加，则句子的难度增加。然而，这些特征与类别显示出正相关或负相关，并且特征之间的相关性极小或没有相关性。4.3. 特征意义在我们的实验中，使用70%和30%的数据集进行训练和测试。下表3显示了样本数据集中各个特征的影响。表中列出了单个特征的平均F-测度的影响。符号及其说明见表6。从表7中可以明显看出，在如表8所示的10%压缩率的情况下，与其他特征相比，像肯定关键字、触发词的百分比、多音节词的百分比和句子位置的特征具有更高的分数。由于数据集基本上属于教育文本，关键词的重要性更多地体现在定义和解释方面。触发词的出现与句子中的内容词成反比。触发词的百分比在分类中起着重要作用。当复音词的出现率约为课文的20%时，由于文本的性质，句子位置具有下一个更高的F测量表3数据集的统计单据数平均发送次数。根据文件。最大发送数量。根据文件。发送的最小数量。根据文件。总结为doc %。长度平均摘要大小（发送数量）最大发送数量。根据摘要发送的最小数量。根据摘要100183811百分之三表4S. 1号2345信息特征的相关性。特征句子位置标题相似度基数提示短语关键词相关系数.52.471.35.37.41200K. Nandhini，S.R. 巴拉孙达拉姆关键词或单音节计数的百分比，F-措施时，与其他相比更高。这些特征在该语料库中具有负面影响。另一方面，当考虑除名词实体的中心性或百分比之外的所有特征时，F-测度保持不变。这些特征在语料库中具有中性除此之外，还考虑了平均句长、复音词百分比、句位、词频、标题相似度等特征。F-测度减小，这表明这些特征在数据集中具有积极的影响。当考虑除句子长度之外的所有特征时，F-度量非常低，因此对于10%的压缩率是重要的特征。同一中心性特征分别具有负效应和正效应。当压缩率为20%和30%时，以及当压缩率较高时，由于要考虑的句子数量较多，中心性特征具有其效果。30%压缩率的最佳组合特征是平均句子长度、触发词百分比、句子位置、术语频率、标题相似度、积极关键字、中心性和名词出现百分比。由于负关键词和单音节词的百分比等特征对数据集的负面影响，因此忽略了这些特征。使用精确度、召回率和F-测量来评估信息特征、可读性特征和组合特征的效果。可以用具有黄金摘要的系统的摘录表9显示了一组样本文档的平均精确度、平均召回率和平均准确度。基于文本的特征集中于提取重要句子，而基于学习者的特征集中于提取与理解能力相关的句子。很明显，当使用组合特征时，分类器的准确性增加。这种抽取简单易懂句子的思想，并不影响抽取重要句子的准确性4.4. 内在评价摘要的质量取决于它与手动摘要之间的覆盖率。将组合特征模型与基线方法Lead方法（根据压缩率总结文本的前N个句子）以及各种压缩率的MCBA[31] 精密度结果见表10。当压缩率为10%时，基线方法和MCBA产生几乎接近的结果。但当比率增加时，它们之间的差异是显著的。在10%、20%和30%的情况下，所提出的模型的预测效果分别比铅法好4.6%、18.3%和27.2%。但与MCBA相比，其产量分别为3.2%、4.2%和8.2%。其原因在于，所提出的模型与MCBA的区别仅在于一组用于提取可读句子的特征，并降低了学习者的难度。其目的不是通过精确度或重新调用来提高性能，而是提高所提取句子的可读性随着浓度的增加，各个特征的影响程度不同.对于30%的被试，平均句长、复音词比例、词频和正性关键词得分较高。在10%压缩率的情况下，当考虑所有特征时，F-度量为0.284。然而，当我们使用所有的功能，除了积极的关键字，或消极的表5可读性相关特性的相关性。S. 号1234特征平均句子长度相关系数-.37复音词百分比-.31-.35名词实体-.39表6 符号。S. 号符号1ASL2PTW3SP4TF5TS6PKey7n密钥8岑9PPSY10PNE11PMSY特征平均句子长度词频标题相似度正关键词负关键词中心性复音词所占百分比名词实体所占百分比单音节词所占百分比表7S. 1号234567891011个体特征的F-度量。特征ASLPTWSPTFTSPKeyNkeyCenPPSYPNEPMSY百分之十0.1670.2340.2050.1740.1700.2880.1470.1770.2270.1740.155百分之二十0.4540.4190.3630.4380.2940.4660.2480.3920.4460.305百分之三十0.5900.4690.4500.5480.4710.5020.3590.4500.5700.425表8S. 1号234567891011Leave one out功能统计。特征ASLPTWSPTFTSPKeyNkeyCenPPSYPNEPMSY百分之十0.257（+）0.259（+）0.237（+）0.257（+）0.297（-）0.285（）0.241（+）0.289（）0.295（-）0.299（-）百分之二十0.513（+）0.532（+）0.499（+）0.5270.527（+）0.572（-）百分之三十0.738（+）0.738（+）0.686（+）0.745（-）0.483（+）0.567（-）0.573（-）0.561（-）0.703（+）0.661（+）0.722（+）0.741（-）表9基于类别的特征。特征平均值平均精度召回平均值准确性可读性特征 0.75 0.800.76资料性特征组合特征通过摘录摘要提高阅读困难学习者的可读性201表13各种可读性指标的特征。可读性度量雾可读性公式词汇特征3.0680+ 0.877\ ASL+ 0.984\% MSW雾霾3 + Sqrt（PSW数量）。语法特征平均句子长度ASL（隐式）Flesch金凯德0.39\平均单词数/句子+11.80\平均音节数/单词-15.59单音节百分比单词（MSW）多音节字数统计（PSW）每个单词的ASL表10与MCBA和铅方法相比的性能评价（精密度）百分之十百分之二十百分之三十铅MCBA提出铅MCBA提出铅MCBA提出Set10.330.330.330.4230.50.50.50.660.83Set20.330.250.330.330.50.50.530.50.66Set30.40.50.50.50.560.660.40.830.83Set40.20.250.40.50.650.750.660.750.8Set50.40.40.330.40.60.660.50.80.83平均0.3320.3460.3780.43060.4820.6140.5180.7080.79表11与MCBA和导联方法相比的性能评价（回忆）。百分之十百分之二十百分之三十铅MCBA提出铅MCBA提出铅MCBA提出Set10.30.250.250.40.3750.4750.3750.50.625Set20.30.1250.250.50.350.3750.3750.250.5Set30.20.50.50.50.550.6660.40.8330.833Set40.30.1420.2850.40.4280.4280.50.4280.571Set50.40.2850.2850.40.4280.5710.50.5710.714平均0.3010.2600.3140.440.4060.5030.430.5160.648表12与MCBA和铅方法相比的性能评价（F-测量）。百分之十百分之二十百分之三十铅MCBA提出铅MCBA提出铅MCBA提出Set10.3140.2840.2840.4110.4280.4870.4280.5680.713Set20.3140.1660.2840.3970.3330.4280.4390.3330.568Set30.2660.50.50.50.5540.6620.40.8310.831Set40.250.1810.3320.4440.5440.5440.5680.5440.666Set50.40.3320.3050.40.4990.6120.50.6660.767平均0.3090.2930.3410.4300.4720.5470.4670.5890.709所提出的模型的性能可以与现有方法在召回方面进行比较，如表11所示。在不同压缩率下，该模型的平均重呼率相对基线方法分别提高了1.2%、6.3%和21%。在MCBA的情况下，相对改善为5%、9.6%和13.2%。在错误分类方面，与基线方法及MCBA相比，建议模型表现较佳，分别高达21%及13%当压缩率为10%、20%和30%时，与Lead方法相比，所提出的方法的 F- 测度相对提高分别为 3.2% 、 11.6% 和24.2%。与MCBA模型相比，该模型分别提高了4.8%、7.4%和12.04%在10%、20%和30%的情况下分别有改善，并在表12中示出。实验结果表明，在不同压缩率下，该模型在查准率、查全率和F-测度等方面都有明显的提高由于目标是提高可读性，因此可以使用各种现有度量来测量所提取的摘要的可读性。4.5. 可读性Dale和Chall提出了以下可读性的定义[44]：可读性是以下各项的总和（包括交互）：202K. Nandhini，S.R. 巴拉孙达拉姆表14各种指标中摘要的可读性。Flesch Kincaid Gunning狐狸指数SMOG指数基线MCBA提出基线MCBA提出基线MCBA提出Set12.83.22.65.75.85.24.44.44.4Set26.25.45.48.788.16.366Set33.13.12.54.94.94.81.81.81.8Set46.66.45.810.610.49.67.87.77.1Set54.84.34.27.67.57.55.45.45所有这些因素在一个给定的一块印刷材料，影响成功，一组读者与它。成功是他们理解它的程度，以最佳速度阅读它，并发现它很有趣。本文中使用的术语可读性是指读者阅读和理解文本的容易程度。迄今为止，存在许多可读性度量方法，它们使用简单的线性函数，并结合两个或三个浅层语言特征。这些浅层语言特征是词汇和句法特征。基本上，词汇特征侧重于测量单词的难度，例如单词中的音节数，单词中的字符数和词频。句法特征主要是用平均句长来衡量句子的难易程度。为了预测文本的可读性，我们考虑的指标是FOG[38]，SMOG[19]使用平均句子长度和至少有三个音节的单词的百分比作为参数，Flesch Kincaid[37]使用平均句子长度和每个单词的平均音节来计算文本难度。不同的可读性公式可能会对同一段文本给出不同的分数，因为它们对文本的各个方面给予不同的权重，如表13所示。通过不同的可读性指标来在总结文本之后，可读性的增加将投射文本的词汇和句法复杂性。总的来说，从这些比较中可以很容易地得出摘要对可读性的影响。拟议模型的可读性相对优于现有模型，并列于表14中。虽然差异较小，但预测的品位水平低于其他模型。在SMOG的情况下，可读性的差异是非常小的，因为它只考虑多音节词。的分数在Flesch Kincaid的情况下稍高，包括ASL以及单音节词，并且它认为包括触发词的所有词都是单音节的，但是这些学习者与其他学习者相比在触发词方面有问题。这些指标都没有考虑到平均句子长度，多音节词，触发词和年级词汇等特征。4.6. 外在评价研究中纳入了15名四至七级的阅读困难儿童。一个由15名没有阅读困难的参与者组成的对照组也参加了实验。实验分为两部分，1. 使用李克特量表回馈的学习者自我知觉。2. 客观型理解题对测量总结的影响。通过用户调查，我们推断了参与者在文本阅读和理解中如何受到辅助摘要的影响。4.6.1. 学习者自我知觉的Likert量表反馈可读性文本的可读性可以通过向参与者提出主观问题来衡量，即理解给定文本的容易程度。李克特量表可以用来测量教育研究中的语篇元理解能力。调查问题包括1. 辅助摘要是否有助于提高文本的可读性2. 下面哪一个总结是有用的/容易的？图2李克特量表反馈。图3用户偏好汇总。通过摘录摘要提高阅读困难学习者的可读性203表15辅助摘要对学习者研究性理解的影响学习者汇总办法是说SD计数阅读困难随机1.930.6315提出3.330.6615总2.631.13630非阅读困难随机1.930.20915提出2.260.6315总2.10.4330调查问题一有助于预测可读性的摘要使用。图2显示了用户对辅助摘要收益（可读性）的同意。在可读性方面，阅读困难在提高文本可读性的辅助摘要中一致（0.8）。而对于非困难的学习者（0.4），发现它不太有用。很少有人报告说，这会误导他们不关注文本中的其他句子。很少有人强烈认为它非常有用。在调查问题二的情况下，参与者被给予阅读测试中提到的三篇课文。并分析了哪些摘要有助于学生更好地阅读课文。学习者的反馈在总结偏好中如图所示。3 .第三章。所提出的方法生成的摘要主要是阅读困难者和非阅读困难者的偏好。然而，由于铅的凝聚性和随机性，他们中很少有人选择铅。总结的另一种外在评价是阅读理解任务[45，35]。在这样的评估中，用户被给予完整的源或补充有摘要的全文，以及与完整的源信息相关的多项选择问题。然后，系统可以计算它们在给定条件下的测试中的表现。这种评估框架依赖于这样一种想法，即真正的信息摘要应该能够作为完整源的辅助摘要。我们认为这一摘要是辅助性的，而不是取代原文。4.6.2. 客观型问卷测量对文本信息的理解的直接方法是通过客观的理解问题，例如在理解的生理研究中使用的多项选择或是/否。每个文本使用六个问题进行评估，其中四个是事实问题，其中两个是推理问题。本研究测量了在回答理解问题时辅助摘要对阅读困难的影响。分析了学习者（阅读困难和非阅读困难学习者）在有和没有辅助摘要（引导和建议）的情况下的反应。下面列出的主要问题是1. 使用摘要阅读策略与传统阅读策略的学生在阅读理解方面是否有显著差异。2. 使用建议教学法或基线教学法的学生在阅读理解方面是否有显著差异。为了检验辅助摘要对阅读理解中阅读困难的影响，计算这个因素。表15.列出平均值和标准差，以及每组的总体值在阅读困难的问题中，虽然辅助概括对回答问题有显著的效果，但正确回答事实性问题的数量要多于推理性问题。从分析中可以清楚地看出，辅助摘要在阅读困难中提高了可读性和回忆性，而不是以更好的方式理解它。各组平均值的比较显示，拟定组（M=3.33）的表现通常优于基线组（M=1.93）。在对学习者的影响方面，RD（M=3.33）和NRD（M=2.26）在学习者中存在差异。为了计算统计学显著性，将数据提交给具有辅助总结方法的双向ANOVA，学习者作为组变量之间的从双因素方差分析的结果来看，F（1，14）=10.36，P=.00\，辅助摘要对阅读理解有显著影响。此外，学习者F（1，14）=1.52，P= 0.004也有显著影响。这意味着摘要对阅读困难的影响比非阅读困难更大很明显，由于考虑到可读性相关的特征，拟议的摘要比现有方法对阅读困难有显著影响。当文本很难时，从文本中提取摘要也很难。因此，理解需要通过各种简化策略来提高5. 结论本文提出了一种新的应用提取求和的阅读困难的学习者。本文的主要贡献是提出了一套与学习者相关的特征来提取易于理解的摘要。对教科书和年级教育文本的实验结果表明，摘要方法的有效性和信息特征和可读性特征的综合效果。外部评估结果显示辅助摘要对提高目标受众的可读性有显著效果。摘要的连贯性不足是摘要的一个主要缺陷，提高摘要的连贯性，提取个性化摘要是我们未来的工作。引用[1] 卢恩河文献摘要的自动生成。IBM J 研究发展2002;2（2）：159-65.[2] Mani I，Maybury M.自动文本摘要的进展。麻省理工学院出版社，1999年。204K. Nandhini，S.R. 巴拉孙达拉姆[3] 哈恩乌、马尼岛自动摘要的挑战。计算机2000;33（11）：29[4] [10]杨文，李文，李文.运用研究性综合法提高学生对短文的理解能力。JLearn Disabil 2007;40（3）：210-25.[5] Armbruster B，Anderson T，Ostertag J.文本结构/摘要指导有助于从临时文本中学习吗？参见Res Quart 1987：331-46。[6] Palinscar A，Brown A.理解培养和理解监控活动的互动教学。认知指导1984;1（2）：117-75。[7] 国家阅读小组。教孩子阅读：基于证据的阅读科学研究文献评估及其对阅读教学的影响，国立儿童健康与人类发展研究所，国立卫生研究院; 2000年。[8] 卡米尔·M词汇和理解教学：国家阅读小组调查结果的总结和影响。2004：213-34.[9] Reutzel D，Smith J，Fawson P.使用科学信息文本教学阅读理解策略的两种方法的评估。 Early Child Res Quart2005;20（3）：276-305.[10] 洪磊，黄凯.两种不同的偏旁部首式小学语文阅读辅导方法。公牛特别教育2006;31：43-71.[11] 戴维斯R，布劳恩E.阅读障碍的礼物：为什么一些最聪明的人不能阅读以及他们如何学习，企鹅，小组; 2010年。[12] [10]李文，李文，李文.图形方案可能会提高可读性，但对有阅读障碍的人来说并不容易理解。NAACL-HLT; 2012年。[13] 杨文生，张文生，张文生，等.语篇教学对学习困难学生语篇理解的影响.中国英语学习杂志，2001，13（1）：117 - 118.ExceptChild 1992;58（6）：508-16.[14] 格雷芬斯特湾制作智能电报文本还原，为盲人提供音频扫描服务。见：AAAI春季智能研讨会工作笔记，文本摘要; 1998年。p. 111-8[15] 潘·范德甘斯特自动字幕的句子压缩：一种混合方法。收录于：ACL研讨会论文集，文本摘要; 2004年。p. 八九比九十五[16] 斯帕克 · 琼斯自动摘要：最先进的技术。 Inform ProcessManage 2007;43（6）：1449[17] 格雷夫斯A.直接指导和Meta理解训练对发现主要思想的影响。1986年，《残疾人研究》。[18] 薛昭，《词汇密度与阅读理解的关系》。阅读《外语》2000;13（1）：403-30。[19] Mc Laughlin G.烟雾分级-一个新的可读性公式。J Read1969：639-46.[20] 张晓鹏，李晓鹏，李晓鹏.可读性评估的认知动机特征。在：计算语言学协会欧洲分会第12届会议论文集; 2009年。p. 229比37[21] 放大图片作者：KupiecJ，Pedersen J，Chen F. 可训练的文档摘要器。在：第18届年度国际ACM SIGIR会议上的研究和信息检索的发展。ACM; 1995年。p. 68比73[22] 叶军，柯华，杨伟，孟毅.使用可训练摘要器和潜在语义分析的文本摘要。Inform ProcessManage 2005;41（1）：75-95.[23] Mihalcea R，Ceylan H.图书自动文摘的探讨。2007年自然语言处理和计算自然语言学习经验方法联合会议（EMNLP-CoNLL）。p. 380-9[24] 阿利古利耶夫河通过句子抽取的自动文档摘要。计算机技术2007;12（5）：5-15.[25] 机械制造索引技术文献和实验。IBM J Res Develop1958;2（4）：354-61.[26] 埃德蒙森·H自动提取的新方法。J ACM1969;16（2）：264-85.[27] Aone C，Okurowski M，Gorlinsky J.使用鲁棒的nlp和机器学习的可训练，可扩展的摘要。在：第17届计算语言学国际会议的会议记录，计算语言学协会，卷。1; 1998年。p. 62比6[28] 作者：Lin C.按位置确定主题。第五届应用自然语言处理会议论文集。计算语言学协会; 1997年。第283- 290页。[29] 刘晓波，王晓波，王晓波.多文档新闻摘要中句子排序的推理策略。J ArtIntell Res 2002;17：35-55.[30] 拉帕塔湾概率文本结构：句子排序实验。见：计算语言学协会第41届年会论文集，计算语言学协会，第1卷; 2003年。p.545-52[31] Fattah M，Ren F.基于GA、MR、FFNN、PNN和GMM的自动文本摘要模型。 Comput Speech Lang2009;23（1）：126-44.[32] Minel JL，Nugier S，Piat G.如何评价自动文本摘要的质量？在：ACL/EACL'97智能可扩展文本摘要研讨会的过程中，Citeseer; 1997年。p. 25-30[33] Brandow R，Mitze K，Rau LF.利用句子选择实现电子出版物的自动压缩。Inform ProcessManage 1995;31（5）：675-85.[34] 派斯CD。计算机构建文献摘要的技术与展望。Inform ProcessManage1990;26（1）：171-86.[35] Morris

下载后可阅读完整内容，剩余1页未读，立即下载