"贡正仙和李良友在《北京大学学报(自然科学版)》2014年第50卷第1期发表的文章‘基于加权词汇衔接的文档级机器翻译自动评价’探讨了改进的机器翻译自动评价方法。"
本文主要介绍了在文档级机器翻译自动评价领域的一种创新方法,即基于加权词汇衔接的评价策略。传统的词汇衔接评价方法(LC)被作为基础,作者提出了基于权重的词汇衔接(WLC)方法。WLC方法的核心是利用PageRank算法在文档的词图上计算词汇的权重。PageRank算法是一种广泛用于网络分析的技术,它能够识别出对整体结构有重要影响的关键节点。在WLC中,这一算法被应用到文档的词汇关系上,以确定哪些词汇对于维持文档连贯性更为关键。
为了进一步优化,作者还引入了词性信息(POS tags)来引导PageRank算法,提出了偏重词性的WLC(PWLC)方法。通过这种方式,算法可以更倾向于那些在语义上对文档连贯性有重要贡献的词汇,如名词、动词等。实验结果显示,这两种新方法(WLC和PWLC)在文档级别的自动评价中与人工评价的相关性均超过了原始的LC方法。
此外,论文还讨论了将WLC和PWLC结合后的效果。通过融合两种方法,BLEU(Bilingual Evaluation Understudy)和TER(Translation Error Rate)这两个常用的机器翻译评价指标在文档级别的评价性能得到了显著提升。BLEU衡量的是翻译结果与参考译文的n-gram匹配度,而TER则计算的是翻译错误的比例。这两种指标的改善表明,新提出的评价方法能更准确地反映翻译质量,特别是在文档级别的连贯性和一致性方面。
关键词:词汇衔接、文档级评价、机器翻译、自动评价、PageRank。这些关键词凸显了研究的核心内容,即如何通过考虑词汇之间的连接性和权重,以及词性信息,来改进机器翻译的自动化评估,尤其是在长文本的连贯性评估上。
这篇论文属于自然科学领域的学术论文,发表在2014年的《北京大学学报(自然科学版)》,并给出了DOI标识符,便于后续引用和检索。这项工作对于机器翻译研究和自动评价技术的发展具有重要意义,为提高机器翻译系统的质量和连贯性提供了新的思路和工具。