文档级机器翻译评价：基于加权词汇衔接的新方法

自然科学

论文

需积分: 9 48 浏览量更新于2024-08-08 收藏 433KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"贡正仙和李良友在《北京大学学报(自然科学版)》2014年第50卷第1期发表的文章‘基于加权词汇衔接的文档级机器翻译自动评价’探讨了改进的机器翻译自动评价方法。" 本文主要介绍了在文档级机器翻译自动评价领域的一种创新方法，即基于加权词汇衔接的评价策略。传统的词汇衔接评价方法（LC）被作为基础，作者提出了基于权重的词汇衔接（WLC）方法。WLC方法的核心是利用PageRank算法在文档的词图上计算词汇的权重。PageRank算法是一种广泛用于网络分析的技术，它能够识别出对整体结构有重要影响的关键节点。在WLC中，这一算法被应用到文档的词汇关系上，以确定哪些词汇对于维持文档连贯性更为关键。为了进一步优化，作者还引入了词性信息（POS tags）来引导PageRank算法，提出了偏重词性的WLC（PWLC）方法。通过这种方式，算法可以更倾向于那些在语义上对文档连贯性有重要贡献的词汇，如名词、动词等。实验结果显示，这两种新方法（WLC和PWLC）在文档级别的自动评价中与人工评价的相关性均超过了原始的LC方法。此外，论文还讨论了将WLC和PWLC结合后的效果。通过融合两种方法，BLEU（Bilingual Evaluation Understudy）和TER（Translation Error Rate）这两个常用的机器翻译评价指标在文档级别的评价性能得到了显著提升。BLEU衡量的是翻译结果与参考译文的n-gram匹配度，而TER则计算的是翻译错误的比例。这两种指标的改善表明，新提出的评价方法能更准确地反映翻译质量，特别是在文档级别的连贯性和一致性方面。关键词：词汇衔接、文档级评价、机器翻译、自动评价、PageRank。这些关键词凸显了研究的核心内容，即如何通过考虑词汇之间的连接性和权重，以及词性信息，来改进机器翻译的自动化评估，尤其是在长文本的连贯性评估上。这篇论文属于自然科学领域的学术论文，发表在2014年的《北京大学学报(自然科学版)》，并给出了DOI标识符，便于后续引用和检索。这项工作对于机器翻译研究和自动评价技术的发展具有重要意义，为提高机器翻译系统的质量和连贯性提供了新的思路和工具。

资源推荐

weixin_38730129

粉丝: 7
资源: 927

文档级机器翻译评价：基于加权词汇衔接的新方法

基于加权马氏迭代法的储层定量分类评价方法

基于加权结构相似度的图像融合质量评价

基于熵权法的线性加权评价模型

基于加权马尔可夫链修正的ARIMA 预测模型

基于加权最小二乘的宽带波束形成

线性加权综合评价模型

动态加权评价matlab

基于加权平均的融合算法设计

基于加权中值滤波的滚动导向滤波matlab代码

一种基于加权规则的SRAM选型优化方法

基于labview的加权均值数字滤波器

自动加权gcn算法实现反洗钱识别

基于注意力机制的加权策略

基于rssi的加权质心定位算法matlab

基于多特征融合的恶意文档检测

基于煤矿露天开采安全评价技术文献综述

改进critic法、critic法、熵权法、结合topsis法、线性加权法,多种定权综合评价代

基于属性加权的快速聚类算法

用matlab写一个基于加权最小二乘法的电压状态估计

基于结构相似性的加权修复算法

最新资源