模糊匹配提升机器翻译评测：新方法与BLEU性能

需积分: 9 151 浏览量更新于2024-11-14 收藏 307KB PDF 举报

机器翻译评测中的模糊匹配是一项重要的研究领域，特别是在当前众多自动化评估方法兴起的时代。由于人工评估在时间和经济成本上具有挑战性，开发能够准确反映翻译质量的自动化工具成为关键。主流的评测方法，如Papineni的BLEU（双语评价理解）和Doddington的NIST相关度量，主要依赖于句子与参考翻译的精确匹配。这些方法假设每个单词要么完全匹配，要么不匹配，即只有两种状态。本文作者刘洋和刘群提出了一种创新的策略，旨在解决机器翻译评测中的一个关键问题：在未匹配的词汇中可能存在被忽视的重要信息。他们提出了一个自动搜索模糊匹配词对的方法，这种方法允许一定程度的灵活性，即使两个词在翻译过程中没有一对一对应，也能识别出它们之间的相似关系。这与传统的全匹配原则形成了对比，模糊匹配考虑了词汇的语义和上下文关联，而非仅仅基于字面意义上的匹配。模糊匹配的核心在于计算相似度，这通常涉及到对候选词对进行语义分析，比如利用词向量、n-gram匹配或者基于深度学习的模型来捕捉词语的潜在含义。作者给出了一种具体的计算方法，通过实例来详细阐述这一过程，以便读者更好地理解和应用。实验结果显示，这种模糊匹配方法能够有效地挖掘出那些在传统方法下被忽视但实际具有意义的词对。更为重要的是，模糊匹配显著提高了BLEU等自动评测指标的性能。这意味着，通过引入模糊匹配，能够更全面地评价机器翻译的质量，从而提高评估结果的准确性和可靠性。此外，模糊匹配的概念不仅局限于BLEU，它也可以被应用于其他自动评测方法中，提升其整体效能。因此，模糊匹配是机器翻译评测领域的一个有价值的研究方向，对于优化现有评测体系以及推动机器翻译技术的发展具有重要意义。本文提出的模糊匹配策略对于改进机器翻译评测的精度和鲁棒性具有显著作用，是推动自动化评估方法进步的重要一步。在未来的研究中，可能会看到更多融合模糊匹配的评测工具出现，以满足日益增长的机器翻译质量需求。

机器翻译评测中的模糊匹配

刘洋

1,2

刘群

1,3

(中国科学院计算技术研究所, 北京 100080)

(中国科学院研究生院, 北京 100039)

(北京大学计算语言学研究所, 北京 100871)

E-mail: {

yliu, liuqun}@ict.ac.cn

摘要:

目前的大多数机器翻译自动评测方法都没有考虑在未匹配的词语中可能包含被忽略的

信息。本文提出一种在参考译文和待评测译文之间自动搜索模糊匹配词对的方法，并给出了

相似度的计算方法。模糊匹配和计算相似度的过程将通过一个例子进行说明。实验表明，我

们的方法能够较好地找到被忽略的、有意义的词对。更重要的是，通过引入模糊匹配，BLEU

的性能得到显著的提高。模糊匹配可以用来提高其他自动评测方法的性能。

关键词:

机器翻译评测；模糊匹配

1 Introduction

In recent years, many automatic metrics have been proposed for evaluating MT quality, as

human evaluation is much expensive and time-consuming. The most important goal of automatic

methods is to yield scores that correlate highly with human judgments of translation quality.

The dominant approach is to compute the closeness of a machine-translated sentence to several

reference translations

[1] [2]

. Papineni’s BLEU (Bilingual Evaluation Understudy) and Doddington’s

related NIST metric are two in common use today.

However, a serious problem for BLEU and NIST (may be include other metrics) is that they

allow only full matching (e.g., two words are either matched or not). They treat matched words as

relative to the source text and unmatched words as irrelative and not meaningful. Typically, there

are many “perfect” translations of a given source text. These translations may vary in word choice.

Thus, any deviations within MT output can be only partially attributed to errors. Although

multiple reference translations are used to alleviate the problem, there are still some meaningful

words that may be treated as unmatched words. In other words, some of the unmatched words are

indeed irrelative to the source text while some not. Neglecting these meaningful words may limit

the performance of N-gram translation evaluation metrics

[3]

This paper proposes a fuzzy matching strategy for machine translation. The central idea is that

we should allow the similarity of a word pair between zero and one. In section 2, we discuss the

rationale of fuzzy matching and then demonstrate how to search fuzzy-matched word pairs and

compute the similarity in detail. Experimental results and analysis are presented in section 3. The

final section is the conclusion and our future work.

下载后可阅读完整内容，剩余7页未读，立即下载

yeduoduo1985

粉丝: 0
资源: 14

模糊匹配提升机器翻译评测：新方法与BLEU性能

2021年第一期智能硬件评测报告-WiFi6路由器评测.pdf

2021年第一期智能硬件评测报告-手机拍照评测.pdf

ChatGPT技术在机器翻译评测中的应用.docx

ISTIC CWMT'2015机器翻译评测技术报告：维汉、藏汉、蒙汉项目分析

机器翻译技术与评测方法概览

算法-机器翻译质量评测算法-BLEU.rar

2015全国机器翻译研讨会ISTIC评测报告

人工翻译与机器翻译的质量评测实验报告-以电气设备类说明文本汉译为例

模糊神经网络的预测算法在嘉陵江水质评测中的应用

模糊神经网络的预测算法在嘉陵江水质评测中的应用2.pdf

最新资源