IHMM方法在机器译文近义词匹配中的应用研究

0 下载量 134 浏览量 更新于2024-08-27 收藏 459KB PDF 举报
"机器译文自动评价中基于IHMM的近义词匹配方法研究" 这篇研究论文探讨了在机器译文自动评价过程中如何有效地识别和匹配近义词的问题。作者李茂西、徐凡和王明文来自江西师范大学计算机工程信息学院,他们提出了一种基于间接隐马尔可夫模型(IHMM)的近义词匹配方法,以提升机器翻译(MT)自动评价的准确性和相关性。 在机器翻译领域,自动评价是衡量翻译质量的关键工具,它有助于快速评估系统的性能,无需人工参与。然而,自动评价的一个挑战在于正确处理近义词,因为它们可能导致机器译文和人工参考译文之间的表面差异,而实际上含义相同。传统的评价指标,如BLEU、NIST和TER,虽然在某些方面有用,但往往无法捕捉到这种语义等价性。 论文中提出的IHMM方法利用源语言句子作为连接机器译文和人工参考译文的桥梁。通过建立源语言句子与两个翻译版本的对应关系,模型能够识别和对齐近义词,从而提高自动评价与人工评价的相关性。这种方法尤其适用于处理多义词和同义词的情况,这些词汇在不同的上下文中可能有不同的翻译选择。 实验部分,研究人员使用了LDC2006T04语料库和WMT数据集,结果显示,基于IHMM的近义词匹配方法在系统级别和句子级别的相关性上都显著优于BLEU、NIST、TER以及使用词根信息和同义词典的METEOR方法。这表明,IHMM模型能够更精确地捕获翻译的语义相似性,提高了评价的精度。 关键词包括机器译文自动评价、近义词匹配、间接隐马尔可夫模型、单语句子词对齐和相关性。论文的中图分类号为TP391,属于计算机科学技术领域。 这项研究对于改进机器翻译系统的评价机制具有重要意义,有助于推动机器翻译技术的进一步发展,尤其是在自动评价标准的设定和优化方面。通过提高自动评价与人工评价的一致性,可以更好地指导机器翻译算法的优化和新系统的开发。