IHMM方法在机器译文近义词匹配中的应用研究
134 浏览量
更新于2024-08-27
收藏 459KB PDF 举报
"机器译文自动评价中基于IHMM的近义词匹配方法研究"
这篇研究论文探讨了在机器译文自动评价过程中如何有效地识别和匹配近义词的问题。作者李茂西、徐凡和王明文来自江西师范大学计算机工程信息学院,他们提出了一种基于间接隐马尔可夫模型(IHMM)的近义词匹配方法,以提升机器翻译(MT)自动评价的准确性和相关性。
在机器翻译领域,自动评价是衡量翻译质量的关键工具,它有助于快速评估系统的性能,无需人工参与。然而,自动评价的一个挑战在于正确处理近义词,因为它们可能导致机器译文和人工参考译文之间的表面差异,而实际上含义相同。传统的评价指标,如BLEU、NIST和TER,虽然在某些方面有用,但往往无法捕捉到这种语义等价性。
论文中提出的IHMM方法利用源语言句子作为连接机器译文和人工参考译文的桥梁。通过建立源语言句子与两个翻译版本的对应关系,模型能够识别和对齐近义词,从而提高自动评价与人工评价的相关性。这种方法尤其适用于处理多义词和同义词的情况,这些词汇在不同的上下文中可能有不同的翻译选择。
实验部分,研究人员使用了LDC2006T04语料库和WMT数据集,结果显示,基于IHMM的近义词匹配方法在系统级别和句子级别的相关性上都显著优于BLEU、NIST、TER以及使用词根信息和同义词典的METEOR方法。这表明,IHMM模型能够更精确地捕获翻译的语义相似性,提高了评价的精度。
关键词包括机器译文自动评价、近义词匹配、间接隐马尔可夫模型、单语句子词对齐和相关性。论文的中图分类号为TP391,属于计算机科学技术领域。
这项研究对于改进机器翻译系统的评价机制具有重要意义,有助于推动机器翻译技术的进一步发展,尤其是在自动评价标准的设定和优化方面。通过提高自动评价与人工评价的一致性,可以更好地指导机器翻译算法的优化和新系统的开发。
2022-07-14 上传
2024-09-22 上传
2024-09-22 上传
2024-09-22 上传
2024-09-22 上传
weixin_38716872
- 粉丝: 2
- 资源: 926
最新资源
- Flex垃圾回收与内存管理:防止内存泄露
- Python编程规范与最佳实践
- EJB3入门:实战教程与核心概念详解
- Python指南v2.6简体中文版——入门教程
- ANSYS单元类型详解:从Link1到Link11
- 深度解析C语言特性与实践应用
- Gentoo Linux安装与使用全面指南
- 牛津词典txt版:信息技术领域的便捷电子书
- VC++基础教程:从入门到精通
- CTO与程序员职业规划:能力提升与路径指南
- Google开放手机联盟与Android开发教程
- 探索Android触屏界面开发:从入门到设计原则
- Ajax实战:从理论到实践
- 探索Android应用开发:从入门到精通
- LM317T稳压管详解:1.5A可调输出,过载保护
- C语言实现SOCKET文件传输简单教程