机器翻译质量评估工具TERcom 0.10.0发布

需积分: 41 72 浏览量更新于2024-12-05 1 收藏 71KB ZIP 举报

资源摘要信息:"tercom是用于机器翻译评估的软件工具，专注于计算翻译错误率（Translation Error Rate，简称TER），这一度量标准是衡量机器翻译质量的重要指标。它由Matthew Snover、Shuguang Wang和Spyros Matsoukas共同开发，并由BBN Technologies和马里兰大学联合版权声明。TERcom能够解析多种格式的输入文件，包括SGML（NIST格式）、XML或Trans，并将这些文件格式化为内部结构以计算翻译错误率。 TER程序的核心概念是将系统输出与一个或多个参考翻译进行比较，通过计算将系统输出更改为参考翻译所需的最小编辑操作次数来度量错误率。编辑操作一般包括插入、删除、替换单词以及移动短语等。TER的计算结果是一个介于0到1之间的数，表示翻译中每一百个单词错误的数量。例如，TER为0.10.0表示每翻译100个单词中就有10个单词存在错误。软件提供了一个可执行的jar文件`tercom.jar`，其中包含了用于计算TER的核心Java程序。开发者或用户可以通过命令行工具调用`TERtest`类来执行翻译评估。要运行TER，用户需要准备两组文件：一组是参考翻译文件，即正确或理想的翻译；另一组是假设翻译文件，即机器翻译系统产生的翻译。这两组文件必须采用相同的格式（SGML、XML或Trans）以便于程序解析。 TER工具的输出结果可以为机器翻译研究和开发提供有价值的信息。通过对比不同机器翻译系统的TER值，研究人员和工程师可以量化比较不同系统的翻译质量，并指导后续的改进工作。TER已经成为国际机器翻译评估基准赛（如WMT）中的一个标准评估指标。该软件的源代码位于`src/`目录下，允许用户进行二次开发或自定义改进以满足特定的评估需求。TER的使用和引用应当遵守相关知识产权法律，正确引用开发者的贡献。TER项目还体现了Java语言在科学计算和大数据处理方面的优势，Java平台的跨平台特性使得tercom.jar可以在不同的操作系统上运行，便于广泛的国际合作和交流。总之，tercom作为一个开源的翻译评估工具，对于机器翻译领域的研究和实践具有重要价值，它不仅提供了一种客观衡量翻译质量的量化方法，而且推动了翻译技术的发展和翻译系统的优化。"

收起资源包目录

tercom:翻译错误率（TER）（22个子文件）

CostFunction.java 2KB

StringUtils.java 641B

AlignmentStringUtils.java 12KB

build.xml 866B

TerScorer.java 22KB

CHANGELOG.md 2KB

Parameters.java 6KB

TER.java 15KB

Tag.java 255B

ref.txt 85KB

SgmlProcessor.java 32KB

Shift.java 2KB

README.md 5KB

IntPair.java 161B

hyp.txt 20KB

dist.sh 352B

Normalizer.java 3KB

LICENSE.txt 26KB

Alignment.java 3KB

constants 92B

Pair.java 183B

out.txt 3KB

共 22 条

一行一诚

粉丝: 25
资源: 4559

机器翻译质量评估工具TERcom 0.10.0发布

TERCOM.zip_tercom匹配算法_地形_地形 匹配_地形匹配算法_地形数据

地形匹配导航

tercom结合iccp

matlab tercom

如何利用数字地图数据，结合TERCoM算法和卡尔曼滤波技术提升地形辅助导航系统的定位精度？

TERCOM中采样次数变大定位精度如何变化

TERCOM中高度均方根误差变大定位精度如何变化？

在地形辅助导航系统中，如何结合使用TERCoM算法和卡尔曼滤波技术来提升定位精度？请提供详细的实现方法。

结合数字地图数据，如何设计一种融合TERCoM算法和卡尔曼滤波技术的地形辅助导航系统以提高定位精度？

写一个TERCOM算法当中的MAD算法

最新资源

TERCOM.zip_tercom匹配算法_地形_地形匹配_地形匹配算法_地形数据