嵌入重复增强的低资源机器翻译：父子迁移学习新方法

90 浏览量更新于2025-01-16 收藏 458KB PDF 举报

"这篇论文探讨了在低资源机器翻译中如何通过嵌入重复的父子迁移学习方法进行改进。作者提出了一种新策略，利用子词对齐的信息来增强跨语言的迁移学习效果。他们首先介绍了低资源机器翻译面临的挑战，如缺乏并行数据和双语词典。然后，他们引用了Aji等人(2020)的工作，该工作引入了‘父子’迁移学习框架，即先在高资源语言对上训练父模型，然后将父模型的内部参数和嵌入层传递给子模型，使其在低资源语言对上进行微调。文章的核心贡献在于提出在对齐的多语言子词之间复制嵌入信息，以促进形态相似或语义相关的子词之间的迁移。这种方法假设，即使形态不同，但语义相似的子词之间的重复也能提升翻译质量。实验部分，作者使用Transformer架构的编码器-解码器模型作为父MT和子MT模型的基础，并在MyEn、IdEn和TrEn翻译任务的基准数据集上展示了他们的方法。结果显示，该方法能显著提高BLEU分数，同时训练时间减少了63.8%，并且所有实验的模型和源代码都将公开，以支持可重复研究。通过这种方式，论文不仅提供了一个实用的解决方案，还促进了低资源机器翻译领域的进一步研究，特别是在有效利用有限资源和提高翻译准确性的方面。"

+v：mala2277获取更多论

文

→→

→

子词对齐仍然有用：一种增强低资源机器翻译

Minhan Xu，Yu Hong

苏州大学计算机科学与技术学院

网址：cosmosbreak5712@gmail.com，

tianxianer@gmail.com

摘要

我们利用对齐子词之间的嵌入重复来扩展

父子迁移学习方法，从而改进低资源机器

翻译。我们在My En、Id En和Tr En翻译场

景的基准数据集上进行了实验。测试结果

表明，我们的方法产生了实质性的改善，

实现了 BLEU 分数分别为 22.5 ， 28.0 和

18.1。此外，该方法计算效率高，训练时

间消耗减少了63.8%，

在Tesla 16GB P100 GPU上训练时为1.6小

时实验中的所有模型和源代码都将公开，

以支持可重复的研究。

介绍

低资源机器翻译（MT）由于缺乏并行数据，

在某些情况下，缺乏双语词典（Zoph et al. ，

2016; Miceli Barone

，

2016; Koehn

andKnowles

，

2017; Zhang et al.

，

2017

年）。

基于不同的优势，无监督，多语言和迁移学习

在低资源MT任务中已被证明是有效的（第2

节）。

在本文中，我们遵循Aji等人。（2020）的

工作，利用跨语言迁移学习，其中

“

亲子

”

迁移

框架是由

Zoph

等人（

2016

）首次提出的。在

父子场景中，使用相同的神经网络结构连续形

成父MT模型和子MT模型为了从头开始达到足

够的预热效果，父代在高资源语言对上进行此

外，子节点继承父节点内部参数和嵌入层），

并且它通过在低资源语言对上的微调而得到提

升一个独特的贡献在

Aji

等人。（

2020

）

通讯作者。

本文旨在论证不同语言中形态相同的子词之间

进行嵌入式重叠迁移时的显著效果

我们试图通过在对齐的多语言子词中额外复

制嵌入信息来扩展

Aji et al.

（

2020

）的工作。

这是基于这样的假设：如果形态相同的子词之

间的重复有助于跨语言迁移，那么任何其他类

型的等价物之间的重复也是以同样的方式有益

的，例如对齐子词的重复，其中大多数可能是

形态上不相似但语义上相似（甚至完全相同）

的。

在我们的实验中，父MT模型和子MT模型都

是用基于 transformer 的（ Vaswani et al. ，

2017）编码器-解码器架构（第3.1节）。我们

使用

SentencePiece

（

Kudo

和

Richardson

，

2018

）中的

unigram

模型进行去词化，并使用

eflomal

进行子词对齐（第

3.2

节）。在此基础

上，我们开发了一种规范化的元素嵌入聚合方

法，以解决对齐子词的多对一嵌入重复（第

3.3节）。实验表明，该方法在不使用数据扩

充的情况下，取得了显著的效果

嵌入重复增强的低资源机器翻译：父子迁移学习新方法

基于临床概念嵌入的电子病历迁移学习_Transfer Learning in Electronic Health Records

【LINQ与SQL思维转换】：如何巧妙转换SQL到LINQ方法语法

项目管理精细化操作：华为无线搬迁中WBS的实践智慧

【大型项目中的Jackson应用】：架构优化与实战案例剖析

cole_02_0507.pdf

工程硕士开题报告：无线传感器网络路由技术及能量优化LEACH协议研究

【东海期货-2025研报】东海贵金属周度策略：金价高位回落，阶段性回调趋势初现.pdf

图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程，简化了深度学习项目的数据准备工作)

diminico_02_0709.pdf

agenda_3cd_01_0716.pdf

最新资源