Transformer模型与BLEU评分分析

需积分: 0 127 浏览量更新于2024-08-04 收藏 264KB DOCX 举报

"该资源是关于Transformer模型在机器翻译任务中的应用和评估的说明，包含了对 Attention 模块的详细解释以及项目结构和主要代码文件的概述。" 在这个项目中，作者通过`model.py`实现了Transformer模型，并对其性能进行了评估。Transformer模型是一种基于自注意力机制的深度学习模型，在神经机器翻译(NMT)中表现优异。测试结果通过两种BLEU分数进行衡量：`my_bleu_XX`是使用作者自定义的BLEU函数计算的结果，它考虑了不同n-gram的权重平衡；而`nltk_bleu_XX`则依赖于`nltk`库的`sentence_bleu`函数，其只考虑单个n-gram(即四元组的权重为1，其他为0)。BLEU分数是评估机器翻译质量的常用指标，数值越高表示翻译结果与参考译文的相似度越高。结果显示，Transformer模型在这两个指标下都表现出良好的效果。项目的主要代码结构如下： 1. `bleu.py`: 包含了自定义的BLEU计算函数以及使用`nltk`库的BLEU计算函数。 2. `data_process.py`: 处理数据，包括创建词典(word_id)，读取数据，生成批次(batch)以及填充操作(padding)等功能。 3. `main.py`: 项目的主入口，负责模型的训练和测试流程的控制。 4. `model.py`: 实现RNN+Attention模型的主体部分，包括模型的初始化和构建图(graph building)。 5. `README-运行命令.txt`: 提供了一键运行项目的命令说明。 6. `test.py`: 可能是一些测试代码，可以忽略。 7. `word2vector_cn_embedding120.pkl`和`word2vector_en_embedding120.pkl`: 分别为中文和英文的词向量文件，用于预训练词嵌入。 8. `data`和`model`目录：分别存储训练数据和训练好的模型。在`model.py`中，`__init__`函数初始化了模型所需的基本变量，例如词嵌入向量、模型参数等。`build_graph()`函数定义了模型的架构，包括编码器(Encoder)和解码器(Decoder)的结构，以及它们之间的注意力机制(Attention)。编码器通过自注意力层处理输入序列，而解码器则结合源序列的上下文信息生成目标序列。在实现自注意力机制时，Transformer模型使用了多头注意力(Multi-head Attention)。这个机制允许模型同时关注输入序列的不同部分，增强了模型对序列中长距离依赖关系的理解能力。此外，Transformer还引入了位置编码(Positional Encoding)，以弥补模型无法识别序列位置的不足。这个项目不仅提供了Transformer模型的实现，还涵盖了数据预处理、模型训练、评估等多个环节，是学习和实践NMT任务的好材料。对于熟悉Transformer模型的内部工作原理，以及如何在实际项目中应用和优化Transformer模型具有重要的参考价值。

1 结果说明

Attention

Greedy 解码

Beamsearch 解码

Transformer

my_bleu_avg

0.42

0.39

0.55

my_bleu_max

0.72

1.0

my_bleu_min

0.08

0.0

0.26

nltk_bleu_avg

0.18

0.15

0.10

nltk_bleu_max

0.46

1.0

0.37

nltk_bleu_min

0.03

0.0

my_bleu_XX 是使用自己写的 bleu 函数对测试集 1300 个句子计算的 bleu 值的平均值、最大

值和最小值，其中 w1, w2, w3, w4 = 0.25, 0.25, 0.25, 0.25；nltk_bleu_XX 是使用 nltk 的

sentence_bleu 函数计算的 bleu 值的平均值、最大值和最小值，其中 w1, w2, w3, w4 = 1，

0，0，0。由上表可知，Transformer 具有更好的效果。

注：在自己写的 bleu 函数里，如果计算过程会有 p2 或 p3 或 p4=0 导致无法取 log 的情况，

为了运算此时令 wi=0；如果在自己写的函数中也令 w1, w2, w3, w4 = 1，0，0，0，结果与

nltk 接口计算结果相同。

2 Attention 模块具体说明

1. 代码说明

./Homework5-Machine Translation/Attention/

│ bleu.py // bleu 评测(包括自己写的 bleu 函数和调用 nltk 的 bleu 函数)

│ data_process.py //数据处理，包括 wordid 建立，数据读取、生成 batches 等

│ main.py //主函数入口

│ model.py // RNN+Attention 模型

│ README-运行命令.txt //一键运行命令说明

│ test.py // 随意测的代码，可忽略

│ word2vector_cn_embedding120.pkl // 中文词向量的 pickle 文件

│ word2vector_en_embedding120.pkl // 英文词向量的 pickle 文件

├─data/… // 目录内容略,存储训练数据、测试数据

│

├─model/… //目录内容略，存储训练好的模型，测试时可直接加载

│

└─__pycache__

关于具体的函数和操作，均在代码中进行了相应注释标注。

2. 思路大致描述

下载后可阅读完整内容，剩余4页未读，立即下载

马李灵珊

粉丝: 41
资源: 297

Transformer模型与BLEU评分分析

方案说明-readme.doc

作业5-机器翻译练习-README1

PLSQLDeveloper_解压版(64位可用),内设readme说明

readme-pagespeed-insights:您可以在自述文件中添加的Google灯塔统计信息

GitHub统计信息生成神器：readme-stats-github

开源自述生成器：ReadMe-and-Weep的简介与使用

readme-inspector:GitHub存储库质量自评工具

readme-model：构建漂亮自述文件的模板指南

我的三次样条：这些程序有足够的文档支持。 用户需要先阅读 README。-matlab开发

cpp代码-结果1介绍

最新资源

我的三次样条：这些程序有足够的文档支持。用户需要先阅读 README。-matlab开发