TransformerSum：简化神经摘要训练和评估的工具库

需积分: 17 199 浏览量更新于2024-11-16 收藏 5.68MB ZIP 举报

资源摘要信息:"TransformerSum是一个旨在简化训练、评估和使用机器学习变压器模型的库，这些模型可以执行自动汇总。TransformerSum支持抽取式和抽象式两种神经摘要模型，具有高度的灵活性和扩展性，可轻松集成不同的架构和预训练模型。其特点是强调代码的可读性和可解释性，使得无论是初学者还是专家都能够容易地构建新组件。TransformerSum同时支持高级功能，如16位精度和多GPU训练，优化了PyTorch训练循环逻辑。对于长序列的处理，TransformerSum采用了诸如纸张（Paper）和Longformer的组合技术，支持长达4,096至16,384个令牌的序列，同时保持模型的准确性。此外，TransformerSum还包括能够在资源受限的设备上运行的轻量级模型。为了评估模型性能，TransformerSum使用ROUGE度量标准进行自动评估，同时也支持用户进行手动测试。" 知识点详细说明： 1. 自动文本摘要技术：自动文本摘要指的是使用计算机算法从文本中提取关键信息，生成摘要。在自动文本摘要有两种主要方法：抽取式摘要和抽象式摘要。抽取式摘要通过选择原文中的句子组成摘要，不改变原文中的词汇；而抽象式摘要则是生成新的句子来概括原文的意思，这种方法往往需要更复杂的语言处理技术。 2. Transformer模型：Transformer是一种基于自注意力机制的神经网络架构，最初由Vaswani等人在2017年的论文《Attention Is All You Need》中提出。它在自然语言处理（NLP）任务中取得了重大突破，如机器翻译、文本摘要等。BERT、ALBERT、RoBERTa等都是基于Transformer架构的变体。 3. BERT（Bidirectional Encoder Representations from Transformers）：BERT是一种预训练语言表示的方法，使用双向Transformer来理解语言的上下文。它通过预训练和微调的方式，在各种NLP任务上取得了最先进的性能。 4. RoBERTa（A Robustly Optimized BERT Approach）：RoBERTa是BERT的一个改进版本，主要通过优化模型结构和训练过程，如使用更大的批量大小和更长的训练时间，提高了模型性能。 5. PyTorch Lightning：PyTorch Lightning是一个轻量级的PyTorch封装，用于加速研究并促进良好的机器学习实践。它自动化了常见的工程任务，如设置随机种子、使用GPU、处理数据加载等，使得研究人员可以专注于构建模型本身。 6. 16位精度训练：在深度学习中，使用16位浮点数（如FP16）进行训练可以减少模型的内存占用和计算要求，同时提高训练速度。这在使用GPU进行训练时尤其有用，因为现代GPU对FP16计算进行了优化。 7. 多GPU训练：在机器学习中，使用多块GPU并行处理计算任务可以显著减少训练时间，尤其适用于大规模和复杂的神经网络模型。 8. Longformer模型：Longformer是一种专为长序列设计的Transformer变体，它能够处理比标准Transformer更长的文本序列，这在处理长文章或文档时非常有用。 9. ROUGE度量标准：ROUGE（Recall-Oriented Understudy for Gisting Evaluation）是一种广泛用于评估文本摘要、机器翻译等任务的指标。它通过比较模型生成的摘要与人工编写的参考摘要之间的重叠程度（如n-gram匹配），来评估摘要的质量。 TransformerSum的出现为研究人员和开发者提供了一个强大的工具，让他们可以更简单地实现和评估各种文本摘要模型，无论是在抽取式还是抽象式摘要任务上。通过提供与多种模型的集成、高级训练功能和对长文本的支持，TransformerSum极大地降低了文本自动摘要技术的门槛，为文本摘要技术的发展和应用推广提供了重要的支持。

收起资源包目录

TransformerSum:使用机器学习转换器和将抽象摘要数据集转换为提取任务的工具来执行神经摘要（抽取式和抽象式）的模型（109个子文件）

distil_loss_avg_seq_mean_outliers.png 47KB

loss_avg_seq_mean_val_only.png 25KB

LICENSE 32KB

pooling.py 4KB

large_loss_avg_seq_mean_val_only.png 21KB

loss_avg_seq_mean_outliers.png 53KB

loss_avg_seq_mean_reltime.png 136KB

README.md 10KB

example_deepspeed_config.json 733B

loss_avg_seq_mean_outliers.png 76KB

convert_extractive_pt_to_txt.py 837B

base_loss_total.png 60KB

classifier.py 8KB

getting-started.rst 13KB

models-results.rst 8KB

large_loss_total_norm_batch.png 86KB

loss_total_outliers.png 45KB

loss_total_norm_batch.png 83KB

main.py 18KB

loss_avg_seq_mean.csv 326KB

make.bat 795B

loss_avg_seq_mean.png 87KB

loss_total_norm_batch.png 128KB

loss_avg_seq_sum.png 127KB

loss_avg_seq_mean_outliers.png 75KB

extractive.py 60KB

Makefile 634B

data.py 41KB

loss_avg_seq_sum.png 133KB

loss_total.png 122KB

conf.py 2KB

loss_avg_seq_sum.png 138KB

predictions_website.py 523B

loss_total.csv 319KB

large_loss_avg_seq_mean.png 83KB

abstractive.py 47KB

convert_to_arrow.py 2KB

base_loss_avg.png 94KB

loss_avg.png 142KB

loss_total_outliers.png 67KB

datasets.rst 13KB

base_loss_avg_seq_mean_val_only.png 22KB

loss_avg.csv 326KB

base_loss_avg_seq_mean_outliers.png 62KB

large_loss_avg.png 79KB

helpers.py 16KB

convert_to_extractive.py 27KB

training.rst 14KB

loss_avg_seq_mean_val_only.png 35KB

loss_avg_seq_mean.png 144KB

logo.png 20KB

distil_loss_total_norm_batch.png 82KB

large_loss_total.png 77KB

loss_avg_seq_mean_outliers.png 77KB

main-script.rst 14KB

loss_avg_seq_mean_reltime.png 128KB

loss_total.png 128KB

base_loss_avg_seq_mean_reltime.png 112KB

loss_avg.png 133KB

loss_avg_seq_sum.csv 320KB

distil_loss_avg.png 80KB

training.rst 15KB

distil_loss_total_outliers.png 43KB

distil_loss_total.png 79KB

large_loss_avg_seq_sum.png 79KB

about.rst 9KB

loss_avg.png 84KB

large_loss_total_outliers.png 66KB

distil_loss_avg_seq_mean.png 86KB

loss_total_outliers.png 71KB

.gitmodules 401B

loss_total_norm_batch.png 136KB

loss_avg_seq_mean_val_only.png 35KB

datasets.rst 9KB

loss_avg_seq_mean.png 138KB

distil_loss_avg_seq_mean_val_only.png 21KB

base_loss_total_outliers.png 49KB

large_loss_avg_seq_mean_outliers.png 71KB

experiments.rst 33KB

loss_avg_seq_mean_val_only.png 33KB

poly_lr_decay.py 2KB

loss_avg_seq_mean.png 140KB

loss_avg.png 137KB

loss_avg_seq_mean_reltime.png 136KB

distil_loss_avg_seq_sum.png 81KB

models-results.rst 33KB

convert-to-extractive.rst 28KB

social.png 25KB

base_loss_total_norm_batch.png 66KB

loss_total_norm_batch.png 126KB

loss_total.png 142KB

base_loss_avg_seq_mean.png 100KB

loss_total_norm_batch.csv 316KB

base_loss_avg_seq_sum.png 69KB

.gitignore 2KB

loss_total_outliers.png 64KB

summarization-model-experiments-raw-data.csv 101KB

loss_avg_seq_sum.png 84KB

large_loss_avg_seq_mean_reltime.png 79KB

loss_total.png 84KB

共 109 条

阚发景

粉丝: 23
资源: 4614

TransformerSum：简化神经摘要训练和评估的工具库

Python-PyTorch实现基于Transformer的神经机器翻译

abstractive_summarizer:使用Transformer的抽象文本摘要

关系抽取的新策略：神经网络如何助力信息提取

社交媒体情感分析：机器学习技术的高效应用案例

命名实体识别实战：机器学习方法与应用全览

在Spark应用程序中实现机器学习与数据挖掘

Java机器学习库的分布式处理：Spark MLlib实战指南

结合OpenCV与机器学习：图像分类与识别的进阶指南

【Python中的自然语言处理】：让机器理解人类语言，3个实战项目

GANs与其他机器学习模型的比较分析：哪个更适合你的项目？

最新资源