首页facebook/bart-large-xsum、facebook/bart-large-cnn、facebook/bart-large的区别是什么？

facebook/bart-large-xsum、facebook/bart-large-cnn、facebook/bart-large的区别是什么？

时间: 2024-06-09 14:06:09 浏览: 409

asian-bart:亚洲语言巴特模型（En，Yes，Ko，Zh，ECJK）

亚洲巴特 asian-bart是针对亚洲语言的Bart模型的软件包。 asian-bart支持英语，中文，韩语，日语，总计（= ECJK）我们通过嵌入图层修剪功能使用制作了 asian-bart 。安装 pip install asian-bart 型号规格 ECJK模型 vocab大小：57k 型号大小：413M 语言：En，Zh，Ja，Ko 体系结构：变压器12编码器+ 12解码器名称： hyunwoongko/asian-bart-ecjk 英文模特 vocab大小：32k 型号大小：387M 语言：英语（ en_XX ）体系结构：变压器12编码器+ 12解码器名称： hyunwoongko/asian-bart-en 中国模特 vocab大小：20k 型号大小：375M 语言：中文（ zh_CN ）体系结构：变压器12编码器+ 12解码器名称

这三个模型都是 Facebook AI Research 团队开发的 BART 模型的不同版本，其中： - `facebook/bart-large-xsum` 是在英文摘要数据集 XSum 上微调的 BART 大型模型，用于生成英文文章的摘要。 - `facebook/bart-large-cnn` 是在新闻数据集 CNN/DailyMail 上微调的 BART 大型模型，用于生成新闻文章的摘要。 - `facebook/bart-large` 是在大规模语料库上预训练的 BART 大型模型，具有广泛的生成能力，例如生成文章、摘要、翻译、对话等。因此，这三个模型的主要区别在于微调的数据集和预训练的语料库不同，以及它们适用的生成任务不同。

阅读全文