双语对话模型VisualGLM-6B：中英文图文预训练与微调

版权申诉

103 浏览量更新于2024-12-05 收藏 10.29MB ZIP 举报

资源摘要信息:"VisualGLM-6B是一种多模态中英双语对话语言模型，它利用了来自CogView数据集的高质量中英图文对进行预训练。该模型的预训练过程中，中文和英文的权重是相同的，这使得视觉信息能够更好地对齐到ChatGLM的语义空间。在预训练完成后，VisualGLM-6B会在长视觉问答数据上进行微调，以生成符合人类偏好的答案。 VisualGLM-6B的训练是通过一个名为SwissArmyTransformer（简称sat）的工具库完成的，这个库支持对Transformer的灵活修改和训练，同时也支持Lora、P-tuning等参数高效的微调方法。此外，该项目还提供了符合用户习惯的huggingface接口，以及基于sat的接口。" 知识点一：多模态中英双语对话语言模型多模态中英双语对话语言模型是一种能够处理并理解多种类型输入（如文本、图像等）的模型。在VisualGLM-6B中，这种模型不仅可以处理中英文的文本输入，还可以处理视觉信息，如图片等。这种模型在理解和生成中英文双语对话方面表现出色。知识点二：预训练和微调预训练和微调是机器学习中的重要概念。预训练是通过大量数据训练模型，使其能够理解和处理一些基本的知识和技能。微调则是在预训练的基础上，根据特定任务对模型进行进一步的训练，使其更符合特定任务的需求。在VisualGLM-6B中，模型首先在CogView数据集上进行预训练，然后在长视觉问答数据上进行微调。知识点三：CogView数据集 CogView数据集是由高质量的中英图文对组成，VisualGLM-6B的预训练就是利用这个数据集完成的。这个数据集的使用，使得模型能够更好地理解和处理视觉信息。知识点四：SwissArmyTransformer（sat）库 SwissArmyTransformer是一个支持Transformer灵活修改、训练的工具库。Transformer是一种重要的深度学习模型，广泛应用于自然语言处理等领域。sat库不仅支持Transformer，还支持Lora、P-tuning等参数高效的微调方法，使得模型的训练和微调更为灵活和高效。知识点五：huggingface接口 huggingface是一个开源的自然语言处理工具库，提供了一系列的预训练模型和接口，方便用户进行自然语言处理任务。VisualGLM-6B提供了符合用户习惯的huggingface接口，使得用户可以更加方便地使用这个模型进行任务。

收起资源包目录

Chinese and English 多模态中英双语对话语言模型（30个子文件）

chat.py 7KB

requirements_wo_ds.txt 118B

blip2.py 4KB

example_inputs.jsonl 215B

wechat.jpg 151KB

finetune_visualglm.py 8KB

chat_example1.png 751KB

visualglm.py 2KB

chat_example3.png 660KB

3.jpeg 53KB

web_demo.py 6KB

2.jpeg 7KB

__init__.py 91B

api.py 2KB

finetune_visualglm_qlora.sh 2KB

infer_util.py 2KB

fewshot-data.zip 6.39MB

cli_demo.py 4KB

cli_demo_hf.py 2KB

web_demo.png 336KB

WECHAT.md 222B

api_hf.py 1KB

1.jpeg 995KB

web_demo_hf.py 6KB

requirements.txt 92B

MODEL_LICENSE.txt 2KB

finetune_visualglm.sh 1KB

thu.png 457KB

cli_demo_mp.py 3KB

chat_example2.png 754KB

共 30 条

博士僧小星

粉丝: 2349
资源: 5995

双语对话模型VisualGLM-6B：中英文图文预训练与微调

多模态中英双语对话语言模型的构建与应用

多模态开源模型：中英文视觉-文本交互能力

mPLUG模块化构建的创新多模态语言模型研究

多模态中英双语对话语言模型

支持中英文双语视觉-文本对话的可商用多模态模型

高质量中文预训练模型;大模型;多模态模型;大语言模型集合.zip

【大模型-多模态】复杂视觉推理任务中利用多模态增强大规模语言模型能力的方法研究

令人惊叹的预训练中文NLP模型，高质量的中文预训练模型&大型模型&多模态模型&大型语言模型集合.zip

多模态大语言模型(MLLM)

人工智能-多模态-基于baichuan-7b的多模态大语言模型

最新资源