GLM-4-9B开源模型：超越Llama-3-8B的多模态能力

181 浏览量更新于2024-11-13 收藏 26.13MB ZIP 举报

资源摘要信息:"GLM-4-9B是一个开源的预训练模型，属于GLM-4系列，由智谱AI推出。该模型在语义、数学、推理、代码和知识等多方面的数据集测评中都表现出色，超越了Llama-3-8B。GLM-4-9B有两个版本，一个是普通的GLM-4-9B，另一个是人类偏好对齐的版本GLM-4-9B-Chat。此外，还有多模态模型GLM-4V-9B，其采用了与CogVLM2相似的架构设计，能够处理高达1120 x 1120分辨率的输入，通过降采样技术有效减少了token的开销。GLM-4V-9B没有引入额外的视觉专家模块，而是采用了直接混合文本和图片数据的方式进行训练，在保持文本性能的同时提升多模态能力。该模型使用Pytorch框架进行训练和部署。" 知识点: 1. 预训练模型：预训练模型是一种机器学习模型，它在大规模的数据集上进行训练，以学习数据的通用特征和模式。这些模型可以用于各种任务，如分类、回归、序列预测等。 2. GLM-4系列：GLM-4系列是由智谱AI推出的一系列预训练模型。在这个系列中，GLM-4-9B是最新的一代模型。 3. 语义、数学、推理、代码和知识：这些是GLM-4-9B模型在数据集测评中表现优异的几个方面。语义指的是模型理解和生成语言的能力，数学指的是模型解决数学问题的能力，推理指的是模型进行逻辑推理的能力，代码指的是模型理解和生成代码的能力，知识指的是模型存储和使用知识的能力。 4. Llama-3-8B：Llama-3-8B是GLM-4-9B的一个竞争对手，但是GLM-4-9B在各个方面的性能都超越了Llama-3-8B。 5. 多模态模型GLM-4V-9B：多模态模型是一种可以处理和理解多种类型输入（如文本、图片、声音等）的模型。GLM-4V-9B是GLM-4系列中的一个多模态模型，它能够处理高达1120 x 1120分辨率的输入，并且通过降采样技术有效减少了token的开销。 6. 降采样技术：降采样技术是一种减少数据量的方法，它可以减少模型的计算开销和内存消耗。 7. 直接混合文本和图片数据的方式进行训练：这是一种训练方法，它将文本和图片数据直接混合在一起进行训练，而不是将它们分开处理。这种方法可以提高模型的多模态能力。 8. Pytorch：Pytorch是一个开源的机器学习库，用于Python编程语言，由Facebook的人工智能研究实验室开发。它广泛用于计算机视觉和自然语言处理等领域。GLM-4-9B和GLM-4V-9B都是使用Pytorch进行训练和部署的。

收起资源包目录

glm4-9b-pytorch多轮对话算法模型.zip （99个子文件）

Contributors.md 19B

config.ts 201B

HEAD 201B

pnpm-lock.yaml 47KB

README_en.md 5KB

pre-rebase.sample 5KB

openai_api_server.py 17KB

vllm.py 2KB

update.sample 4KB

requirements.txt 186B

.gitignore 3KB

client.py 3KB

config 288B

fsmonitor-watchman.sample 5KB

transformers.jpg 33KB

README.md 6KB

config.py 118B

ptuning_v2.yaml 1KB

vlm.png 684KB

trans_stress_test.py 5KB

utils.ts 1KB

pre-push.sample 1KB

model.properties 485B

package-lock.json 138KB

wechat.jpg 151KB

finetune.py 16KB

requirements.txt 358B

.gitignore 2KB

weather.png 1013KB

README_en.md 16KB

doc_reader.png 1.1MB

package.json 597B

description 73B

applypatch-msg.sample 478B

server.ts 1KB

inference.py 4KB

post-update.sample 189B

openai_api_request.py 3KB

multi-mode.png 416KB

tool_registry.py 5KB

index 7KB

conversation.py 7KB

WECHAT.md 221B

gen_messages_data.py 1KB

tool.png 603KB

README_zh.md 16KB

trans_web_demo.py 6KB

Dockerfile 83B

README.md 11KB

python.py 7KB

hf.py 2KB

commit-msg.sample 896B

utils.py 742B

web_plot_2.png 851KB

trans_batch_demo.py 3KB

result.png 25KB

README_en.md 4KB

types.ts 506B

LICENSE 11KB

web_plot_1.png 936KB

browser.py 2KB

HEAD 41B

README_en.md 11KB

eval_needle.jpeg 452KB

prepare-commit-msg.sample 1KB

ds_zero_2.json 728B

HEAD 201B

cogview.png 1.87MB

packed-refs 268B

trans_cli_vision_demo.py 4KB

pre-commit.sample 2KB

push-to-checkout.sample 3KB

tsconfig.json 297B

demo.png 615KB

pack-cdb36237fae9d88f2ad2a2923bc52cab6dac0d7a.pack 18.05MB

quick_start.py 1KB

exclude 240B

trans_cli_demo.py 4KB

lora.yaml 1KB

README.md 11KB

longbench.png 164KB

main.py 12KB

train.sh 237B

README.md 4KB

icon.png 54KB

interface.py 223B

ds_zero_3.json 771B

HEAD 32B

cogview.py 747B

pre-applypatch.sample 424B

requirements.txt 96B

vllm_cli_demo.py 4KB

.gitignore 25B

pre-receive.sample 544B

pre-merge-commit.sample 416B

browser.ts 23KB

train_dp.sh 315B

sft.yaml 997B

pack-cdb36237fae9d88f2ad2a2923bc52cab6dac0d7a.idx 5KB

共 99 条

技术瘾君子1573

粉丝: 1w+
资源: 93

GLM-4-9B开源模型：超越Llama-3-8B的多模态能力

开源双语对话模型ChatGLM-6B：提升语言处理能力

GLM-4代码仓库源码压缩包下载

GLM-HMM模型与Matlab仿真教程：数据拟合与预测

glm4-9b-1m和glm4-9b-chat模型有什么区别

langchain调用glm4-9b

glm-4-9b-chat-1m模型代码文件

仅使用Python基础从头开始构建大型语言模型；从零开始逐步构建GLM4-Lama3-RWKV6，深入了解大型模型的原理.zip

glm-deprecated-master.zip

glm-0.9.9.6.zip

glm-0.9.7.5.zip

最新资源