两小时快速搭建清华大学ChatGLM-6B指南

需积分: 5 17 浏览量更新于2024-08-04 11 收藏 13KB DOCX 举报

本文档详细介绍了如何在2小时内手把手搭建清华大学的开源对话语言模型ChatGLM-6B。ChatGLM-6B是一个具备62亿参数的中英双语对话模型，基于GeneralLanguageModel (GLM) 架构，旨在提供高质量的文本生成和对话交互。首先，准备工作部分强调了利用ModelScope平台进行部署。ModelScope是提供免费服务器资源的地方，用户可以通过注册获取一个预装有ModelScopeLibrary、Ubuntu 20.04操作系统、CUDA 11.3.0、Python 3.7版本的环境，以及PyTorch 1.11.0和TensorFlow 1.15.5版本。这个配置足够支持ChatGLM-6B的运行，特别是对于FP16和INT8量化等级，最低GPU显存需求分别为13GB和8GB，INT4则需要6GB显存。在硬件需求方面，模型支持不同量化级别以优化内存使用，但建议使用FP16或INT8以减少对GPU的需求。量化是指通过算法将模型权重转换为更紧凑的形式，以适应硬件限制。搭建步骤非常简洁，主要依赖于Hugging Face的Transformers库。用户首先导入必要的模块，如`AutoTokenizer`和`AutoModel`，然后加载预训练模型的tokenizer和模型本身。为了优化性能，可以将模型转换为半精度（`.half()`）并将其移动到GPU上。接下来，模型被设置为评估模式（`.eval()`），以便于处理对话任务。最后，用户可以通过`model.chat()`函数与模型进行交互，输入初始问候语并获取响应。例如，初次交互的示例展示了如何向模型提问“你好”并得到相应的欢迎回应。之后，模型能够根据之前的对话历史继续生成关于“晚上睡不着应该怎么办”的建议，提供实用的睡眠技巧。这篇指南提供了从注册获取资源、理解硬件需求到实际操作的完整流程，使得个人无需购买昂贵硬件也能体验到ChatGLM-6B的强大功能。这对于希望在日常开发或研究中探索对话模型的开发者和爱好者来说是一份实用的教程。

准备（注册）:

https://modelscope.cn/

按照图片里的选择(选择其他好像不能创建成功)

可以白嫖 60 多个小时的配置

8 核 32GB 显存 16G

预装 ModelScope Library

预装镜像 ubuntu20.04-cuda11.3.0-py37-torch1.11.0-tf1.15.5-1.5.0

ChatGLM-6B 介绍

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model

(GLM) 架构，具有 62 亿参数。

硬件需求

量化等级最低 GPU 显存（推理）最低 GPU 显存（高效参数微调）

FP16（无量化） 13 GB 14 GB

INT88 GB9 GB

INT46 GB7 GB

搭建:

https://github.com/THUDM/ChatGLM-6B#代码调用

下载后可阅读完整内容，剩余4页未读，立即下载

dingsai88

粉丝: 1380
资源: 62

两小时快速搭建清华大学ChatGLM-6B指南

手把手教你学DSP：基于TMS320F28335

《手把手教你学51单片机》教材pdf

手把手教你从零搭建Python数据分析环境

手把手教你通过 ELK 搭建实时日志分析平台

手把手教你搭建GitLab

手把手教你如何搭建私有云

手把手教你搭建SSH框架

手把手教你搭建Java环境

手把手教你：快速搭建Android开发环境

WIN7系统：手把手教你配置IIS搭建本地网站

最新资源