ChatGLM-6B环境搭建与本地部署：超越ChatGPT的开源大模型

需积分: 0 200 浏览量更新于2024-08-04 1 收藏 540KB DOCX 举报

本文档主要介绍了如何搭建与部署ChatGLM-6B环境，这是一个由清华大学团队开发的开源对话语言模型，支持中英双语，具有62亿参数，旨在提供与ChatGPT类似的性能，特别针对中文问答和对话进行了优化。该模型通过1T标识符的训练数据，结合监督微调、反馈自助和人类反馈强化学习等技术，能够生成符合人类偏好的回答。环境搭建是文档的核心部分，首先推荐读者参考《Docker AIGC等大模型深度学习环境搭建（完整详细版）》来配置必要的基础环境，如显卡驱动、CUDA、CUDNN以及Docker和Python等。这些环境对于运行大规模模型至关重要，特别是对于GPU加速的本地部署，ChatGLM-6B在INT4量化级别下仅需6GB显存。 Git Large File Storage (GitLFS) 的安装也尤为重要，因为大型模型文件通常会超过GitHub的标准存储容量。GitLFS作为一个专门处理大文件的工具，可以帮助管理和传输像ChatGLM-6B这样的模型文件。在安装GitLFS时，用户需要先更新包列表，然后通过curl命令安装GitLFS脚本并完成安装。文档中提到的模型下载地址为Huggingface网站，即<https://huggingface.co/THUDM/chatglm-6b>，这里不仅提供了模型文件，还包含相关的训练代码和工具，方便用户直接集成到自己的项目中。后续的内容将会涉及到多用户调用部署和模型微调的详细步骤，但具体的实施指南需参考《Python从零开始进行AIGC大模型训练与推理》的文章，该文章的链接为<https://blog.csdn.net/suiyingy/article/details/130169592>。本文档为对ChatGLM-6B环境搭建和初始部署感兴趣的开发者提供了一个清晰的指导，包括如何获取模型、配置必要的开发环境以及管理大文件，这对于那些希望通过本地部署利用该模型进行自然语言处理任务的用户来说，是一份宝贵的参考资料。

ChatGLM-6B 是清华大学团队推出的一个开源的、支持中英双语的对话语言模

型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量

化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需

6GB 显存）。ChatGLM-6B 使用了与 ChatGPT 相似的技术，针对中文问答和

对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、

人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符

合人类偏好的回答。

本节将介绍环境搭建与基本部署效果，后续博文将介绍多用户调用部署和

模型微调方法。具体更新请参考《Python 从零开始进行 AIGC 大模型训练与推

理》，地址为“https://blog.csdn.net/suiyingy/article/details/130169592”。

1 环境搭建

显卡驱动、CUDA、CUDNN、Docker、Python 等环境搭建请参考本专栏

另一篇博文《Docker AIGC 等大模型深度学习环境搭建（完整详细版）》，地

址为“https://blog.csdn.net/suiyingy/article/details/130285920”。

1.1 Git lfs 安装

相比于常规 Git，Git Large File Storage (LFS) 主要是用于大文件操作。

GitHub 的工程一般会有存储容量限制，因而很多模型文件由于超出容量限制而

被作者存储在类似百度网盘和谷歌网盘上。很多自然语言处理（NLP）、人工智

能生成内容（AIGC）、计算机视觉（CV）等大模型可在 huggingface 网站进行

下载，其工程比较完整，同时包括模型文件和程序。ChatGLM-6B 的 Huggingface

网站地址为“https://huggingface.co/THUDM/chatglm-6b”。Git lfs 更适合这类大

文件的上传更新与下载。

Git lfs 安装命令如下所示：

apt-get update

apt-get install git curl -y#如果已安装 curl，这一步可跳过。

curl -s

https://packagecloud.io/install/repositories/github/git-lfs/script.deb.

sh | bash

下载后可阅读完整内容，剩余8页未读，立即下载

苹果牛顿吃

粉丝: 23
资源: 2790

ChatGLM-6B环境搭建与本地部署：超越ChatGPT的开源大模型

Windows下cpu部署运行清华大学ChatGLM-6B语言模型（详解).docx

在 Linux 系统中搭建 Java 开发环境.docx

ASP.NET Core：ASP.NET-Core-简介与环境搭建.docx

Amazon AWS 搭建及部署手册.docx

ChatGPT技术的边缘计算与分布式部署方法.docx

周志华-机器学习-西瓜书-1-9章习题解析.docx

ubuntu环境安装tomcat部署文档.docx

php+mysql 环境搭建的图文教程.docx

ChatGPT的开发环境搭建教程.docx

每日科普-ChatGPT究竟是什么？.docx

最新资源