ChatGLM 微调指南：使用 PEFT 实现高效模型训练

163 浏览量更新于2024-10-02 收藏 197.67MB ZIP 举报

1. Python版本要求：本资源需要Python 3.8或更高版本进行执行。Python是人工智能领域广泛使用的编程语言，以其简洁、易读性著称。在执行本资源之前，确保安装了正确版本的Python环境，这对于运行代码和使用相关库至关重要。 2. PyTorch版本要求：本资源还要求使用PyTorch 1.13.1+。PyTorch是一个开源机器学习库，基于Python，广泛应用于计算机视觉、自然语言处理等人工智能领域。PyTorch的特点是动态计算图，可以提供灵活的深度学习模型构建方式。 3. 关键库：在本资源中使用了Transformers、Datasets、Accelerate、PEFT和TRL等库。其中，Transformers是Hugging Face公司提供的一个库，提供了大量预训练模型和构建深度学习模型的方法。Datasets库提供数据集管理功能。Accelerate库用于加速训练过程。PEFT是PyTorch的扩展库，用于进行参数效率微调。TRL库则专注于大规模模型的训练。 4. 工具和库：资源中还涉及Fire、protobuf、cpm-kernels和sentencepiece等工具。Fire是一个用于创建命令行接口的库。Protobuf是Google开发的一种数据交换格式。Cpm-kernels是针对高性能计算优化的核函数库。Sentencepiece是一个无监督的文本分割库，用于进行分词。 5. 中文处理库：在评估过程中使用了Jieba、Rouge-Chinese和NLTK库。Jieba是一个流行的中文分词工具，能够将中文文本切分成词语序列。Rouge-Chinese是用于评估文本摘要质量的库，NLTK（Natural Language Toolkit）是一个广泛使用的自然语言处理库。 6. 可视化和API构建库：gradio和matplotlib用于train_web.py，提供模型训练过程的可视化展示和结果的图形化展示。Uvicorn、FastAPI和SSE-Starlette用于构建api_demo.py，其中Uvicorn是ASGI服务器，FastAPI是一个现代、快速（高性能）的Web框架，用于构建API，SSE-Starlette则是FastAPI的一个扩展，用于实现服务器发送事件（Server-Sent Events，简称SSE）。 7. 硬件要求：资源要求有强大的GPU支持。GPU（图形处理单元）特别擅长处理并行计算任务，对于深度学习模型训练尤其重要。强大的GPU能够显著加速模型训练和推理的速度，提高数据处理的能力。 8. 微调技术：本资源着重于基于PEFT（Parameter-efficient Fine-tuning）的高效微调技术。微调是深度学习中的一项技术，通过在特定任务的数据集上调整预训练模型的参数，使模型更适应新任务。PEFT技术旨在通过更少的参数调整达到更高效的微调效果。 9. ChatGLM模型：本资源与ChatGLM模型相关。ChatGLM（Chat Generative Language Model）是一种生成式预训练模型，用于自然语言生成和理解任务，如聊天机器人、问答系统等。与传统模型相比，ChatGLM更注重对话的连贯性和自然性，适合构建与人类交流的智能系统。 10. 整体流程：在进行微调时，通常会涉及以下几个步骤：首先加载预训练模型和微调数据集；接着调整模型结构以适应特定任务；然后在特定数据集上训练模型；最后评估模型性能，必要时进行优化调整。整个过程需要利用到上述的库和工具来实现高效和效果良好的模型微调。

资源目录

收起资源包目录

ChatGLM 微调指南：使用 PEFT 实现高效模型训练（129个子文件）

README.md 1KB

refgpt_zh_50k_p1.json 97.18MB

alpaca_gpt4_data_zh.json 33.47MB

trainer.py 2KB

export_model.py 681B

ads_generation_2.jpg 91KB

alpaca_gpt4_data_en.json 41.37MB

ads_generation_5.jpg 86KB

alpaca_data_zh_51k.json 17.94MB

covid_doctor_3.jpg 56KB

logging.py 719B

generating_args.py 2KB

api_demo.py 609B

finetuning_args.py 3KB

cli_demo.py 1KB

sft.py 5KB

covid_doctor_5.jpg 27KB

workflow.py 3KB

train_bash.py 596B

adapter.py 4KB

hh_rlhf_en.py 4KB

oaast_sft_zh.json 1.02MB

sharegpt_zh_27k.json 77.9MB

loader.py 8KB

utils.py 4KB

setup.py 2KB

ads_generation_4.jpg 46KB

example_dataset.py 1KB

belle_multiturn.py 3KB

callbacks.py 3KB

covid_doctor.md 9KB

covid_doctor_4.jpg 38KB

ads_generation.md 6KB

cloudflare-tunnel-to-colab.ipynb 3KB

top.py 2KB

ads_generation_6.jpg 60KB

ads_generation_3.jpg 137KB

manager.py 1KB

infer.py 1KB

alpaca_data_en_52k.json 21.72MB

refgpt_zh_50k_p2.json 78.87MB

alter_self_cognition_2.jpg 78KB

web_demo.py 1KB

loader.py 4KB

comparison_gpt4_data_en.json 27MB

covid_doctor_9.jpg 141KB

eval.py 2KB

self_cognition.json 18KB

convert_comparison.py 2KB

css.py 387B

data_args.py 4KB

model_args.py 3KB

dataset_info.json 5KB

save_and_load.py 2KB

trainer.py 2KB

lima.json 2.85MB

alter_self_cognition_1.jpg 159KB

collator.py 6KB

locales.py 13KB

alter_self_cognition_3.jpg 66KB

covid_doctor_6.jpg 85KB

collator.py 704B

covid_doctor_7.jpg 196KB

utils.py 515B

misc.py 5KB

covid_doctor_2.jpg 55KB

interface.py 2KB

README_zh.md 1KB

utils.py 2KB

oaast_sft.json 32.68MB

preprocess.py 7KB

chat.py 3KB

runner.py 8KB

comparison_data_v2.json 77.7MB

wechat.jpg 142KB

covid_doctor_1.jpg 54KB

covid_doctor_8.jpg 69KB

protocol.py 2KB

common.py 2KB

data.py 606B

translate_hh_rlhf.py 2KB

examples.json 1KB

parser.py 6KB

trainer.py 4KB

trainer.py 10KB

trainer_state.jpg 80KB

comparison_gpt4_data_zh.json 23.33MB

app.py 4KB

oaast_rm.json 53.48MB

stream_chat.py 4KB

chatbot.py 2KB

workflow.py 3KB

oaast_rm_zh.json 1.64MB

export.py 861B

metric.py 2KB

ultra_chat.py 3KB

workflow.py 4KB

alter_self_cognition.md 5KB

ploting.py 2KB

ads_generation_1.jpg 80KB

共 129 条

博士僧小星

粉丝: 2441

ChatGLM 微调指南：使用 PEFT 实现高效模型训练

Fine-tuning ChatGLM-6B with PEFT _ 基于 PEFT 的高效 ChatGLM 微调.zip

基于PEFT的高效ChatGLM微调python源码+使用说明.zip

高效ChatGLM微调源码及PEFT使用指南

人工智能-大模型-基于大模型ChatGLM，微调方式为LORA，集SFT、RM、PPO算法为一体项目

ChatGLM-6B高效微调技术实现与项目说明

基于LoRA对ChatGLM进行微调实验python源码+训练好的模型+项目说明.zip

在ChatGLM大模型上利用LoRA方法进行小参数学习，训练语料库选择中文alpaca-zh

垂域大模型微调PPT方案V1.pdf

垂域大模型微调策略探索：法律领域的PPT方案

基于LangChain和QLora的本地知识库问答系统项目源码发布

最新资源