高效ChatGLM微调源码及PEFT使用指南

版权申诉

178 浏览量更新于2024-10-15 2 收藏 6.97MB ZIP 举报

资源摘要信息:"基于PEFT的高效ChatGLM微调python源码+使用说明.zip" 该资源是一个集成了高效ChatGLM微调技术的Python项目源码包，包含了使用说明，旨在为计算机科学、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的专业人员提供一个稳定可靠的学习与开发平台。该资源为计算机相关专业的在校学生、专业教师、企业员工提供了丰富的拓展空间，并鼓励进行二次开发。使用该资源时，用户可以在多个方面进行应用，包括入门学习、项目立题、课程设计、毕业设计以及作为公司初期项目的演示。详细知识点如下： 1. Python源码使用 - Python源码通常包含了文件夹结构，其中包含了模型训练、数据处理、结果保存等功能模块。 - Python源码需要依赖于Python环境，一般要求Python版本为3.x。 2. PEFT技术 - PEFT代表参数高效微调技术（Parameter-Efficient Fine-Tuning），是一种微调预训练语言模型的技术，旨在减少训练所需参数的数量，提高训练效率，同时减少模型规模。 - PEFT技术通常涉及对特定模型层进行微调，以达到模型性能提升与资源消耗的平衡。 3. ChatGLM模型微调 - ChatGLM是一种基于语言模型的对话系统，通过微调技术可以使其在特定任务或领域内表现更佳。 - 微调（Fine-Tuning）是指在一个大型预训练模型的基础上，通过在特定数据集上进行进一步训练，使其适应特定任务。 4. 模型训练参数设置 - `dataset`：分词后的数据集，通常用于模型训练的输入，存放在项目的data文件夹下。 - `lora_rank`：设置LoRA（Low Rank Adaptation）的秩，秩决定了模型调整的复杂度，推荐秩为4或8，秩越高模型调整越复杂，但也能提供更细粒度的控制，显存足够的情况下可以设置为8。 - `per_device_train_batch_size`：每块GPU上训练的batch size，根据GPU显存大小调整，显存不大的情况下尽量使用1-2。 - `gradient_accumulation_steps`：梯度累加步数，可以在不增加显存占用的情况下增加batch size，从而提高训练的稳定性。 - `save_steps`：多少步保存一次模型，此参数用于控制模型保存频率。 - `save_total_limit`：保存多少个checkpoint，此参数用于限制保存的模型数量，防止占用过多存储空间。 - `learning_rate`：学习率，是模型训练过程中非常重要的超参数，影响模型训练速度和最终性能。 - `output_dir`：模型文件保存地址，用于指定训练完成后模型权重的存储位置。 5. 文件结构分析 - `使用说明.md`：提供项目的使用说明文档，通常为Markdown格式，详细指导如何安装、配置和运行项目。 - `xfg_train.sh`：一个shell脚本文件，用于在类Unix系统上自动化执行训练过程。 - `requirements.txt`：包含项目运行所需的Python依赖包列表，便于用户安装和管理依赖。 - `src`：包含项目源代码的文件夹，通常组织为模块化的结构，方便理解和扩展。 - `data`：包含用于训练和测试的分词后数据集。 - `lora`：包含与LoRA微调技术相关的代码和资源。 - `script`：包含辅助脚本文件，例如用于数据预处理、模型评估等。 6. 使用场景建议 - 用户可以使用该项目进行学习、教学、研究或作为企业的技术演示。 - 在学习过程中，用户可以将本项目作为理解深度学习和自然语言处理技术的入门材料。 - 在教学中，教师可以将该项目作为课程大作业或课程设计的主题。 - 在研究领域，学生或研究人员可以基于该项目进行模型性能评估、新算法开发等。 - 在商业场景中，企业员工可以利用该项目进行快速原型构建、产品演示等。

收起资源包目录

基于PEFT的高效ChatGLM微调python源码+使用说明.zip （56个子文件）

parse.py 5KB

events.out.tfevents.1689124865.774acf98d497.1000.0 19KB

使用说明.md 3KB

__init__.py 217B

training_args.bin 3KB

README.md 2KB

generating_args.py 2KB

loader.py 4KB

dataset_info.json 54B

trainer_log.jsonl 19KB

train_baichuan.py 7KB

misc.py 5KB

requirements.txt 201B

metric.py 2KB

__init__.py 29B

events.out.tfevents.1689239274.774acf98d497.410.0 19KB

adapter.py 4KB

train_bash.py 585B

trainer.py 3KB

workflow.py 4KB

__init__.py 0B

metric.py 266B

finetuning_args.py 3KB

web_demo.py 6KB

all_results.json 167B

dataset.json 2KB

__init__.py 30B

trainer_state.json 12KB

workflow.py 3KB

trainer.py 10KB

ploting.py 2KB

train_results.json 167B

__init__.py 120B

xfg_train.sh 479B

data_args.py 4KB

trainer.py 4KB

model_args.py 3KB

adapter_config.json 377B

finetuning_args.json 254B

save_and_load.py 2KB

collator.py 6KB

constants.py 141B

callbacks.py 2KB

__init__.py 94B

__init__.py 30B

collator.py 727B

general_args.py 369B

adapter_model.bin 7.46MB

preprocess.py 7KB

trainer.py 1KB

__init__.py 148B

logging.py 306B

utils.py 2KB

workflow.py 3KB

model.py 8KB

webui_demo.py 5KB

共 56 条

.whl

粉丝: 3769
资源: 4525

高效ChatGLM微调源码及PEFT使用指南

基于LoRA和 P-Tuning v2 的ChatGLM-6B高效参数微调python源码+项目说明.zip

基于LoRA对ChatGLM进行微调实验python源码+训练好的模型+项目说明.zip

Fine-tuning ChatGLM-6B with PEFT _ 基于 PEFT 的高效 ChatGLM 微调.zip

人工智能-ChatGLM-基于 PEFT 的高效 ChatGLM 微调

大模型微调-使用PEFT微调ChatGLM-6B大语言模型-附流程教程+项目源码-优质项目实战.zip

Python_PEFT状态参数高效微调.zip

Qwen1.5大模型微调、基于PEFT框架LoRA微调，在数据集HC3-Chinese上实现文本分类。.zip

ChatGLM 微调指南：使用 PEFT 实现高效模型训练

Qwen1.5大模型微调、基于PEFT框架LoRA微调，在数据集HC3-Chinese上实现文本分类

浅谈全量微调和PEFT高效微调(LoRA)

最新资源