深度学习Demo：基于反馈的大模型裁剪技术

版权申诉

31 浏览量更新于2024-11-04 收藏 1.44MB ZIP 举报

资源摘要信息:"本资源是一份Demo级别的项目，其核心在于展示如何通过基于反馈的大模型裁剪方法来支持特定的两个大型模型——baichuan和chatGLM。该Demo项目允许用户直接部署模型，意味着它可能包含了一个简化的模型部署环境或脚本，用户只需简单操作即可完成模型的部署过程。在这项工作中，'基于反馈的大模型裁剪方法'是一个关键的概念。裁剪（Pruning）通常指的是在机器学习领域中，尤其是深度学习模型训练完成后，去除掉模型中冗余或不重要的部分，以减小模型的规模、提高运行效率和推理速度的过程。裁剪可以基于不同的标准进行，例如基于权重的裁剪、基于神经元的裁剪或者基于通道的裁剪等。在这个项目中，裁剪可能是基于用户反馈来进行的，这意味着模型裁剪的过程可能不是静态的，而是能够根据用户与模型互动过程中收集到的反馈信息动态进行。从标题中的'baichuan'和'chatGLM'来看，这两个名词很可能指代的是两个不同的人工智能模型。尽管在给定信息中没有提供更多的细节，但可以推测这两个模型分别是各自领域的预训练大型语言模型。'baichuan'可能是一个中文的预训练模型，而'chatGLM'可能指代的是一个聊天型的大型生成模型（Generative Language Model），这种模型通常用于自然语言生成和对话系统。本项目中的'深度学习'标签表明，所涉及的模型裁剪技术属于深度学习的范畴。深度学习是机器学习的一个分支，它利用深层神经网络来模拟人脑进行分析和学习。深度学习在图像识别、语音识别、自然语言处理等多个领域取得了突破性的进展，并且是构建大型语言模型和聊天机器人的核心技术。在实际应用中，大型模型的部署往往是一个复杂的工程，涉及到模型的优化、加速以及资源分配等多个方面。本项目的Demo性质表明，它提供了一个可以快速尝试并体验模型裁剪效果的平台，便于用户验证模型裁剪技术带来的优势。此外，从文件名称列表中可以看出，资源包含了具体的文件，这些文件可能涉及模型的配置、部署说明、以及可能的使用手册。虽然没有具体列出这些文件的详细内容，但它们无疑是实现上述功能的核心部分。总体来说，这份资源为AI从业者或研究人员提供了一个展示和学习模型裁剪技术的平台，同时也可能为最终用户简化了大模型的部署和使用流程。对于希望了解和应用大型预训练模型的个人或团队来说，这是一份宝贵的资料。"

资源目录

收起资源包目录

深度学习Demo：基于反馈的大模型裁剪技术（165个子文件）

MEND.py 17KB

summarize.py 7KB

edit.py 38KB

demo.gif 740KB

data.py 3KB

SERAC.py 21KB

README.md 8KB

runningstats.py 64KB

memit_hparams.py 1KB

efk_hparams.py 2KB

serac_main.py 7KB

__init__.py 2KB

__init__.py 205B

logo.png 27KB

fever.py 4KB

batch_editor.py 538B

BaseTrainer.py 8KB

layer_stats.py 5KB

knowns.py 859B

rome_hparams.py 1KB

evaluate.py 16KB

plot_pararel_results.py 4KB

wiki.py 4KB

counterfact.py 9KB

eval_utils_counterfact.py 8KB

KE.py 12KB

kn_main.py 2KB

mend_main.py 5KB

ke_training_hparams.py 2KB

__init__.py 109B

FrameWork.png 408KB

singleton_editor.py 256B

compute_u.py 4KB

ike_hparams.py 936B

alg_dict.py 932B

ike_main.py 3KB

README.md 816B

trainer.py 15KB

nethook.py 15KB

__init__.py 85B

gpt2-xl.json 134B

logit_lens.py 3KB

ft_hparams.py 1KB

serac_training_hparams.py 2KB

pararel_evaluate.py 10KB

perplexity.py 758B

mend_training_hparams.py 2KB

nq.py 2KB

ft.py 5KB

run.py 3KB

kn_hparams.py 950B

editable_model.py 1KB

attr_snippets.py 1KB

utils.py 9KB

__init__.py 107B

README.md 861B

Illustration.png 130KB

knowledge_neurons.py 37KB

README.md 2KB

globals.py 2KB

compute_ks.py 2KB

local_nn.py 7KB

setup.py 925B

README.md 8KB

patch.py 9KB

tests.py 9KB

__init__.py 66B

eval_utils_zsre.py 6KB

util.py 1KB

__init__.py 92B

ENN.py 4KB

hooks.py 855B

compute_v.py 9KB

repr_tools.py 6KB

losses.py 3KB

editor.py 20KB

zsre.py 7KB

tok_dataset.py 3KB

zsre.py 10KB

LICENSE 1KB

alg_train_dict.py 197B

rome_main.py 6KB

hparams.py 1KB

__init__.py 92B

serac_hparams.py 2KB

__init__.py 74B

__init__.py 134B

efk_main.py 4KB

ft_main.py 6KB

compute_z.py 9KB

models.py 7KB

oracle.py 4KB

memit_main.py 10KB

__init__.py 91B

EditTrainer.py 8KB

portability_evaluate.py 4KB

generate.py 5KB

mend_hparams.py 2KB

tfidf_stats.py 2KB

__init__.py 105B

共 165 条

AI拉呱

粉丝: 2898
资源: 5550

深度学习Demo：基于反馈的大模型裁剪技术

AI大模型应用成果分享：baichuan-7B模型微调实战

深入理解大语言模型微调与推理技术

开源与大模型对比：ChatGLM与百度千帆等整理

大语言模型的微调和推理baichuan7B, chatglm2-6B, Qwen-7B-chat源码.zip

易于使用的LLM微调框架(LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM).zip

大语言模型的微调和推理-baichuan7B, chatglm2-6B, Qwen-7B-chat.zip

《AI大模型应用》-基于baichuan-7b的开源多模态大语言模型.zip

基于baichuan-7b的开源多模态大语言模型.zip

baichuan-7B 微调 C++ 面试大模型.zip

Laravel开发-baichuan .zip

最新资源