《AI研发新突破：自主训练LoRA技术细节揭秘》

144 浏览量更新于2024-10-07 1 收藏 53.46MB ZIP 举报

资源摘要信息:"《AI 研发提效研究：自己动手训练 LoRA》是关于如何使用低秩适应器（Low-Rank Adaptation，简称LoRA）技术来提高人工智能模型训练效率的研究。本资源详细探讨了在Llama和ChatGLM这类大型语言模型上应用LoRA技术的过程，并提供了关于如何训练模型以实现具体AI应用的指南。Llama和Alpaca LoRA模型是被关注的两种具有代表性的语言模型，它们是基于对大型预训练模型如GPT进行微调的框架。而ChatGLM Tuning是将LoRA应用于聊天机器人模型调整的一种技术。训练内容包括但不限于用户故事生成、测试代码生成、代码辅助生成、文本转SQL以及文本生成代码等应用。本资源的文件名称为‘unit-minions-master.zip’，暗示了一个包含众多‘小工’或‘小助手’的角色，可能是指训练好的模型或辅助工具，能够协助完成各种研发任务。标签‘人工智能’和‘lora’指明了本资源的研究领域和核心技术。" 知识点详细说明: ***研发提效: - AI研发提效是指在人工智能领域中，通过各种方法和技术提高研发效率的过程。这可以包括自动化工具的使用、更高效的算法设计、更好的数据处理技术等。 2. LoRA技术: - LoRA是低秩适应器（Low-Rank Adaptation）的缩写，是一种用于深度学习模型微调的技术。通过在大型预训练模型的基础上应用低秩分解，以小规模的参数调整达到与大规模模型相媲美的效果，从而降低计算成本和资源消耗。 3. Llama模型: - Llama可能指的是一个语言模型或特定的AI应用，但在本资源中没有详细描述。如果指的是大型语言模型，那么它可能类似于GPT或BERT这样的预训练模型，可以用于文本生成、摘要、翻译等多种任务。 4. Alpaca LoRA: - Alpaca LoRA可能是一个特定的模型变体，结合了LoRA技术和某个原始的模型，例如Alpaca。这个组合模型能够在保持原有模型性能的同时，减少训练和推理时所需的计算资源。 5. ChatGLM Tuning: - ChatGLM可能是基于LoRA技术进行微调的聊天机器人模型。Tuning意味着对预训练模型进行调整或优化，使其更好地适应特定任务或领域的需求。 6. 训练内容: - 用户故事生成: 指的是训练模型自动生成用户使用软件产品的故事或案例，这对于产品设计和开发过程非常有用。 - 测试代码生成: 训练AI模型生成自动化测试代码，以提高软件测试的效率和覆盖率。 - 代码辅助生成: AI模型帮助开发人员通过自动补全代码或提供代码建议来提高编程效率。 - 文本转SQL: 指的是训练AI模型将自然语言描述转换为SQL查询语句，用于数据库管理和数据分析。 - 文本生成代码: 使AI能够根据自然语言描述生成相应的源代码，实现功能需求。 7. unit-minions-master.zip文件: - 这个文件名称可能暗示了包含有多个小助手或组件，它们能够执行各种任务或作为模块被集成到其他系统中去。这些组件可能是已经训练好的模型，或者是辅助工具，用于支持上述训练内容的具体实现。 8. 标签"人工智能"和"lora": - 这两个标签明确了文档的核心主题。"人工智能"是涉及创建能够执行任务的智能机器的广泛领域，而"lora"则是文档讨论的特定技术。

收起资源包目录

《AI 研发提效研究：自己动手训练 LoRA》包含 Llama （Alpaca LoRA）、ChatGLM 相关 Lora 训练（93个子文件）

requirements.txt 6B

app.py 4KB

2014-04-04-000605.OF---银华多利宝B-银华多利宝货币市场基金份额发售公告.pdf 285KB

.openbayesdata 3B

codegen.jsonl 39.05MB

sql-train-8k.jsonl 1.37MB

java-train.jsonl 5.27MB

testgen.ipynb 10KB

prompts.json 2.91MB

codegen-40k.ipynb 24KB

requirements.txt 71B

.gitignore 6B

pdf-to-text.py 4KB

alipay.pic.jpg 235KB

test_to_code.md 242B

merge-jsonl.py 3KB

repository-3k.jsonl 3.32MB

2015-06-12-001477.OF---泰康薪意保A-泰康薪意保：基金合同.pdf 941KB

swagger_to_userstory_output.jsonl 375KB

test-to-code.jsonl 13.97MB

text-to-repository.py 1KB

codegen_40k.jsonl.zip 8.7MB

userstory_detail_double_clean_cn.jsonl 1.62MB

0950-unit-mesh.md 15KB

0949-chatflow.md 7KB

zsxq.pic.jpg 71KB

merge-demo.jsonl 261KB

text-to-sql.ipynb 3KB

userstory_map.jsonl 117KB

userstory.ipynb 9KB

demo.jsonl 26KB

2021-07-14-080011.OF---长盛货币A-长盛货币市场基金招募说明书更新.pdf 931KB

userstory_detail.jsonl 3.56MB

3000-steps.ipynb 5KB

codegen-20k.ipynb 18KB

2017-02-10-000830.OF---易方达天天发B-易方达天天发货币市场基金基金合同.pdf 798KB

0947-realtime-softare-gen.md 15KB

TestEssay.ipynb 22KB

0952-unit-runtime.md 7KB

index.json 229KB

text-to-sql.py 836B

.gitignore 15B

test-process.jpeg 182KB

0948-ai-programming.md 14KB

README.md 27KB

chatglm-tuning.ipynb 220KB

userstory_to_api_output.jsonl 371KB

text-to-code.py 623B

sql-train.csv 6.88MB

userstory_detail_clean.jsonl 2.73MB

test_to_code_output.jsonl 24.82MB

copilot-elements.png 293KB

chatglm-ptuning.ipynb 112KB

2017-10-10-005230.OF---长盛货币B-长盛货币市场基金托管协议.pdf 494KB

text-to-repository.ipynb 4KB

types.json 560KB

java.jsonl 11.5MB

repositories-5k.jsonl 5.42MB

userstory.ipynb 12KB

test_to_code_origin.jsonl 30.62MB

codegen-40k-2.ipynb 60KB

codegen-10k.ipynb 16KB

.gitignore 43B

repository-5k.jsonl 5.18MB

userstory_detail_double_clean.jsonl 2.73MB

split-users-tasks.ipynb 8KB

domain.ipynb 7KB

2016-12-16-004121.OF---兴银现金添利A-华福现金添利货币市场基金托管协议.pdf 505KB

test-to-code.py 3KB

demo.csv 13KB

codegen_20k.jsonl.zip 5.86MB

sql-train.jsonl 9.91MB

alpaca-user-story-lora.jpeg 286KB

README.md 231B

alpaca-lora.ipynb 11KB

0953-llm-lora-solution-for-ee.md 11KB

04-08-requirements.txt 177B

README.md 895B

.openbayesignore 24B

csv-to-json.py 263B

2016-07-13-002958.OF---财通财通宝B-财通宝AB：招募说明书.pdf 1.2MB

2015-06-12-001478.OF---泰康薪意保B-泰康薪意保：托管协议.pdf 395KB

.gitkeep 0B

.gitignore 32B

text-to-sql-alpaca-lora.ipynb 43KB

2014-03-10-519567.OF---浦银安盛日日盈B-浦银日日盈：基金合同.pdf 463KB

1000-steps.ipynb 3KB

codegen_100k.jsonl.zip 18.86MB

2017-04-06-004494.OF---华泰保兴货币B-华泰保兴货币市场基金：基金合同.pdf 381KB

0951-prompt-as-code.md 12KB

04-08-freeze.txt 4KB

CNAME 18B

llm-prompts.json 1.73MB

共 93 条

LeapMay

粉丝: 5w+
资源: 2303

《AI研发新突破：自主训练LoRA技术细节揭秘》

LLama3.1模型微调实战：全参、Lora与QLora技术深度应用

ChatGLM模型微调新方案：使用LORA在24G显存下训练

AI绘图新工具：Lora模型训练源码发布

自己动手训练LoRA

Alpaca-LoRA: 低等级 LLAMA 指令调整

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

人工智能-大模型-基于LLAMA2的增量预训练藏文大语言模型

实现一种多Lora权值集成切换+Zero-Finetune零微调增强的跨模型技术方案，LLM-Base+LLM-X+Alpaca

AI 研发提效自己动手训练 LoRA包含 Llama Alpaca LoRA模型ChatGLM ChatGLM Tun.zip

llama-factory一个数据微调用例

最新资源