大模型驱动的Self-Instruct指令自动化生成

需积分: 0 25 浏览量更新于2024-06-16 收藏 2.06MB PDF 举报

"大模型自动生成SFT指令总结" 本文主要讨论了利用大模型自动生成Self-Instruct数据的流程，这是一种基于大模型的指令生成方法，旨在创建更丰富的任务指令集合。以下是关于Self-Instruct数据生成流程的详细解析： 1. Self-Instruct数据生成流程 Self-Instruct的数据生成是一个迭代过程，它依赖于一个初始的种子指令集，包含175个人工设计的任务。这个流程主要包括四个步骤： Step1：指令生成首先，从种子指令集中选取一定数量的任务，利用预训练的大模型（如GPT-3）生成新的指令。这些新指令可能是基于现有任务的变体或全新的任务描述。 Step2：指令分类接下来，需要判断生成的指令是否对应于一个分类任务。如果一个指令可以被理解为要求模型做出类别选择，那么它就是一个分类任务。 Step3：任务输出根据指令的分类结果，生成相应的任务输入和输出。对于分类任务，模型会提供Class_label（类别标签）和Input（Output-first）；对于非分类任务，模型则输出Input和Output（Input-first）。 Step4：数据过滤与后处理最后，生成的指令和相关数据会经过过滤和后处理，去除低质量的样本，确保数据集的质量。处理后的数据将被添加回指令池，作为下一轮生成的输入。 2. 生成任务指令在这个阶段，通过编程方式打开并读取指定目录下的机器生成指令文件，这通常是JSON格式，包含了指令、输入和输出等信息。这些信息被用来引导模型生成新的任务指令。 3. 模型迭代与引导在每一轮迭代中，模型从指令池中随机抽取一定数量的指令（如8个），形成一个上下文示例，然后用这个示例引导大模型生成新的任务指令。随着迭代的进行，模型生成的指令逐渐增多，逐步丰富指令集合。这个过程持续进行，直到满足停止条件，如达到模型长度限制、生成过多示例或者模型自我停止。生成的指令可以用于训练模型执行各种任务，提升模型的理解和泛化能力。总结来说，Self-Instruct是一种利用大模型的生成能力来扩展和改进任务指令集的方法，通过迭代和自我引导，不断优化指令质量和多样性，有助于提升模型在各类任务上的性能。这一技术对于构建更加智能和灵活的AI系统具有重要意义。

由

于

后

续

对

于

分

类

任

务

和

⾮

分

类

任

务

有

两

种

不

同

的

处

理

⽅

法

，

在

本

步

骤

需

要

对

指

令

是

否

为

分

类

任

务

进

⾏

判

断

，

同

样

也

是

利

⽤

拼

接

⼏

个上下

⽂

示

例

的

⽅

法

让

模

型

⾃

动判

断

任

务

类

型

是

否

是

分

类

。

（

判

断

指

令

是

否

属

于

分

类

任

务

的

操

作

如

下：

在

种

⼦

池

中

随

机

挑

选

条

分

类

指

令

和

条

⾮

分

类

指

令

，

然

后

加

上

新

⽣

成

的

指

令

。

）

确

定

指

令

是

否

代

表

分

类

任

务

构

建

prompt

数据

，

针

对

是

否

分

类

分别

构

建

不

同

的

prompt

数据

，

是

否

是

分

类

任

务

是

输

出

优

先

，

否

输

⼊

优

先

，

对

应

的

prompt_instructions/prompt_i

nstances

不⼀

样

def encode_prompt(prompt_instructions, classification=False):

"""Encode multiple prompt instructions into a single string."""

if classification:

prompt = "Come up with a series of classification tasks. Try to sp

ecify the possible output labels when possible.\n"

else:

prompt = "Come up with a series of tasks:\n"

for idx, instruction in enumerate(prompt_instructions):

instruction = re.sub(r"\s+", " ", instruction).strip().rstrip(":")

prompt += f"{idx+1}. {instruction}\n"

prompt += f"{len(prompt_instructions) + 1}."

return prompt

Python

剩余20页未读，继续阅读

dreampai

粉丝: 4
资源: 6

大模型驱动的Self-Instruct指令自动化生成

SIFT算法整理

sift算法总结

sift 算法总结

中文对话0.2B小模型开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部

中文对话0.2B模型，开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全码

开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力

大语言模型浅探谈，包括GPT模型、RWKV模型

sfg-pet-clinic:SFT宠物诊所

盘点国内热门AI大模型.docx

最新资源