解读ChatGPT的技术原理和发展历程

6 浏览量更新于2024-08-03 收藏 2.37MB PDF 举报

"ChatGPT强势出圈和国内发展" ChatGPT是一种基于语言模型的聊天机器人，它的突破性在于使用人类的反馈来训练语言模型，以提高语言模型的自然语言理解能力。ChatGPT的运作机制是基于GPT模型的，它使用大量的人类反馈来迭代语言模型，使语言模型能够回答问题和承认错误。 GPT模型是一个生成的预训练的transformer模型，transformer模型是深度学习语言模型的一个基础框架。第一个GPT模型是在2018年6月份OpenAI提出的，得出了关键结论，就是transformer架构和预训练模型的结合，可以产生非常强大的语言模型。从2018年6月份开始，这种强大的自然语言理解的模型的技术范式开始被确立起来。 GPT模型的发展历程是从GPT1到GPT3，GPT3拥有大概1，750亿个参数，是一种非常强大的语言模型。然而，它的性能比较是一个瓶颈，因为模型特别大。在2020年5月份，GPT3提出了，基本上确立了大规模的预训练模型。 ChatGPT的模型是一种新的更新，特别是发布了对话模式的功能，可以放在网站上，让任何人来用对话的形式跟大模型进行交互。ChatGPT的工作原理是使用机器学习的算法来分析和理解文本输入的含义，根据文本输入去生成相应的响应。 ChatGPT的强势出圈和国内发展是基于以下几个方面：一、自然语言理解：ChatGPT可以理解人类的语言，回答问题，承认错误，并且可以拒绝不恰当的请求。二、机器学习算法：ChatGPT使用机器学习的算法来分析和理解文本输入的含义，根据文本输入去生成相应的响应。三、大规模预训练模型：ChatGPT基于GPT模型，拥有大概1，750亿个参数，是一种非常强大的语言模型。四、人类反馈：ChatGPT使用人类的反馈来训练语言模型，以提高语言模型的自然语言理解能力。五、对话模式：ChatGPT发布了对话模式的功能，可以放在网站上，让任何人来用对话的形式跟大模型进行交互。 ChatGPT的强势出圈和国内发展是基于自然语言理解、机器学习算法、大规模预训练模型、人类反馈和对话模式等几个方面。

¶ ChatGPT 的运作机制、技术原理ChatGPT 是一个基于语言模型 gpt 模型的一个聊天机器人，它是用我们人工智能的强化学习来进行训练的。

它的突破性主要是在于它用了人类的反馈来去训练语言模型a 通过增加人类的反馈来不断迭代人类的普通的标注，比如人类会对他所有的给出的答

案做出标注，哪些答案他的回答是比较好的，就给这样的答案以排名，把这样的排名再给我们的语言模型去进一步学习b 通过上万次的人类反馈的

迭代，就是通过不同的语言内容来去使语言模型去不断训练，直到语言模型回答的内容跟人类想要的内容是保持一致的。

这样就形成了 ChatGPT。

ChatGPT 它因为是基于 GPT 模型的一个语言模型。

我们就要大概的先讲一下 GPT 模型的一个一个来由GPT 模型是一个生成的预训练的 transformer 的模型。

transformer 模型是深度学习语言模型的一个基础的框架，是在 2018 年 6 月的时候开始有第一个gpt 模型a 从 2018 年 6 月份 OpenAi 提出

了第一个 gpt 模型，得出了关键结论就是我们说的 transformer 架构跟预训练模型的结合，就能够产生这种非常强大的语言模型b 可以实现强大

的自然语言理解。

也就是从 2018 年的 6 月份开始，这种强大的自然语言理解的模型的这个技术范式开始被确立起来。

接着在 2019 年 2 月到2020 年 5 月分别openAI 分别发布了 gpt2 和 GPT3c 到 GPT3 的时候已经比 GPT2 大一百倍，它拥有大概 1，750

亿个参数。

但是它跟原始的 GBT 模型并没有特别本质的不同，基本原理是大概一致的。

但是它的性能比较是它发展的一个瓶颈，因为它的模型特别大d 在 2020 年 5 月份提到了GPT3 以后，其实一直以来它大规模的预训练模型已经

基本上确立了，直到我们 2022 年 11 月底出来了。

ChatGPT 的模型。

这一次进行了一个新的更新，特别是发布了它的对话模式的功能，可以放在网站上，让任何人来用对话的形式跟大模型进行交互使得它可以做到回

答问题，而也能承认错误，或者是质疑不正确的一些问题，或者是拒绝不恰当的请求等等。

这样就形成了一个面向我们 c 端用戶去试用，非常好用的这么一个 ChatGPT 的一个机器人a 他的工作原理就是他就是用机器学习的算法来分析和

理解我们文本输入的一个含义，根据文本输入去生成相应的响应b 这个模型它是在大量的文本数据上进行训练，并叠加了大量的我们的人类的一些

标注的反馈，使得它能够去学习这种自然语言的模式和结构。

他是可以模拟对话或者是回答后续问题，承认错误等等c openAi 为了去创建这么一种强化学习的模型，它一定要去设立一些奖励模型d 奖励模型

就是openAi 去收集的比较多的数据，招募了很多人类的训练师。

在训练的过程当中，人类训练师就扮演了我们用戶和人工智能助手去进行交互的这么一个⻆色通过人类训练师对于人工智能助手的交互的数据去标

注回答问题好坏的排序，使得 ChatGPT 模型通过不断的跟人类训练师之间进行对话来去，通过对话来去生产数据生产答案。

通过对答案的好坏程度的一个排序标注a 使得这个模型就会根据学习的语料来去进一步的迭代他们。

他的回答的一个策略进行数字迭代以后，它的回答的训练的它的质量足以匹配人类的对话的风格b 所以它的这个技术的创新点主要是在于两大方

面，一大方面就是超大规模的预训练模型transform 模型这么一个技术的一个技术范式，这是一个目前被学术界公认作为最前沿最优秀的一个技

术的模式c 第二大创新点就是在于这种标注训练方式。

人类训练师通过不断的ChatGPT 模型进行对话，去标注，去排序，来使这个模型可以更好的学习到什么样的回答是人类认为比较合理的d 这两个

创新点就使得模型在这一次发展当中有了一个里程碑式的跨越的进展，这是一个 ChatGPT 的运作机制¶ 目前它的制约因素有几个方面首先是成本

过高，有两个方面的成本，一个方面是它的开发成本会比较高，另一方面是我们企业的使用成本会比较高a 它的开发成本是GPT 模型它的一个发

展历程，从GPT2 到 GPT3，它的算法模型上、技术上没有太大改变，但是它主要改变了这个模型大小。

从 gpt2 的一个1.17 亿的个参数量，到 gpt3 的一个 1，750 亿的这个参数量，是增加了 1，000倍的参数量b 预训练的训练数据从我们一开始

gpt2 的 5 个 tb 的训练语料，增加到GPT3，需要 45 个 tb 这样一个存储量的训练语料。

GPT3 训练一次的费用大概是 460 万美元，这是他训练一次的费用c 它整个 GPT3 的模型的训练的总成本是大概 1，200 万美元。

1，200 万美元是GBD3 的一个总训练的成本。

所以开发的成本是它的一个主要的⻔槛。

它的开发成本非常高第二个方面就是这个模型被训练好之后，对于任何的一个企业来说，它有一个使用的成本。

使用成本主要是 ChatGPT 单轮的对话的平均费用大概是在0.01 美元到0.2 美元之间，根据用戶的使用的并发数不同，成本也不同a 其次是

ChatGPT 的技术局限性。

技术的局限性主要，一个 ChatGPT，它只依赖于它见过的这些训练数据。

下载后可阅读完整内容，剩余5页未读，立即下载

2301_76429513

粉丝: 15
资源: 6728

解读ChatGPT的技术原理和发展历程

如何理解ChatGPT的强势出圈和国内发展？–20230215 2.pdf

计算机行业：ChatGPT，巨头都在干什么？.zip

ChatGPT是什么？有什么作用？如何使用？.pdf

银行业：ChatGPT如何改变银行业？浙商证券.pdf

ChatGPT将如何改变互联网电商行业？.pdf

华泰证券ChatGPT需要何种算力基础设施？.pdf.zip

chatgpt巨头都在干什么？.pdf

ChatGPT是否是AI的革命？.pdf

计算机行业深度报告-ChatGPT的流量去哪了？.pdf

全面解读ChatGPT产业链机会–20230201.pdf

最新资源