LLaMA开源模型：推动行业AI发展，降低数据安全门槛

需积分: 0 170 浏览量更新于2024-06-26 2 收藏 2.05MB PDF 举报

随着计算机行业的发展，大语言模型自Transformer在2017年的出现后经历了一个由开源逐渐向封闭式研发转变的过程。这个转变导致了头部人工智能（AI）公司的先进模型成为技术竞争的关键壁垒。OpenAI和Google等公司在保持部分模型开源的同时，也倾向于保留核心技术，通过这种方式建立竞争优势。然而，直接将大型AI模型应用到特定行业面临诸多挑战，如通用能力过剩、缺乏行业专业知识和高计算资源消耗。因此，针对垂直行业的定制化模型开发变得尤为重要。通过基于开源模型（如LLaMA）进行开发，可以平衡成本效益，尤其是在对数据隐私和安全性要求高的领域，如政府、金融、电力和制造业。 Meta公司推出的LLaMA大模型是一个具有突破性的开源选择。它利用通用领域的大量开源数据集进行训练，涵盖了40种语言，拥有约1.4万亿个token，虽然参数量相对较少，但其性能却与PaLM和GPT-3等顶级模型相当。LLaMA的轻量级设计使得它在部署和二次开发上更为便捷，且其高度的灵活性、可配置性和泛化能力使其成为垂直AI模型的理想基础架构。 LLaMA的开源特性允许AI开发者根据行业特性和应用的数据进行个性化定制，从而创建符合特定行业需求的“行业发行版AI模型”。例如，斯坦福大学发布的Alpaca模型就是基于LLaMA-7B进行微调，仅需少量资源就能实现高效的对话类语言模型，这表明在迁移学习阶段，尽管初始训练可能消耗一定的算力，但在后续微调阶段成本较低。在推理阶段，LLaMA的优势更加明显，特别是在大型服务器上，即使是8块A100 GPU也能支持大规模用户的实时推理需求。这使得LLaMA成为推动AI技术在各个垂直行业中广泛应用的重要工具，促进了技术的创新和普及。 LLaMA的开源策略不仅降低了行业进入门槛，还促进了技术生态的繁荣，使得AI技术更好地服务于不同行业的实际需求，推动了整个计算机行业的进步和技术创新。

行业深度研究

敬请参阅最后一页特别声明

界以及部分 AI 初创企业的选择：

 行业技术发展：Google 于 2017 年提出 Transformer，采用完全开源模式，凭借其性

能优势统一了深度学习底层算法，为后续的大模型发展奠定技术基础。2018 年 BERT、

GPT-1 等生成式语言模型陆续发布，也采用完全开源模式，带动 AI 行业高速发展。

 生态构建：部分初创 AI 公司选择模型开源更多是出于自身生态建设的考虑。以

Stability AI 为例，公司成立于 2020 年，于 2022 年 9 月开源文生图模型 Stable

Diffusion，成为目前 AI 绘画赛道的佼佼者。目前 Stability AI 已经在全球积累了超过

14 万名开发人员和 7 个研究中心社区，各渠道累计日活跃用户数超过 1,000 万，日

益成熟的生态建设是推升公司估值的主要驱动力之一。

目前 OpenAI、Google、Meta 等领先的头部 AI 大厂对于先进模型大多采用部分开源模式

或仅开放使用。以 OpenAI 为例，我们可以管窥海外头部 AI 厂商正在逐渐由开源走向闭

源：

 2019 年及之前，OpenAI 以完全开源为主。OpenAI 于 2018 年发布第一代生成式预

训练模型 GPT-1 并对外完全开源；2019 年 2 月 GPT-2 论文发表，在模型规模和

Zero-shot 表现上提升较为明显，模型代码于同年 8 月开始分 4 批陆续对外开源。

 2019 年 OpenAI 成立盈利子公司 OpenAI LP，开始向盈利公司转变。2020 年 OpenAI

发布 GPT-3，并在论文中较为详细地介绍了模型训练情况，此外用户还可以通过 API

的方式调用模型资源，属于对外部分开源。GPT-3 的发布加快了 AI 落地进程，此后

OpenAI 逐渐向闭源转变。

 未来 OpenAI 可能采用仅开放使用模式。OpenAI 于 2022 年 11 月发布 ChatGPT，

虽然官方未发布模型的具体论文，但目前 AI 开发者仍能从相关论文中获取技术路线

信息，显著促进了行业技术的整体进步。2023 年 3 月，OpenAI 同步开放了 GPT-3.5

及语音识别翻译 Whisper 模型的 API。3 月 14 日，GPT-4 发布，目前也处于仅开放

使用状态，尚未向外部公布任何技术细节。

图表

：

OpenAI

的系列模型开始向闭源发展

来源：OpenAI 官网,国金证券研究所

选择部分开源或闭源的模式有助于维持 AI 厂商技术优势。根据 Percy Liang 等人于 2022

年 11 月的研究，非开源模型性能优于开源模型：在 16 项核心语言类任务中，开源模型

在 13 项任务中表现不及部分开源或闭源模型。AI 大厂或延续部分开源或闭源模式，以此

构建技术护城河。

剩余15页未读，继续阅读

职场程序猿

粉丝: 6393
资源: 3706

LLaMA开源模型：推动行业AI发展，降低数据安全门槛

计算机行业深度研究.pdf

计算机行业深度分析报告.pdf

计算机行业投资策略周报：LLaMA 2开源，加速应用百花齐放.pdf

计算机行业专题研究：“安卓版”大模型助推，算力和应用的黄金时代.pdf

Goat: LLaMA细调模型超越GPT-4完成算术任务

华为mindspore培训资料：Llama2.pdf

基于中文金融知识的LLaMA系微调模型的智能问答系统：LLaMA大模型训练微调推理等详细教学

华为mindspore培训资料：LLaMA-slides.pdf

计算机行业2023年8月投资策略暨Q2业绩前瞻：板块业绩逐步复苏，LLama2开源和AI定价打开AI应用空间.pdf

纯C环境中的Llama 2模型推理：Llama 2

最新资源