没有合适的资源?快使用搜索试试~ 我知道了~
首页华泰证券:AI大模型企业成功要素与竞争格局研究
华泰证券:AI大模型企业成功要素与竞争格局研究
需积分: 0 5 下载量 116 浏览量
更新于2024-06-25
收藏 6.49MB PDF 举报
华泰证券的电子行业专题研究报告《AI大模型企业是如何炼成的》深入探讨了人工智能领域中大型模型企业的成功要素。该报告认为,AI大模型行业的发展依赖于资本密集、人才密集和数据密集的特性,构建一个有效的“数据-模型-应用”循环是决定企业能否在竞争中脱颖而出的关键。 首先,报告关注了国际巨头微软和OpenAI。微软通过与OpenAI的合作,解决了算力瓶颈问题,将OpenAI的大模型能力融入其办公软件、搜索引擎、操作系统和云服务等多个产品线,体现了其在技术水平和产品商业化方面的领先地位。OpenAI的成功源于高人才密度、对AGI(人工智能通用性)的坚定信念、Transformer架构的选择和迭代,以及与微软的紧密合作。 谷歌虽然拥有深厚的AI技术和人才储备,但在产品化方面曾落后于OpenAI。然而,谷歌近期在产品化和生态建设上有所加速,显示出其在技术储备和业务生态上的实力。报告指出,谷歌的策略是利用其广泛的技术储备和潜在的业务场景,推动AI技术向更多实际应用转化。 在国内市场,百度、阿里、商汤、华为等企业也积极投入,AI大模型行业的竞争日趋激烈,形成“百模大战”。这些企业能否构建起“数据-模型-应用”的飞轮,形成正反馈循环,将是决定最终胜负的关键因素。 报告强调了AI大模型企业成功的关键在于技术领先、人才积累、战略选择以及产品与市场的紧密对接。同时,它还揭示了不同企业在AI领域的独特优势和挑战,为中国及全球的AI企业发展提供了有价值的参考和启示。
资源详情
资源推荐
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。
10
电子
图表11: GPT 以 Transformer 解码器为基础架构
资料来源:《Attention Is All You Need》(Vaswani et al., 2017),华泰研究
不断扩大数据量和参数量进一步提升模型的表现。GPT 系列模型结构秉承了不断堆叠
Transformer 的思想,通过不断提升训练语料的规模、网络的参数数量来完成 GPT 系列的
迭代更新。
图表12: GPT 系列的迭代更新
资料来源:斯坦福 Ecosystem Graphs,陈巍谈芯公众号,华泰研究
InstructGPT 极大地提升了通用 AI 系统与人类意图的对齐能力。InstructGPT 基于 GPT-3
的架构,引入了指示学习(Instruction Learning)来使得 AI 系统更遵循人类指令,减少产
生有害或错误内容的可能性;同时,引入人类反馈的强化学习(Reinforcement Learning with
Human Feedback,RLHF)训练机制,通过强化学习范式让生成式 AI 产出的内容更符合
人类意图。
多模态能力和预测扩展工具让 GPT-4 与万物互联。2023 年 3 月,OpenAI 发布 GPT-4,模
型支持文本和图像输入的多模态能力,应用空间想象力巨大,有望重塑从浏览器到文档智
能等的软件交互。同时,OpenAI 推出具备预测扩展性的深度学习堆栈,用极小算力成本就
能可靠预测 GPT-4 在下游垂直领域应用的性能,让小成本广泛试用成为可能。在选择合适
的大模型后,模型微调让通用基础模型在细分领域的表现进一步提升。
应用:以产品为导向形成数据飞轮,逐步构建生态圈
推动技术商业化,形成模型调用、用户数据反馈和模型迭代的正反馈循环。OpenAI 始终以
产品为导向,积极推出产品以迅速获取用户,从而得到用户反馈数据来训练出更好的模型。
2020 年,OpenAI 在发布 GPT-3 后快速开放商用 API 服务,让下游客户通过 API 调用模型
能力。在 ChatGPT 的训练过程中,则融入用户数据反馈:1)采用 GPT-3 API 获取的真实
用户请求微调基础模型;2)引入 RLHF 训练机制,采用人工标注的数据,通过人类的反馈
解码器
Transformer层数
训练语料量 参数量 模型性能
GPT-1 12 5GB 1.17
GPT-2 48 40GB 15
GPT-3 96 1350GB 1750
层 亿 生成的文本存在不流畅和不合理
层 亿
可以生成更长、更自然、更连贯的文本;
具备对未知词的生成能力
层 亿
可以在没有接受任何指导的情况下完成一些任务;
支持多语种生成和对话生成等其他任务
下载日志已记录,仅供内部参考,股票报告网
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。
11
电子
进行强化学习,针对性地进行模型优化。这使得 ChatGPT在多个自然语言任务如文书写作、
代码生成与修改、多轮对话等中展现出远超 GPT-3 的优秀能力,并让有害和不真实输出有
效减少。
图表13: 商用 API 服务示例
资料来源:OpenAI 官网,华泰研究
技术与产品的整合进一步推动数据飞轮的运转。当前,微软将把 OpenAI 的技术与旗下各
应用生态的产品整合,涵盖企业级云计算、办公、底层代码生成和娱乐交互等各个应用层
面。
图表14: 微软产品与 OpenAI 模型的整合
资料来源:微软科技公众号,大数据应用公众号,机器之心公众号,华泰研究
GPT-4 开始构建生态圈,与各个领域的软件开展合作。Be My Eyes 是一款帮助全世界的盲
人以及低视力人群的产品,通过 GPT-4 的视觉输入功能,Be My Eyes 能够大幅度提高
Virtual Volunteer 对图片的理解程度。语言学习软件 Duolingo 推出 GPT-4 驱动的 Duolingo
Max,能够辅助用户解释答案对错,以及陪同用户进行角色扮演式地练习。随着 AI 工具在
C 端渗透率逐步提升,各行业生态中的数据反馈越来越丰富和庞大,进一步推动数据飞轮
的快速运转。
图表15: GPT-4 与 Be My Eyes 合作
图表16: GPT-4 与 Duolingo 合作
资料来源:OpenAI 官网,华泰研究
资料来源:OpenAI 官网,华泰研究
23年1月,推出Azure
OpenAI服务,帮助云
计算平台的客户/开发
人员自主开发AI应用
更好地服务企业
级云计算客户
23年3月推出集成
ChatGPT技术的
Office——Copilot
23年2月,推出由
ChatGPT支持的新版
Bing和Edge浏览器
23年2月28日,宣布将
ChatGPT版Bing集成
到Windows任务栏中
将GitHub社区
作为AI生成代
码的训练集
OpenAI技术落
地到游戏的生产、
分发与用户体验
提升个人生产效率
智能化生成
底层代码
升级娱乐交
互体验
ToB ToC
下载日志已记录,仅供内部参考,股票报告网
剩余53页未读,继续阅读
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功