行业深度报告
请务必参阅正文后面的信息披露和法律声明 3 / 15
1、 GPT4、文心一言等大模型陆续发布,AIGC 或进入应用落
地加速期
1.1、 Open AI 发布多模态大模型 GPT4,相比 GPT3.5 能力全面提升
大语言模型 GPT4 发布,相比前代多项能力大幅提升。3 月 15 日,OpenAI 发
布了多模态预训练大模型 GPT4。GPT4 是目前世界上参数最多的自然语言处理模型
之一。基于大量参数,GPT4 可以在预训练阶段使用更大规模和更广泛领域的数据
集,这些数据集涵盖了各种语言、主题、风格和场景,使得 GPT4 具有更丰富的一
般知识和解决问题的能力。同时,GPT-4 是一个大型多模态模型,能接受图像和文
本输入,再输出正确的文本回复,且理解能力强大,甚至可以理解人类“梗图”。
此外,GPT 对长文本和语言表达的能力也有大幅提升,可以处理超过 25000 字的文
本,根据 open AI,在测试的 26 种语言中,GPT4 在 24 种语言方面的表现均优于
GPT3.5 等其他大语言模型的英语语言性能。GPT4 还开放了修改“系统提示”使用
功能,可以通过与用户交互来控制模型输出的风格和任务,这使得 GPT4 在垂直的
场景看到了更多的可能性。用户可以结合业务场景定制化 GPT4 的回复风格,以实
现更广泛领域的定制化。
表1:GPT4 相比 GPT3 和 GPT3.5 有了多项提升
GPT4 是目前世界上参数最多的自然语言处理模型之一。基于大
量参数,GPT4 可以在预训练阶段使用更大规模和更广泛领域的
数据集,比如 Common Crawl、Wikipedia、Reddit 等。这些数据
集涵盖了各种语言、主题、风格和场景,使得 GPT4 具有更丰富
的一般知识和解决问题的能力。
GPT4 是一个大型多模态模型,能接受图像和文本输入,再输出
正确的文本回复。这意味着,用户可以向它发送图片,它会根据
图片的内容和上下文,生成合适的标题、分类和分析。
目前 GPT4 最大 toke 数可达到 32768,相当于 50 页文字。GPT4
可以处理超过 25000 字的文本,允许用例如长文形式的内容创
建、扩展会话、文档搜索和分析等,而且不会出现逻辑不连贯、
语义混乱或重复冗余的问题。根据 open AI,在测试的 26 种语言
中,GPT4 在 24 种语言方面的表现均优于 GPT3.5 等其他大语言
模型的英语语言性能。其中 GPT4 的中文能够达到 80.1%的准确
性,而 GPT3.5 的英文准确性仅为 70.1%,GPT4 英文准确性提高
到了 85.5%。
GPT4 开放了修改“系统提示”使用功能,可以通过与用户交互
来控制模型输出的风格和任务,这使得 GPT4 在垂直的场景看到
了更多的可能性。用户可以结合业务场景定制化 GPT4 的回复风
格,以实现更广泛领域的定制化。
资料来源:机器之心公众号、Any 硬科技公众号、开源证券研究所