微软开源DeepSpeedChat,昆仑万维「天工」大模型即将发布

需积分: 2 0 下载量 119 浏览量 更新于2024-08-04 收藏 1.09MB PDF 举报
“微软开源DeepSpeedChat,昆仑万维大模型“天工”将发布.pdf” 本文主要讨论了微软开源其DeepSpeedChat工具以及昆仑万维即将发布的大语言模型“天工”,这两个事件对AI和传媒行业的影响。 微软的DeepSpeedChat是基于DeepSpeed深度学习优化库开发的,专为简化类ChatGPT大语言模型的训练而设计。这个工具的核心亮点在于其强化推理、RLHF(人工反馈机制的强化学习)模块和RLHF系统。通过这些技术,DeepSpeedChat显著提升了训练效率,使得训练130亿参数的模型的时间从原本的数小时缩短到只需1.5小时,且降低了成本。此外,它还支持训练具有数千亿参数的大型模型,展现了出色的可扩展性。这一开源举措有望推动ChatGPT类型的模型发展,进一步促进AIGC(人工智能生成内容)领域的成长,为未来的商业应用打开更广阔的市场。 另一方面,昆仑万维与奇点智源合作研发的“天工”大语言模型即将面世,预计在4月17日启动邀请测试。作为国内首个实现智能涌现的对话式AI助手,“天工”将为国内AI领域带来创新突破,预示着中国在大模型领域的竞争实力增强。昆仑万维作为核心参与者,其在AI行业的地位将得到提升,可能对传媒板块产生积极影响。 传媒板块近期表现活跃,AI技术的进展如ChatGPT等成为推动板块估值上升的重要因素。同时,随着行业各公司的业务逐步恢复,预计今年业绩将实现低基数下的高增长。因此,分析师建议关注传媒板块的投资机会,特别是在AI、游戏、数据、IP等相关领域的企业。推荐的标的包括昆仑万维、360、恺英网络、吉比特等游戏公司,以及中国科传、同方股份等数据相关企业,以及奥飞娱乐、光线传媒等IP相关公司。 微软开源DeepSpeedChat和昆仑万维的“天工”大模型发布,预示着AI技术在传媒行业的广泛应用和深化,这将激发更多的创新和商业潜力,同时也为投资者提供了新的关注点。