谷歌深度学习遭遇瓶颈：巨资应对模型精度‘U型’曲线

版权申诉

97 浏览量更新于2024-08-04 收藏 1.62MB PDF 举报

深度学习的发展历程中，谷歌科学家近期在一项名为Inverse Scaling Prize的知名语言模型竞赛中揭示了一个关键现象：随着深度学习模型的规模持续扩大，其准确率并未呈现线性提升，而是呈现出一种“U型”曲线[1]。这一发现挑战了所谓的Scaling Law（规模法则），这是OpenAI在2020年提出的观察结果，类似于摩尔定律在集成电路领域的地位，即模型性能随数据量增加而提升。 Scaling Law原本预测的是，更深、更大的神经网络会因输入数据量的增加而展现出更强的性能。然而，实际研究中发现，当模型规模达到一定阈值后，继续增大模型可能会导致性能提升减缓甚至下降，形成一个性能顶峰，这表明过度依赖模型规模可能并非总是最优策略。这并不是说Scaling Law本身失效，而是它需要在特定的条件和限制下考虑。过去几年，各大科技公司如火如荼地进行算力竞赛，推出了一系列大型模型，如GPT-3、Megatron和OPT-175B等，试图通过更大规模的训练来突破技术瓶颈。然而，随着黑盒效应的显现和某些情况下更多数据的投入并未带来显著效果，表明深度学习的发展可能正面临一个新的转折点。这引发了一场关于如何更有效地利用资源，包括资金和技术，以推动深度学习技术真正突破“撞墙”状态的讨论。谷歌表示，现在可能是时候考虑利用其强大的经济实力，不仅在硬件上投入更多，还可能涉及到算法优化、模型架构创新以及对数据质量和多样性等方面的深入研究，以实现真正的技术突破。总结来说，深度学习的未来发展将不再单纯依赖规模扩张，而是需要结合更精细的科学方法、针对性的研究方向和更有效的资源管理，以找到突破现有困境的新路径。这不仅对谷歌这样的巨头提出了新的挑战，也对整个AI领域的研究者和实践者提出了新的思考课题。

2023/6/28 16:56

深度学习撞墙？谷歌：是时候动用钞能力了

https://mp.weixin.qq.com/s/elaR7YVLp8mkkt4RDCmX3Q

1/10

深度学习撞墙？谷歌：是时候动用钞能力了

文  | 天于刀刀

推特上万众瞩目的明星语言大模型比赛项目 Inverse Scaling Prize 终于在近期落下了帷幕，这

也是社区中第一次针对 scaling law 反例的探究，各式各样的大模型和 NLP 任务在比赛期间被

提出和应用，同样许许多多的成果也在这次比赛中被挖掘和体现。

例如，来自 Google 团队的科学家近期发现，随着语言模型规模的不断扩大，模型准确率会出

现“ U 型”曲线 [1]！

天于刀刀 2022-11-15 12:05 发表于四川

原创

夕小瑶科技说

下载后可阅读完整内容，剩余9页未读，立即下载

地理探险家

粉丝: 1255
资源: 5610

谷歌深度学习遭遇瓶颈：巨资应对模型精度‘U型’曲线

深度学习撞墙？谷歌：是时候动用钞能力了.rar

【技术】防撞墙施工技术交底.pdf

无拉杆中央隔离撞墙施工模板体系.pdf

VHDL贪吃蛇报告.pdf

java小游戏.pdf

C语言迷宫游戏.pdf

道路隔离墩安装.pdf

南天PR2维修资料.pdf

c语言贪吃蛇课程设计报告.pdf

C语言课程设计任务书.pdf

最新资源