ChatGPT训练成本揭秘：200万至1200万美元的科技竞赛

需积分: 5 78 浏览量更新于2024-08-03 收藏 286KB PDF 举报

随着ChatGPT在全球范围内的轰动效应，科技巨头们对生成式人工智能的兴趣与日俱增，尤其是基于大模型的人工智能技术。大模型，通常是指经过大规模无监督学习训练，能够在各种场景下进行微调或二次训练以适应特定应用的模型。GPT-3的训练成本已经相当高昂，单次训练可能耗资约140万美元，而对于更大规模的LLM，成本甚至可以飙升到200万至1200万美元。例如，要支撑ChatGPT在1月份的1300万独立访客量，所需的硬件资源包括3万多片NVIDIA A100 GPU，初始投资就达到了约8亿美元，每天的电力消耗也接近5万美元。如果将ChatGPT应用到谷歌搜索的场景中，所需的服务器和GPU数量巨大，据估算需512820.51台A100 HGX服务器和4102568个A100 GPU，这使得公共云上的训练成本对于像谷歌这样的企业来说虽然可观，但仍然在他们的承受范围内。然而，这种大规模投入也引发了关于成本效益的讨论，以及技术进步带来的潜在问题。一方面，专家指出，尽管ChatGPT能提高某些任务的效率，但它目前的能力主要在于辅助人类而非替代人类知识生成。ChatGPT的算法技术离实现“举一反三”的人类智能还有很大差距，因此公众不必过于担忧AI会立即威胁到人类的存在。然而，生成式人工智能的确带来了现实中的问题，如假新闻的滋生、内容生态的治理挑战，以及在创意领域的滥用可能导致不公平竞争。因此，科技公司在投资大模型的同时，必须权衡技术的潜力与风险，同时制定相应的政策和监管措施，确保AI的发展既推动科技进步，又能维护社会的稳定和伦理标准。未来的投资和研发将集中在如何优化模型的效率、降低成本，同时解决好大模型带来的潜在问题，以实现人工智能的可持续发展。

ChatGPT 有多烧钱？大模型训练一次 200-1200 万美元

https://www.wenxuecity.com/news/2023/02/19/12153456.html[2/20/2023 4:47:12 PM]

ChatGPT

有多烧钱？大模型训练一次

200-1200

万

美元

ChatGPT

风靡全球后，科技巨头们纷纷入局，生成式

其背后以大模型为基

础的人工智能成为业界投入的方向。

...

ChatGPT

风靡全球后，科技巨头们纷纷入局，生成式

其背后以大模型为基础的人工智能

成为业界投入的方向。

之家了解到，所谓

“

大模型

”

，通常是在无标注的大数据集上，采用自监督学习的方法进行

训练。之后在其他场景的应用中，开发者只需要对模型进行微调，或采用少量数据进行二

次训练，就可以满足新应用场景的需要。

然而，训练通用大模型非常

“

烧钱

”

。据国盛证券报告《

ChatGPT

需要多少算力》估

算，

GPT-3

训练一次的成本约为

140

万美元，对于一些更大的

LLM

（大型语言模型），训

练成本介于

200

万美元至

1200

万美元之间。以

ChatGPT

在

1

月的独立访客平均数

1300

万

计算，其对应芯片需求为

万多片英伟达

A100 GPU

，初始投入成本约为

亿美元，每日电

费在

5

万美元左右。

如果将当前的

ChatGPT

部署到谷歌进行的每次搜索中，需要

512820.51

台

A100 HGX

服务

器和总共

4102568

个

A100 GPU

，这些服务器和网络的总成本仅资本支出就超过

1000

亿美

元。

在公有云上，对于以谷歌等全球科技大企业而言，百万至千万美元级别的训练成本并不便

宜，但尚在可接受范围内、并非昂贵。

ChatGPT训练成本揭秘：200万至1200万美元的科技竞赛

人工智能通用大模型(ChatGPT)的进展-风险与应对.pdf

ChatGPT-真格基金分享 .pdf

从ChatGPT看大模型的演化 - 20230109精简版 .pdf.zip

chatgpt-feedback-contest.pdf

从ChatGPT看大模型的演化 - 20230109精简版 .pdf

01.ChatGPT技术、国产化尝试和开源模型 -公众号-torchnlp.pdf

1.银行业：ChatGPT如何改变银行业？浙商证券-27页.pdf

ChatGPT-真格基金分享 .pdf.zip

微信机器人(文字版) 使用了OpenAI chatGPT 大型预训练语言模型 gpt-3.5-turbo.zip

ChatGPT-真格基金分享.pdf

最新资源