本报告深入探讨了AI算力行业的最新动态,以华为昇腾系列芯片为核心,分析了其在AI领域的关键角色与影响力。首先,报告介绍了昇腾910,一款高性能训练AI处理器,性能堪比英伟达的A100(40GB),具备强大的半精度(FP16)和整数精度(INT8)算力,分别达到320TFLOPS和640TOPS,同时保持相对较低的310W功耗。其设计采用7nm工艺,集成了HCCS、PCIe4.0和RoCEv2接口,支持横向扩展(ScaleOut)和纵向扩展(ScaleUp)系统,具有出色的互联能力。
昇腾310则是一款高能效比的推理型AI处理器,作为完整的系统级芯片(SoC),它整合了CPU、AICore、数字视觉预处理子系统等多种运算单元,旨在提供高效的推理能力,支持诸如8个a55核心在内的多核处理。
华为围绕昇腾芯片族,打造了丰富的产品线,包括训练加速卡如Atlas 300系列,训练卡具备280TFLOPS的FP16算力,推理卡如Atlas 300 IPro和IDuo等,服务器解决方案如基于昇腾910和鲲鹏920的 Atlas 800训练服务器,尤其强调了其自主可控的特点和广泛应用在深度学习模型开发和AI训练服务中,还支持水冷散热设计。集群方面,如Atlas 900 PoD,通过集成超过32颗鲲鹏920处理器,提供高达20.4PFLOPS的FP16 AI算力,液冷散热设计确保了高性能运行且功耗控制在46kW以内。
报告特别提到了华为在异构计算架构(CANN)上的发展,挑战CUDA+CuDNN的主导地位,通过自主研发的昇腾生态,支持诸如「紫东.太初」、「武汉.Luojia」、「鹏程.盘古」、「鹏程.神农」、「空天·灵眸」等大模型,覆盖多模态、遥感、中文自然语言处理、医学和空天信息化等多个领域。
在算力中心建设方面,以中原人工智能计算中心为例,基于昇腾技术和“黄河鲲鹏”平台,总投资10亿人民币,一期达到100PAI算力,目标扩大至300PAI。截止2022年底,已服务于众多企业、高校和科研机构,显示了华为在推动智能计算基础设施建设方面的积极步伐。
综上,华为的昇腾系列芯片以其高性能、高能效和多样化的产品线,正深刻影响着AI算力行业的发展趋势,而随着异构计算架构和算力中心的建设,华为在AI领域的竞争力和生态布局日益显现。