NVIDIA的Blackwell AI服务器据报道正面临供应链瓶颈,因为团队绿无法解决过热和架构缺陷问题。
NVIDIA开始推迟Blackwell AI服务器订单,导致客户偏爱较旧的“Hopper”系列
这显然不是NVIDIA对其Blackwell AI系列所期待的开局,但看起来团队绿正面临巨大的障碍。对于那些不知道的人,NVIDIA的Blackwell AI服务器最初预计将在2024年第四季度开始大规模生产,但当时有报道称该公司的新AI架构面临设计缺陷,最终导致了更高的热量问题。尽管团队绿声称已经解决了这个问题,但《信息》的一篇新报告对此进行了驳斥,称Blackwell AI服务器正“出现故障”。
根据报告,NVIDIA的GB200 AI服务器的第一次重大出货遭遇了过热和故障问题,关键问题在于“芯片连接的方式”。这个问题最终困扰了微软、亚马逊、谷歌和Meta等主流客户,这也是为什么报告称这些公司已减少了对Blackwell的订单,据说这些公司下了超过100亿美元的订单。
这个情况对于NVIDIA及其AI业务而言确实令人担忧,因为在这种产品上的供应链问题可能会对公司的财务造成毁灭性影响。虽然我们仍然不知道具体的问题所在,但之前有报道称问题出在台积电的先进封装技术上,即CoWoS,这指的就是我们上面提到的“芯片连接”问题。NVIDIA之前确实表示他们已更换了在台积电生产的Blackwell GPU掩膜,但这并没有解决问题。
现在,各公司正在转向NVIDIA成熟的替代产品,如来自Hopper系列的产品,直到团队绿解决Blackwell的问题。就目前而言,我们还不知道Blackwell设计缺陷将对NVIDIA的收入产生多大影响,但鉴于该公司无法解决这些问题,Blackwell的成功可能面临风险,这将对NVIDIA造成麻烦。
相关文章
© 版权声明
文章版权归作者所有,未经允许请勿转载。如有侵犯您的版权,请及时联系我们→侵删通道。
暂无评论...