据美国科技网站 The Information 报道,由于设计缺陷,英伟达下一代 Blackwell 架构系列 AI 旗舰芯片 GB200 的出货时间,将被推迟至少三个月。
而微软、谷歌、Meta 等英伟达大客户已订购了价值数百亿美元的 Blackwell 系列芯片,这一推迟恐将引起一系列 " 蝴蝶效应 "。
量产前发现设计缺陷
英伟达在今年 3 月发布了 Blackwell 系列,首席执行官黄仁勋在 5 月时还信心满满地表示,公司计划在今年晚些时候开始批量出货 Blackwell 系列芯片。
GB200 芯片包含两个相连的 Blackwell GPU 和一个 Grace 中央处理单元。然而,在最近几周台积电工程师为量产进行准备时,却在连接两个 Blackwell GPU 的裸晶上发现了设计缺陷。这一缺陷会导致芯片良率或产量降低,通常做法是停止量产。
因此,英伟达不得不对芯片设计进行调整,并在开始量产前,与台积电合作进行新的试生产。
芯片出货延迟并非闻所未闻,但在即将量产前发现重大设计缺陷的情况还是非常罕见的。
台积电原本计划在第三季度开始量产 Blackwell 系列芯片,并从第四季度开始向英伟达客户批量发货。然而,由于设计缺陷的发现,量产时间不得不推迟到第四季度,批量出货的时间预计要推迟到明年之一季度。台积电为量产 GB200 保留了产能,但在问题解决之前,不得不让产线闲置。
打乱微软、谷歌和 Meta 计划
对于云服务商而言,收到芯片后通常需要三个月左右的时间才能让大型计算集群投入运行,这意味着一些原计划在 2025 年之一季度部署的项目可能会受到影响。
这一延迟无疑打乱了英伟达客户的计划,特别是对于微软、谷歌和 Meta 这样的巨头来说。谷歌已经订购了 40 多万颗 GB200 芯片,加上服务器硬件,订单成本可能远远超过 100 亿美元。Meta 也下了一份价值至少 100 亿美元的订单。
而微软最近几周的订单规模也增加了 20%,他们原本计划在明年 1 月份前向 OpenAI 提供由基于 Blackwell 系列芯片的服务器,但现在可能至少要推迟到明年 3 月。
AI 企业原本期望在 2025 年之一季度就能在其数据中心运行由 Blackwell 系列芯片驱动的大型集群,实现计算能力飞跃,从而更好地生成 AI 回答、视频或执行任务。
然而,现在他们不得不面对芯片交付推迟的现实,这可能会影响到 ChatGPT、Meta AI 以及其他未来几代大模型和 AI 应用的开发进度。
雪上加霜
据知情人士援引英伟达告诉云服务商的话,英伟达可能会考虑生产只包含一个 Blackwell GPU 的芯片版本,以避免缺陷,加快芯片的出货速度。
英伟达不愿对向客户发送的延迟通知置评。但表示,客户目前正在测试 Blackwell 芯片的样品,生产正按计划在今年晚些时候进行。
加上美国司法部正在对英伟达进行反垄断调查,这一推迟无疑是 " 雪上加霜 ",给英伟达的股东们带来了不小的打击。他们原本对 Blackwell 芯片寄予厚望,期待它能推动英伟达的数据中心收入实现大幅增长。
黄仁勋在 5 月的分析师 *** 会议上说:" 今年我们将会有大量的 Blackwell 系列芯片收入。"
Keybanc Capital Markets 的一位分析师此前预计,Blackwell 芯片将推动英伟达的数据中心收入从 2024 年的 475 亿美元增长到 2025 年的 2000 多亿美元。然而,这一乐观的预测显然没有考虑到新的延迟出货因素。
发表评论