摩根士丹利(下称大摩) 出具最新研究报告指出,超大规模数据中心业者若采用英伟达现役Blackwell AI GPU兴建一座容量达1 GW的数据中心,建造成本将是使用谷歌TPU或亚马逊Trainium芯片的两倍,初期投入虽高,但Blackwell在计算效率上明显优于客制化芯片,整体性价比仍具竞争力。
大摩在报告中比较英伟达多款GPU与亚马逊、谷歌专用ASIC在每瓦TFLOPS(每秒兆次浮点运算)表现,结果显示,英伟达芯片的能源效率比竞争对手高出2至8倍。
在未来产品线方面,英伟达打算推出的下一代Vera Rubin架构(FP4)得分高达19.5,居榜单首位,Vera Rubin(FP8)与GB300(FP8)分别为6.8与6.0,现役旗舰H100(FP8)则为3.1。
相较之下,谷歌 TPUv7(FP8) 得分 4.3,亚马逊 Trn3(FP8) 仅 2.5,效能大致落在 Blackwell 与上代 Hopper 之间,部分指标甚至低于 Hopper。
不过,评估AI芯片不能只看算力与能耗。
AI 基础设施业者Nebius指出,每百万Token生成成本与GPU每小时运行成本的比率同样关键。 测算显示,Groq芯片每百万Token成本约5至10美分,生成速度每秒800 Token,Blackwell成本则为25美分,速度每秒约450 Token。
专家认为,随着 AI 模型规模持续扩大,高效能与总体拥有成本 (TCO) 的平衡,将决定未来数据中心的芯片选型策略。













