新聞 國際財經

輝達Rubin平台搶曝光,推理成本較Blackwell最多降10倍,H2出貨

2026/1/6 12:39

【財訊快報/陳孟朔】外電報導,輝達在CES 2026推出新一代Vera Rubin AI平台,宣示延續年度平台更新節奏並加速把產品路線圖前移。輝達執行長黃仁勳(Jensen Huang)表示,六款Rubin晶片已自合作製造方回廠並通過關鍵測試,顯示可按計畫部署;公司亦指出,Rubin系統已全面投產,規劃2026年下半年開始向首批客戶出貨,雲端業者將率先導入。

性能與成本是本次升級主軸。輝達資料顯示,Rubin平台訓練性能為Blackwell的3.5倍、運行AI軟體性能提升5倍;相較Blackwell,Rubin可將推理token生成成本最多降低10倍,且訓練混合專家模型(MoE)所需GPU數量可減少4倍。輝達強調,Rubin以更少組件達到相同結果,整體運行成本有望低於前代,意在回應市場對AI資本支出能否延續、以及競爭加劇的疑慮。

在架構細節上,平台搭載Vera CPU(88核心),主打代理式推理(Agentic Reasoning)工作負載;Rubin GPU配備第三代Transformer引擎與硬體加速自適應壓縮,推理算力標稱達50 petaflops(NVFP4),單顆GPU帶寬3.6TB/s,Vera Rubin NVL72機架級系統帶寬達260TB/s。平台亦納入第六代NVLink、機密運算與跨GPU/CPU/NVLink的RAS引擎,並採模組化、無線纜托盤設計,組裝與維護速度較Blackwell提升18倍,以降低大規模AI工廠部署的工程摩擦。

輝達指出,AWS、谷歌雲、微軟與甲骨文雲將在2026年率先部署Vera Rubin相關實例,CoreWeave等雲端合作夥伴亦將跟進;多家伺服器與系統夥伴預計推出Rubin產品線,帶動供應鏈進入新一輪備貨週期。OpenAI執行長阿爾特曼(Sam Altman)與Anthropic執行長達阿莫迪(Dario Amodei)等亦對Rubin效率提升表態肯定。

相關新聞