新聞 國際財經

輝達整合Groq技術推「新推理晶片」,3月GTC大會揭曉Feynman架構

2026/3/2 08:03

【財訊快報/陳孟朔】全球企業一哥--輝達(Nvidia)將在3月GTC開發者大會上,發布一款整合Groq「語言處理單元」(LPU)技術的全新推理晶片。此舉代表執行長黃仁勳正帶領公司加速從大規模預訓練轉向高效能推理領域,以應對市場對AI應用部署成本與速度的迫切需求。這款被黃仁勳形容為「世界從未見過」的系統,據悉已獲得ChatGPT開發商OpenAI簽署大規模採購協議與300億美元投資承諾。

根據《華爾街日報》報導,輝達去年底斥資200億美元獲得初創公司Groq的關鍵技術許可,並吸納其創始團隊。Groq的LPU架構在處理AI模型解碼(Decode)階段展現極高效率,能有效解決大型語言模型(LLM)推理時的延遲與帶寬瓶頸。業內預計,新晶片將基於下一代「費曼」(Feynman)架構,採用先進的SRAM整合與3D堆疊技術,將LPU深度嵌入其中,旨在大幅降低AI智能體(AI Agents)的運行能耗與成本。

除了硬體架構的革新,輝達本月也展現了更為靈活的部署策略。針對部分企業客戶發現純CPU環境在特定AI任務上更具能效,輝達宣布擴大與Meta Platforms的合作,進行首次大規模「純CPU方案」部署,以支持Meta的廣告定向AI智能體。這標誌著輝達正超越單一的GPU銷售模式,透過多元硬體組合鎖定不同細分市場,反擊來自亞馬遜(Amazon)Trainium晶片與初創公司Cerebras的競爭。

目前AI產業正處於從「模型訓練」轉向「實際應用」的關鍵換擋期。隨著Anthropic等競爭對手開始依賴雲端服務商自研晶片,輝達正從單純的晶片供應商,轉型為涵蓋半導體、數據中心與雲端的完整AI生態系構建者。下個月的GTC大會將成為檢驗輝達能否在「推理時代」延續其九成市占率神話的關鍵節點。

相關新聞