新聞 大中華

華為雲「拼結果不拼製程」,宣稱推理效率勝H20三倍

2025/10/7 08:42

【財訊快報/陳孟朔】中媒報導,中國電信設備一哥--華為雲將競爭焦點從晶片製程轉向「最終計算成效」。華為執行長張平安表示,客戶關心的是推理速度、延遲與穩定性,而非5奈米、7奈米的工藝差別;在最新雲端部署中,華為以昇騰架構實現單卡在50毫秒時延下每秒生成約2,400個token,並稱整體生產效率可達輝達H20的三倍。

配套基礎設施方面,華為推出CloudMatrix 384超節點,目標在「大模型訓練+超規模推理」雙場景中兼顧吞吐與延遲,降低多機通訊瓶頸與能源成本,同時透過液冷方案提升機櫃功耗密度與穩定性。

生態兼容性被置於與算力同等的優先級。除自研盤古大模型外,昇騰雲已對DeepSeek、Kimi等多家第三方模型開放優化與適配,官方目標是在同等成本下提供更快的推理速度與更低的佔用,形成「模型中立、效能優先」的雲端交付策略。

張平安指出,中國大陸的「智慧算力中心」在液冷、網絡與能源配套上形成規模化優勢;反觀海外不少數據中心仍偏向風冷,若要改造為高密度液冷,既費時亦受限於光纖頻寬與電力擴容,這使得在地化部署與跨區彈性調度成為雲商競爭的分水嶺。

在可靠度上,華為雲強調運維紀律與事故透明,稱已連續756天維持重大事故「零記錄」,並將持續以公開披露機制約束服務品質;此舉意在回應AI算力服務「速度快、也要穩」的企業級需求。

與此同時,第三方機構統計顯示,華為雲今年第一季以約18%的市占位居中國雲服務第二,與阿里雲約33%的份額仍有距離;但AI工作負載被視為新增長曲線,阿里雲相關工作負載連續七季三位數增長,也促使雲端競賽從「通用IaaS」轉向「AI原生算力與模型服務」的效率戰與生態戰。

相關新聞