財訊快報

新聞＞大中華

華為雲「拼結果不拼製程」，宣稱推理效率勝H20三倍

2025/10/7　08:42

【財訊快報／陳孟朔】中媒報導，中國電信設備一哥--華為雲將競爭焦點從晶片製程轉向「最終計算成效」。華為執行長張平安表示，客戶關心的是推理速度、延遲與穩定性，而非5奈米、7奈米的工藝差別；在最新雲端部署中，華為以昇騰架構實現單卡在50毫秒時延下每秒生成約2,400個token，並稱整體生產效率可達輝達H20的三倍。

配套基礎設施方面，華為推出CloudMatrix 384超節點，目標在「大模型訓練＋超規模推理」雙場景中兼顧吞吐與延遲，降低多機通訊瓶頸與能源成本，同時透過液冷方案提升機櫃功耗密度與穩定性。

生態兼容性被置於與算力同等的優先級。除自研盤古大模型外，昇騰雲已對DeepSeek、Kimi等多家第三方模型開放優化與適配，官方目標是在同等成本下提供更快的推理速度與更低的佔用，形成「模型中立、效能優先」的雲端交付策略。

張平安指出，中國大陸的「智慧算力中心」在液冷、網絡與能源配套上形成規模化優勢；反觀海外不少數據中心仍偏向風冷，若要改造為高密度液冷，既費時亦受限於光纖頻寬與電力擴容，這使得在地化部署與跨區彈性調度成為雲商競爭的分水嶺。

在可靠度上，華為雲強調運維紀律與事故透明，稱已連續756天維持重大事故「零記錄」，並將持續以公開披露機制約束服務品質；此舉意在回應AI算力服務「速度快、也要穩」的企業級需求。

與此同時，第三方機構統計顯示，華為雲今年第一季以約18%的市占位居中國雲服務第二，與阿里雲約33%的份額仍有距離；但AI工作負載被視為新增長曲線，阿里雲相關工作負載連續七季三位數增長，也促使雲端競賽從「通用IaaS」轉向「AI原生算力與模型服務」的效率戰與生態戰。

/*選單滑動用*/ /* 要打開 $(function() { $('.marqueeBox3').removeClass('marqueeBox4'); marquee3(1); }); */

華為雲「拼結果不拼製程」，宣稱推理效率勝H20三倍