新聞 大中華

阿里雲Aegaeon入選SOSP展示計算池成果,H20用量大減82%

2025/10/20 08:45

【財訊快報/陳孟朔】媒體報導,阿里巴巴(9988.HK)(美股代碼BABA)旗下的阿里雲在韓國首爾舉行的第31屆操作系統原理研討會(SOSP)發表「Aegaeon」計算池化解決方案,主打在大模型服務場景下回收閒置算力、降低資源碎片化與排隊延遲。官方測試指出,於阿里雲模型市場進行逾三個月Beta驗證,面對多個參數規模最高達720億的大模型工作負載,所需輝達(Nvidia,美股代碼NVDA)H20 GPU由1,192顆大減至213顆,削減幅度達82%。

Aegaeon的核心在於將多模型、多任務的算力需求統一納入池化調度,透過動態切片與彈性佔用,盡量把原本因批次大小、序列長度與流量波動造成的空轉「填滿」。對雲端供應商與企業客戶而言,等同以更少GPU支撐相同吞吐量,提升機櫃密度與機房能效比,並降低推理服務的單位成本。

在營運面,計算池化可同時改善服務等候時間與SLA穩定度,尤其在高峰時段可透過快速資源重配抑制尾延遲,為多模型共用叢集提供更高的承載彈性。若搭配記憶體管理與通訊優化(如減少跨卡搬運、降低同步頻率),有助進一步提升有效利用率。

產業意涵上,當前AI基礎設施投資快速擴張,如何以軟體層創造「等效算力」成為關鍵命題。若Aegaeon類型的池化與排程技術能在公有雲與企業私有雲廣泛落地,將為下游應用帶來更可預測的成本曲線,並減輕對HBM與先進製程GPU的即期依賴,緩解供應鏈緊張。

相關新聞