新聞 大中華

MiniMax推開源推理模型M1,性價比勝DeepSeek,主打百萬級Token處理

2025/6/18 08:23

【財訊快報/陳孟朔】中國「AI新創六小虎」之一的稀宇科技(MiniMax)週三宣布推出全新開源大模型「MiniMax-M1」,自稱為全球首款開源的大規模混合架構推理模型,在處理長文本任務、工具使用與軟體工程等複雜場景上,性能不僅優於DeepSeek-R1,也具備業內最高性價比,對當前大模型市場格局構成直接挑戰。

MiniMax指出,M1支援長達100萬Token的輸入上下文,推理輸出亦達業界最長的8萬Token,與Google Gemini 2.5 Pro相當,遠超DeepSeek R1的12.5萬上下文限制。該模型同時採用「閃電注意力」為主的混合架構,大幅提升長文本處理效率。

官方表示,M1於訓練階段僅動用512塊H800 GPU、耗時3週即完成強化學習,成本約為53.47萬美元,僅為同類模型十分之一。內部測試顯示,在生成10萬Token長文本的場景下,其運算量僅為DeepSeek R1的25%。

在功能表現上,M1在工具調用、軟體工程與多輪推理能力上具明顯優勢,尤其針對法律文本、代碼庫分析等場景,提供百萬級Token處理能力;儘管在傳統數學與編程基準測試中,仍略遜於DeepSeek R1,但整體已具備與主流閉源模型抗衡的實力。

價格策略上,MiniMax採取分段收費機制,最高支援至100萬Token輸入,且在自家App與Web平台開放不限量免費使用。API部分,0-32k輸入長度每百萬Token僅收0.8元人民幣,32k-128k為1.2元,128k-1M段則為2.4元,輸出價格相對亦採階梯遞增。

分析人士指出,M1的推出標誌著中國開源模型邁入百萬Token處理時代,在效能與成本雙優優勢下,或將對DeepSeek、Qwen系列及部分海外模型構成市場壓力,未來是否引發定價競爭與模型進一步開放,值得關注。

相關新聞