新聞 大中華

阿里巴巴發布旗艦推理模型Qwen3-Max-Thinking,性能媲美GPT-5.2

2026/1/27 09:12

【財訊快報/陳孟朔】中國電商巨擘--阿里巴巴(09988)週一(26日)正式發布「千問」旗艦推理模型Qwen3-Max-Thinking。根據阿里雲訊息,該模型總參數規模突破兆級,預訓練數據量高達36T Tokens,是目前阿里規模最大且能力最強的推理模型。在涵蓋複雜推理、指令遵循及代理(Agent)能力等19項權威基準測試中,Qwen3-Max-Thinking性能可媲美GPT-5.2-Thinking、Claude Opus 4.5及Gemini 3 Pro等國際頂尖模型,標誌著中國大模型實現從「追平」到「領先」的關鍵突破。

技術層面上,Qwen3-Max-Thinking引入全新的「測試時擴展機制」(Test-Time Scaling),透過經驗提取與多輪自我迭代,大幅提升推理性能且更具經濟效益。在被譽為「人類最後測驗」的HLE (Humanity''s Last Exam)評測中,該模型在啟用工具的情況下奪得58.3分,遠超GPT-5.2-Thinking的45.5分與Gemini 3 Pro的45.8分,創下目前全球所有模型的最強紀錄。此機制能有效剪枝冗餘邏輯路徑,將算力集中於高價值分支,顯著降低模型幻覺。

目前Qwen系列已成為全球首個衍生模式數量突破20萬的開源大模型,下載量突破10億次,日均下載量達110萬次,穩居全球開源首位。阿里巴巴指出,新模型大幅增強自主調用工具的原生Agent能力,能像專業人士般「邊用工具邊思考」,在處理真實複雜任務時展現更高智能。開發者現已可在QwenChat免費體驗,企業用戶則可透過「阿里雲百煉」獲取API服務,千問APP也即將完成接入,讓所有用戶體驗這款目前國產最強模型。

受AI技術突破與阿里雲估值調升激勵,野村(Nomura)將阿里巴巴目標價由193美元大幅上調23%至237美元。野村指出,若旗下晶片業務「平頭哥」實現IPO,將進一步釋放其巨大價值。

相關新聞