財訊快報

新聞＞大中華

阿里巴巴發布旗艦推理模型Qwen3-Max-Thinking，性能媲美GPT-5.2

2026/1/27　09:12

【財訊快報／陳孟朔】中國電商巨擘--阿里巴巴(09988)週一(26日)正式發布「千問」旗艦推理模型Qwen3-Max-Thinking。根據阿里雲訊息，該模型總參數規模突破兆級，預訓練數據量高達36T Tokens，是目前阿里規模最大且能力最強的推理模型。在涵蓋複雜推理、指令遵循及代理(Agent)能力等19項權威基準測試中，Qwen3-Max-Thinking性能可媲美GPT-5.2-Thinking、Claude Opus 4.5及Gemini 3 Pro等國際頂尖模型，標誌著中國大模型實現從「追平」到「領先」的關鍵突破。

技術層面上，Qwen3-Max-Thinking引入全新的「測試時擴展機制」(Test-Time Scaling)，透過經驗提取與多輪自我迭代，大幅提升推理性能且更具經濟效益。在被譽為「人類最後測驗」的HLE (Humanity''s Last Exam)評測中，該模型在啟用工具的情況下奪得58.3分，遠超GPT-5.2-Thinking的45.5分與Gemini 3 Pro的45.8分，創下目前全球所有模型的最強紀錄。此機制能有效剪枝冗餘邏輯路徑，將算力集中於高價值分支，顯著降低模型幻覺。

目前Qwen系列已成為全球首個衍生模式數量突破20萬的開源大模型，下載量突破10億次，日均下載量達110萬次，穩居全球開源首位。阿里巴巴指出，新模型大幅增強自主調用工具的原生Agent能力，能像專業人士般「邊用工具邊思考」，在處理真實複雜任務時展現更高智能。開發者現已可在QwenChat免費體驗，企業用戶則可透過「阿里雲百煉」獲取API服務，千問APP也即將完成接入，讓所有用戶體驗這款目前國產最強模型。

受AI技術突破與阿里雲估值調升激勵，野村(Nomura)將阿里巴巴目標價由193美元大幅上調23%至237美元。野村指出，若旗下晶片業務「平頭哥」實現IPO，將進一步釋放其巨大價值。

/*選單滑動用*/ /* 要打開 $(function() { $('.marqueeBox3').removeClass('marqueeBox4'); marquee3(1); }); */

阿里巴巴發布旗艦推理模型Qwen3-Max-Thinking，性能媲美GPT-5.2