新聞 國際財經

谷歌推出最快最高性價比Gemini 3模型,響應時間提高2.5倍

2026/3/4 08:02

【財訊快報/陳孟朔】外電報導,谷歌(Google)在美東時間3月3日正式發表Gemini 3系列中速度最快、性價比最高的模型——Gemini 3.1 Flash-Lite。該模型專為開發者的大規模高頻工作負載設計,在降低成本的同時,實現不妥協的智能表現。

根據Artificial Analysis基准測試數據,Gemini 3.1 Flash-Lite在首個答案響應時間(Time to First Answer Token)上較前代Gemini 2.5 Flash提高2.5倍,輸出速度提升45%。在智能評估方面,該模型在Arena.ai排行榜獲得1432的Elo評分,並在GPQA Diamond與MMMU Pro測試中分別取得86.9%與76.8%的佳績,表現超越GPT-5 Mini等同級別競品,甚至在部分指標上優於上一代體量更大的旗艦模型。

Gemini 3.1 Flash-Lite的核心優勢在於內置「思考層級」(thinking levels)控制功能,允許開發者根據任務複雜度彈性調整推理深度。針對翻譯、內容分類等對延遲敏感的任務,可選用較低層級以壓縮成本;對於需要深度推理的複雜指令,則可調高層級以提升質量。該模型支持文本、圖像、音訊與視訊等多模態輸入,上下文窗口最長達100萬token。

在定價策略上,Gemini 3.1 Flash-Lite設定為每百萬輸入token 0.25美元、每百萬輸出token 1.50美元,僅為大型模型成本的一小部分。目前該模型已透過Google AI Studio與Vertex AI平台向開發者開放預覽版。Latitude與HubX等早期測試企業反饋顯示,該模型在指令遵循能力與推理速度上展現出顯著優勢,成功率較先前模型提升約20%。

相關新聞