財訊快報

新聞＞國際財經

谷歌推出最快最高性價比Gemini 3模型，響應時間提高2.5倍

2026/3/4　08:02

【財訊快報／陳孟朔】外電報導，谷歌(Google)在美東時間3月3日正式發表Gemini 3系列中速度最快、性價比最高的模型——Gemini 3.1 Flash-Lite。該模型專為開發者的大規模高頻工作負載設計，在降低成本的同時，實現不妥協的智能表現。

根據Artificial Analysis基准測試數據，Gemini 3.1 Flash-Lite在首個答案響應時間(Time to First Answer Token)上較前代Gemini 2.5 Flash提高2.5倍，輸出速度提升45%。在智能評估方面，該模型在Arena.ai排行榜獲得1432的Elo評分，並在GPQA Diamond與MMMU Pro測試中分別取得86.9%與76.8%的佳績，表現超越GPT-5 Mini等同級別競品，甚至在部分指標上優於上一代體量更大的旗艦模型。

Gemini 3.1 Flash-Lite的核心優勢在於內置「思考層級」(thinking levels)控制功能，允許開發者根據任務複雜度彈性調整推理深度。針對翻譯、內容分類等對延遲敏感的任務，可選用較低層級以壓縮成本；對於需要深度推理的複雜指令，則可調高層級以提升質量。該模型支持文本、圖像、音訊與視訊等多模態輸入，上下文窗口最長達100萬token。

在定價策略上，Gemini 3.1 Flash-Lite設定為每百萬輸入token 0.25美元、每百萬輸出token 1.50美元，僅為大型模型成本的一小部分。目前該模型已透過Google AI Studio與Vertex AI平台向開發者開放預覽版。Latitude與HubX等早期測試企業反饋顯示，該模型在指令遵循能力與推理速度上展現出顯著優勢，成功率較先前模型提升約20%。

/*選單滑動用*/ /* 要打開 $(function() { $('.marqueeBox3').removeClass('marqueeBox4'); marquee3(1); }); */

谷歌推出最快最高性價比Gemini 3模型，響應時間提高2.5倍