股市 美股

谷歌發布Gemini 2.5 Flash Image技術力超越GPT-4o,Alphabet週四勁揚2%

2025/8/29 09:06

【財訊快報/陳孟朔】谷歌(Google,美股代碼GOOGL)正式發布新一代圖像生成與編輯模型Gemini 2.5 Flash Image,以速度、精準度與一致性全面領先同業,並在基準測試中擊敗GPT-4o,奪下全球第一。受利多消息激勵,Google母公司Alphabet週四股價勁揚2%,收報211.64美元,創下收市新高紀錄,今年來累漲11.8%。

Gemini 2.5 Flash Image建立在多模態與高階推理的Gemini 2.5基礎上,能原生理解圖像與文字,支援以自然語言進行精準編輯。用戶可透過簡單指令實現「融合多圖」、「角色一致性維護」、「指定局部修改」等操作,即使在多次編輯後仍能保有擬真效果。該模型特別強化局部編輯精度與品牌風格一致性,被視為解決生成式AI長期痛點的一大突破。

根據Google公布的測試結果,Gemini 2.5 Flash Image在文字轉圖與圖像編輯領域均排名全球第一,尤其在人物生成、創造力、資訊圖表及環境擬真度方面大幅領先。其在圖像編輯榜單上更拿下1362的高分,領先第二名近15%。不過,在藝術風格化能力上,仍略遜於GPT-4o。

該模型目前以預覽模式開放,定價為30美元/100萬輸出token,每張圖片約0.039美元。所有生成影像均內嵌SynthID浮水印,確保來源可追蹤並符合AI合規標準。Google亦與OpenRouter、fal.ai等平台合作,加快企業及開發者導入,並規劃進一步強化長文本渲染與一致性控制。

專家普遍認為,Gemini 2.5 Flash Image不僅在速度與品質上超越既有模型,更關鍵的是率先解決「一致性與情境感知編輯」的難題,為創作者、廣告商與企業開啟全新應用場景。隨著Alphabet股價創高,市場對其AI戰略的信心進一步增強。

相關新聞