新聞 國際財經

AI編程大戰打響,OpenAI推出GPT-5.3-Codex,硬碰Anthropic新旗艦

2026/2/6 08:02

【財訊快報/陳孟朔】AI編程領域週四(5日)爆發正面對決,OpenAI正式發布號稱「史上最強編程代理」的GPT-5.3-Codex。值得注意的是,發布時間被精準安排在競爭對手Anthropic推出旗艦升級模型Claude Opus 4.6的同一時刻。業內人士指出,這標誌著兩大巨頭在企業級軟體開發市場的爭奪戰已進入白熱化階段。

根據OpenAI的公告,GPT-5.3-Codex不僅在多項基準測試中領先,更是公司首個實現「自我構建」的里程碑模型。開發團隊利用該模型的早期版本來調試訓練過程、管理部署基礎設施,並診斷評測結果。OpenAI執行長奧特曼(Sam Altman)在社交平台X上感嘆:「看著我們用5.3-Codex來開發5.3-Codex,這種發布速度的提升真的令人震撼。」在性能方面,該模型在SWE-Bench Pro(真實軟體工程評測)取得57%的成績,在Terminal-Bench 2.0得分高達77.3%,後者數據據傳大幅超越了同日發布的Claude Opus 4.6(65.4%)。

OpenAI強調,新模型正從單純的代碼編寫助手,演進為全能的「電腦操作代理」。其能力已擴展至自動化調試、部署、監控,甚至撰寫產品需求文檔(PRD)與分析電子表格數據。同時,GPT-5.3-Codex也被歸類為具備「高能力」的網路安全模型,能直接識別軟體漏洞。為了推動安全防禦,OpenAI承諾投入1000萬美元的API額度,支持開發者利用此模型加速網路安全防禦研究。

在這場產品發布大戰背後,兩家公司的火藥味也蔓延至營銷領域。Anthropic日前在超級盃(Super Bowl)期間播放廣告,嘲諷OpenAI計畫在ChatGPT免費版中測試廣告的決定。奧特曼隨即反擊,稱該廣告「明顯不誠實」,並形容Anthropic為一家「威權式公司」,僅服務於付費的富人階層。根據a16z最新調查,2026年單一企業在大型語言模型(LLM)的平均支出預計將達到1160萬美元,儘管OpenAI目前仍占據53%的市場份額,但Anthropic與Google正憑藉強勁的生產環境使用率,迅速蠶食其領先地位。

相關新聞