新聞 國際財經

OpenAI第一季發布新音頻模型,加速布局「無螢幕」AI硬體

2026/1/2 08:14

【財訊快報/陳孟朔】《信息報》(The Information)報導,OpenAI正展開新一輪組織整合,旨在攻克音頻交互技術瓶頸,預計於2026年第一季發布代號為「新語音模型」的升級版本。此舉被視為為其後續推出的消費級AI硬體(如智慧眼鏡、智慧音箱)鋪路,試圖將AI從單純的軟體入口,轉化為無處不在的語音「協作伴侶」。

技術突破與組織整合:消除落後:OpenAI內部研究認為,現有ChatGPT語音功能在精準度與反應速度上明顯落後於文本模型。新模型將解決架構不一致的問題,實現更深入的邏輯推理;擬人化交互:新模型將支持「自然情感表達」與「實時對話打斷」,讓機器能像人類一樣處理對話中的停頓與情緒,預計2026年Q1正式亮相;團隊重組:由原Character.AI語音研究員Kundan Kumar領銜,聯合產品研究主管Ben Newhouse等人,重構音頻AI基礎設施;硬體布局:艾夫(Jony Ive)操刀「無螢幕」願景 OpenAI已於2025年初斥資近65億美元收購前蘋果設計主管艾夫創辦的「io」。艾夫強調,未來AI設備應採取「無螢幕設計」,不僅能回歸自然交流,還能避免電子產品成癮。據悉,OpenAI正與供應鏈緊密合作,首款硬體設備預計最快於2027年面世。

面臨挑戰:用戶習慣待培養。報導指出,多數ChatGPT用戶目前仍習慣以文字交互,主因是過去語音辨識不夠敏捷或用戶感知度低。OpenAI計畫在硬體上市前的一年內,透過持續優化APP端的語音功能,強迫引導用戶養成「說話即操作」的習慣,以驗證語音交互在日常生活場景的實用性。

相關新聞