財訊快報

新聞＞國際財經

OpenAI第一季發布新音頻模型，加速布局「無螢幕」AI硬體

2026/1/2　08:14

【財訊快報／陳孟朔】《信息報》(The Information)報導，OpenAI正展開新一輪組織整合，旨在攻克音頻交互技術瓶頸，預計於2026年第一季發布代號為「新語音模型」的升級版本。此舉被視為為其後續推出的消費級AI硬體(如智慧眼鏡、智慧音箱)鋪路，試圖將AI從單純的軟體入口，轉化為無處不在的語音「協作伴侶」。

技術突破與組織整合：消除落後：OpenAI內部研究認為，現有ChatGPT語音功能在精準度與反應速度上明顯落後於文本模型。新模型將解決架構不一致的問題，實現更深入的邏輯推理；擬人化交互：新模型將支持「自然情感表達」與「實時對話打斷」，讓機器能像人類一樣處理對話中的停頓與情緒，預計2026年Q1正式亮相；團隊重組：由原Character.AI語音研究員Kundan Kumar領銜，聯合產品研究主管Ben Newhouse等人，重構音頻AI基礎設施；硬體布局：艾夫(Jony Ive)操刀「無螢幕」願景 OpenAI已於2025年初斥資近65億美元收購前蘋果設計主管艾夫創辦的「io」。艾夫強調，未來AI設備應採取「無螢幕設計」，不僅能回歸自然交流，還能避免電子產品成癮。據悉，OpenAI正與供應鏈緊密合作，首款硬體設備預計最快於2027年面世。

面臨挑戰：用戶習慣待培養。報導指出，多數ChatGPT用戶目前仍習慣以文字交互，主因是過去語音辨識不夠敏捷或用戶感知度低。OpenAI計畫在硬體上市前的一年內，透過持續優化APP端的語音功能，強迫引導用戶養成「說話即操作」的習慣，以驗證語音交互在日常生活場景的實用性。

/*選單滑動用*/ /* 要打開 $(function() { $('.marqueeBox3').removeClass('marqueeBox4'); marquee3(1); }); */

OpenAI第一季發布新音頻模型，加速布局「無螢幕」AI硬體