據此前報導,首款設備預計至少一年後面世。 知情人士稱,新音頻模型架構能生成更自然、更具情感且更精準深入的回應,同時支持與用戶實時對話(現有模型無法實現)並更好地處理對話打斷。該模型目標發布時間為 2026 年第一季度,OpenAI 發言人對此不予置評。
OpenAI 的發展方向
與 Google、Amazon、Meta 和 Apple 類似,OpenAI 正探索開發新型個人 AI 設備(包括可穿戴設備)。部分公司認為,當前主流設備(如 iPhone)未針對未來 AI 技術進行優化。OpenAI 研究人員希望用戶能通過語音而非屏幕與設備交互,許多 AI 專家認為語音是更自然的交互方式,因人類日常溝通主要依賴語言。無屏設計還可能減少用戶對設備的依賴。與 OpenAI 合作硬件開發的前 Apple 設計主管喬尼·艾夫強調,糾正以往消費電子產品的負面影響是其首要目標。他在五月的採訪中表示:「即使初衷無害,若產品產生不良後果,也需承擔責任。這種責任感驅動著我當前的工作。」 然而,OpenAI 面臨一大挑戰:多數 ChatGPT 用戶尚未養成語音交互習慣,或因音頻模型質量不足,或因未意識到該功能。要推出以音頻為核心的 AI 設備,需先培養用戶通過語音與 AI 產品互動的習慣。 知情人士稱,音頻 AI 項目的核心人物是今夏從 Character.
AI 加入的語音研究員 Kundan Kumar,其他負責人包括重構音頻 AI 基礎設施的產品研究主管 Ben Newhouse,以及多模態 ChatGPT 產品經理 Jackie Shannon。 多名知情人士表示,OpenAI 計劃逐步發佈一系列設備(如眼鏡、無屏智能音箱),而非單一產品。今夏的內部演示中,研究人員稱該設備將作為用戶的「協作伴侶」,主動提供目標達成建議,而非僅作為應用入口。設備還能通過音頻捕捉環境與用戶信息,實現情景化交互。

