據知情人士透露,OpenAI 正在積極優化其音頻 AI 模型,以準備未來推出由 AI 驅動的個人設備。三名知情人士表示,這款設備預計將主要依賴音頻交互。目前,當用戶與 ChatGPT 對話時,雖然聊天機器人能夠進行語音回覆,但其語音版本與文本版本所使用的底層模型並不相同。一位前員工和一位在職員工透露,OpenAI 內部研究人員認為,當前的語音模型在回答準確性和響應速度上均落後於文本模型。 為應對這一挑戰,過去兩個月內,OpenAI 已整合了工程、產品和研究團隊,共同推進音頻模型的優化。提升語音模型的準確性對 OpenAI 至關重要,因其計劃推出一款支持語音指令的消費級設備。
據此前報導,首款設備預計至少一年後面世。 知情人士稱,新音頻模型架構能生成更自然、更具情感且更精準深入的回應,同時支持與用戶實時對話(現有模型無法實現)並更好地處理對話打斷。該模型目標發布時間為 2026 年第一季度,OpenAI 發言人對此不予置評。
無屏設計還可能減少用戶對設備的依賴。與 OpenAI 合作硬件開發的前 Apple 設計主管喬尼·艾夫強調,糾正以往消費電子產品的負面影響是其首要目標。他在五月的採訪中表示:「即使初衷無害,若產品產生不良後果,也需承擔責任。這種責任感驅動著我當前的工作。」 然而,OpenAI 面臨一大挑戰:多數 ChatGPT 用戶尚未養成語音交互習慣,或因音頻模型質量不足,或因未意識到該功能。要推出以音頻為核心的 AI 設備,需先培養用戶通過語音與 AI 產品互動的習慣。 知情人士稱,音頻 AI 項目的核心人物是今夏從 Character.
AI 加入的語音研究員 Kundan Kumar,其他負責人包括重構音頻 AI 基礎設施的產品研究主管 Ben Newhouse,以及多模態 ChatGPT 產品經理 Jackie Shannon。 多名知情人士表示,OpenAI 計劃逐步發佈一系列設備(如眼鏡、無屏智能音箱),而非單一產品。今夏的內部演示中,研究人員稱該設備將作為用戶的「協作伴侶」,主動提供目標達成建議,而非僅作為應用入口。設備還能通過音頻捕捉環境與用戶信息,實現情景化交互。
據此前報導,首款設備預計至少一年後面世。 知情人士稱,新音頻模型架構能生成更自然、更具情感且更精準深入的回應,同時支持與用戶實時對話(現有模型無法實現)並更好地處理對話打斷。該模型目標發布時間為 2026 年第一季度,OpenAI 發言人對此不予置評。
OpenAI 的發展方向
與 Google、Amazon、Meta 和 Apple 類似,OpenAI 正探索開發新型個人 AI 設備(包括可穿戴設備)。部分公司認為,當前主流設備(如 iPhone)未針對未來 AI 技術進行優化。OpenAI 研究人員希望用戶能通過語音而非屏幕與設備交互,許多 AI 專家認為語音是更自然的交互方式,因人類日常溝通主要依賴語言。無屏設計還可能減少用戶對設備的依賴。與 OpenAI 合作硬件開發的前 Apple 設計主管喬尼·艾夫強調,糾正以往消費電子產品的負面影響是其首要目標。他在五月的採訪中表示:「即使初衷無害,若產品產生不良後果,也需承擔責任。這種責任感驅動著我當前的工作。」 然而,OpenAI 面臨一大挑戰:多數 ChatGPT 用戶尚未養成語音交互習慣,或因音頻模型質量不足,或因未意識到該功能。要推出以音頻為核心的 AI 設備,需先培養用戶通過語音與 AI 產品互動的習慣。 知情人士稱,音頻 AI 項目的核心人物是今夏從 Character.
AI 加入的語音研究員 Kundan Kumar,其他負責人包括重構音頻 AI 基礎設施的產品研究主管 Ben Newhouse,以及多模態 ChatGPT 產品經理 Jackie Shannon。 多名知情人士表示,OpenAI 計劃逐步發佈一系列設備(如眼鏡、無屏智能音箱),而非單一產品。今夏的內部演示中,研究人員稱該設備將作為用戶的「協作伴侶」,主動提供目標達成建議,而非僅作為應用入口。設備還能通過音頻捕捉環境與用戶信息,實現情景化交互。




