OpenAI 優化音頻 AI 模型準備推向個人設備市場

據知情人士透露，OpenAI 正在積極優化其音頻 AI 模型，以準備未來推出由 AI 驅動的個人設備。三名知情人士表示，這款設備預計將主要依賴音頻交互。目前，當用戶與 ChatGPT 對話時，雖然聊天機器人能夠進行語音回覆，但其語音版本與文本版本所使用的底層模型並不相同。一位前員工和一位在職員工透露，OpenAI 內部研究人員認為，當前的語音模型在回答準確性和響應速度上均落後於文本模型。為應對這一挑戰，過去兩個月內，OpenAI 已整合了工程、產品和研究團隊，共同推進音頻模型的優化。提升語音模型的準確性對 OpenAI 至關重要，因其計劃推出一款支持語音指令的消費級設備。

據此前報導，首款設備預計至少一年後面世。知情人士稱，新音頻模型架構能生成更自然、更具情感且更精準深入的回應，同時支持與用戶實時對話（現有模型無法實現）並更好地處理對話打斷。該模型目標發布時間為 2026 年第一季度，OpenAI 發言人對此不予置評。

OpenAI 的發展方向

與 Google、Amazon、Meta 和 Apple 類似，OpenAI 正探索開發新型個人 AI 設備（包括可穿戴設備）。部分公司認為，當前主流設備（如 iPhone）未針對未來 AI 技術進行優化。OpenAI 研究人員希望用戶能通過語音而非屏幕與設備交互，許多 AI 專家認為語音是更自然的交互方式，因人類日常溝通主要依賴語言。

無屏設計還可能減少用戶對設備的依賴。與 OpenAI 合作硬件開發的前 Apple 設計主管喬尼·艾夫強調，糾正以往消費電子產品的負面影響是其首要目標。他在五月的採訪中表示：「即使初衷無害，若產品產生不良後果，也需承擔責任。這種責任感驅動著我當前的工作。」然而，OpenAI 面臨一大挑戰：多數 ChatGPT 用戶尚未養成語音交互習慣，或因音頻模型質量不足，或因未意識到該功能。要推出以音頻為核心的 AI 設備，需先培養用戶通過語音與 AI 產品互動的習慣。知情人士稱，音頻 AI 項目的核心人物是今夏從 Character.

AI 加入的語音研究員 Kundan Kumar，其他負責人包括重構音頻 AI 基礎設施的產品研究主管 Ben Newhouse，以及多模態 ChatGPT 產品經理 Jackie Shannon。多名知情人士表示，OpenAI 計劃逐步發佈一系列設備（如眼鏡、無屏智能音箱），而非單一產品。今夏的內部演示中，研究人員稱該設備將作為用戶的「協作伴侶」，主動提供目標達成建議，而非僅作為應用入口。設備還能通過音頻捕捉環境與用戶信息，實現情景化交互。

OpenAI 優化音頻 AI 模型 準備推向個人設備市場

OpenAI 的發展方向

推薦內容

關於我們

OpenAI 優化音頻 AI 模型準備推向個人設備市場