OpenAI 最近推出了備受期待的 AI 模型 GPT-5,並宣稱這是其迄今為止最強大的模型。然而,首席執行官 Sam Altman 現在確認,這次的發佈過程並不順利,並引起了用戶的廣泛不滿,要求重新啟用 GPT-4o 模型。在周五的 Reddit 問我任何事(Ask Me Anything)會議上,許多用戶表示 GPT-5 的表現「更差」,並未如預期般出色。Altman 和團隊確認他們已考慮到用戶的反饋,將為 ChatGPT Plus 用戶重新推出 GPT-4o。公司將密切監察使用情況,並決定支持的時間長度。
GPT-5 是一個統一版本,結合了所有先前可用的模型。雖然不同模型有不同的能力,但 GPT-5 原本應該是一個能夠包羅萬象的總體解決方案。其主要特點之一是一個實時路由器,能夠根據特定提示決定使用哪一個模型。這意味著 GPT 可以迅速回應查詢,或在生成更合適的答案之前花些時間「思考」。然而,這個路由器的性能未如預期,導致了 Altman 提到的模型「愚鈍」現象。他表示:「從今天開始,GPT-5 看起來會更聰明。昨天,我們遇到了嚴重問題,自動切換器在一天中的一段時間內無法運作,結果是 GPT-5 看起來非常愚笨。」他還承諾將對決策邊界進行一些干預,以幫助用戶更常獲得正確的模型,並將提高透明度,讓用戶了解哪個模型在回答特定查詢。
在會議中,Altman 也被問及 OpenAI 團隊在現場演示中展示的極為不準確的圖表。該圖表呈現了一個較低的基準分數,卻用一個較高的柱形圖表示,引發了網上的一陣笑話。該圖表錯誤地表現了 SWE-bench Verified 數據,誇大了 GPT-5 的準確性(使用思考時 74.9%,不使用思考時 52.8%),相比之下,OpenAI o3 為 69.1%,GPT-4o 為 30.8%。這一錯誤可能是因為柱形圖的交換或錯位,正如 OpenAI 在 2025 年 8 月 7 日發佈的 SWE-bench Verified 文檔中所指出的。對於這一情況,Altman 迴避了具體的問題,並在 X 上稱其為「大型圖表錯誤」。然而,在官方發布後的博客文章中,發佈的圖表是正確的。
隨著 OpenAI 決定以統一的 GPT-5 取代所有舊版模型,ChatGPT 的用戶們似乎特別不滿。針對用戶要求重新啟用 GPT-4o 的請求,Sam Altman 提及:「我們正在考慮讓 Plus 用戶繼續使用 4o。我們正在努力收集更多有關權衡的數據。」Altman 承諾將儘快修復問題和不規則情況。他在 AMA 結尾時表示:「我們將繼續努力使系統穩定,並將持續聽取反饋。」這顯示出 OpenAI 在面對用戶反饋時的重視,並承諾將致力於提升產品的質量和用戶體驗。




