OpenAI 重新推出 GPT-4o，因用戶反映 GPT-5 表現不如預期

OpenAI 最近推出了備受期待的 AI 模型 GPT-5，並宣稱這是其迄今為止最強大的模型。然而，首席執行官 Sam Altman 現在確認，這次的發佈過程並不順利，並引起了用戶的廣泛不滿，要求重新啟用 GPT-4o 模型。在周五的 Reddit 問我任何事（Ask Me Anything）會議上，許多用戶表示 GPT-5 的表現「更差」，並未如預期般出色。Altman 和團隊確認他們已考慮到用戶的反饋，將為 ChatGPT Plus 用戶重新推出 GPT-4o。公司將密切監察使用情況，並決定支持的時間長度。

GPT-5 是一個統一版本，結合了所有先前可用的模型。雖然不同模型有不同的能力，但 GPT-5 原本應該是一個能夠包羅萬象的總體解決方案。其主要特點之一是一個實時路由器，能夠根據特定提示決定使用哪一個模型。這意味著 GPT 可以迅速回應查詢，或在生成更合適的答案之前花些時間「思考」。然而，這個路由器的性能未如預期，導致了 Altman 提到的模型「愚鈍」現象。他表示：「從今天開始，GPT-5 看起來會更聰明。昨天，我們遇到了嚴重問題，自動切換器在一天中的一段時間內無法運作，結果是 GPT-5 看起來非常愚笨。」他還承諾將對決策邊界進行一些干預，以幫助用戶更常獲得正確的模型，並將提高透明度，讓用戶了解哪個模型在回答特定查詢。

在會議中，Altman 也被問及 OpenAI 團隊在現場演示中展示的極為不準確的圖表。該圖表呈現了一個較低的基準分數，卻用一個較高的柱形圖表示，引發了網上的一陣笑話。該圖表錯誤地表現了 SWE-bench Verified 數據，誇大了 GPT-5 的準確性（使用思考時 74.9%，不使用思考時 52.8%），相比之下，OpenAI o3 為 69.1%，GPT-4o 為 30.8%。這一錯誤可能是因為柱形圖的交換或錯位，正如 OpenAI 在 2025 年 8 月 7 日發佈的 SWE-bench Verified 文檔中所指出的。對於這一情況，Altman 迴避了具體的問題，並在 X 上稱其為「大型圖表錯誤」。然而，在官方發布後的博客文章中，發佈的圖表是正確的。

隨著 OpenAI 決定以統一的 GPT-5 取代所有舊版模型，ChatGPT 的用戶們似乎特別不滿。針對用戶要求重新啟用 GPT-4o 的請求，Sam Altman 提及：「我們正在考慮讓 Plus 用戶繼續使用 4o。我們正在努力收集更多有關權衡的數據。」Altman 承諾將儘快修復問題和不規則情況。他在 AMA 結尾時表示：「我們將繼續努力使系統穩定，並將持續聽取反饋。」這顯示出 OpenAI 在面對用戶反饋時的重視，並承諾將致力於提升產品的質量和用戶體驗。

AI 內容聲明：本文由 AI 工具輔助撰寫初稿，經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正，歡迎聯絡我們。

OpenAI 重新推出 GPT-4o，因用戶反映 GPT-5 表現不如預期

推薦內容

關於我們