經過長達兩年的等待,GPT-5 現已正式推出,成為 GPT-4/4o 的繼任者,並且正在逐步向所有 ChatGPT 用戶推廣。GPT-5 是一個混合推理模型,這意味著它能夠快速生成答案,並對複雜的查詢進行推理。根據 OpenAI 的說法,GPT-5 在編程、數學、寫作、健康、視覺感知等多個領域的表現均達到了「最先進的性能」。與其之前的版本相比,GPT-5 更像是一個統一的人工智慧系統,而非單獨的 AI 模型。該公司指出,GPT-5 是迄今為止最強大的模型,能夠調試更大的代碼庫並創建美觀的前端生成。
GPT-5 在寫作方面的能力也得到了進一步加強,能夠生成具有文學深度和韻律的引人入勝的文字。健康領域也是 GPT-5 的一個強項,在與健康相關的問題中,GPT-5 的表現顯著高於任何之前的模型。根據 SWE-bench Verified 的基準測試,這是一個評估軟件工程任務的測試,GPT-5 在思考方面的準確率達到了 74.9%。在 Aider Polyglot(代碼編輯基準)中,GPT-5 的得分為 88%,這顯示了其在編碼方面的強大能力。
在一些更具挑戰性的測試中,例如 “Humanity’s Last Exam” 測試,GPT-5 Pro 的得分達到了 42%,並且在 GPQA Diamond 基準(博士級科學問題)中,GPT-5 Pro 的得分高達 89.4%。在 Tau2-bench 代理基準中,GPT-5 在電信、零售和航空業的得分分別為 96.7%、81.1% 和 62.6%。在 MMMU 基準測試中,GPT-5 在視覺問題解決方面的得分為 84.2%。有趣的是,GPT-5 的幻覺率顯著降低,在 LongFace-Concepts 測試中,其幻覺率為 0.7%,相比之前模型的 4.5% 有了明顯改善。
GPT-5 現在開始向所有免費的 ChatGPT 用戶推廣,並限制查詢的數量。若免費用戶達到使用限制,仍可使用更小型的 GPT-5 mini 模型。需要注意的是,GPT-5 的完整推理能力將會逐步向免費用戶開放。此外,GPT-5 現已成為所有登錄用戶的默認模型,取代了之前的 GPT-4o、OpenAI o3、OpenAI o4-mini、GPT-4.1 和 GPT-4.5。
對於 ChatGPT Plus 用戶(每月 $20 / 約 HK$ 156),他們將獲得具有推理能力的 GPT-5 模型,並享有更高的使用限制。ChatGPT Pro 用戶則需支付每月 $200 / 約 HK$ 1,560,將能夠使用 GPT-5 Pro 模型,該模型提供更多的計算和思考時間以解決更具挑戰性的问题。OpenAI 表示,企業和教育用戶將於一周內獲得 GPT-5 的使用權。在 API 方面,GPT-5 為開發者提供了 400K tokens 的上下文窗口,並且可以輸出最多 128K tokens。GPT-5 的知識截止日期為 2024 年 10 月 1 日,最後,GPT-5 的 API 價格為每百萬 tokens $1.25 / 約 HK$ 9.75。




