OpenAI 最近推出了一款新的 Codex 桌面應用程式,旨在幫助開發者管理多個 AI 代理同時運行的長期軟件項目。這款適用於 macOS 的應用程式充當指揮中心,開發者可以在這裡將任務分配給不同的代理,監督各項目的進度,以及在不失去上下文的情況下審查代碼變更。OpenAI 表示,這個工具反映了軟件構建方式的轉變,從單一代理的協助轉向協調團隊的 AI 代理處理端到端開發。
Codex 最初於 2025 年 4 月推出,但 OpenAI 指出,代理的能力已迅速擴展。這些模型現在可以處理跨越數小時、數天甚至數週的複雜任務,這也創造了專門為監督、協作和大規模控制設計的工具的需求。OpenAI 首席執行官 Sam Altman 表示,支撐 Codex 的基礎模型代表了一個比性能基準所暗示的更大飛躍。他在 X 上寫道:「我喜歡用這個模型進行構建;這感覺比基準所暗示的更進一步。」
Codex 應用程式允許代理在按項目組織的獨立線程中運行。開發者可以檢查差異,直接對變更進行評論,或在編輯器中打開工作以進行手動編輯。內置的工作樹支持允許多個代理同時在同一個代碼庫上工作,每個代理在代碼的隔離副本上操作,以避免衝突。
Codex 也在擴展其功能,超越代碼生成,通過可定制的技能來實現。這些技能允許代理連接到外部工具,遵循預定的工作流程,並完成涉及研究、寫作、部署或圖像生成的任務。GPT-5.3-Codex 現已上線!它擁有最佳的編碼性能,並在中途可調整性和任務進行中的即時更新方面表現出色,速度更快,每個任務的標記數量少於 5.2-Codex 的一半,且每個標記的速度提高了 25%。
利用這些技能,Codex 可以從 Figma 中提取設計資產,在 Linear 中管理缺陷跟蹤和版本釋放,將應用程式部署到 Vercel 和 Cloudflare 等雲平台,還可以使用 OpenAI 的圖像模型生成圖像。開發者可以明確指示 Codex 使用某項技能,或允許其根據任務自行決定。
OpenAI 展示了 Codex 的自主性,通過單一提示讓其構建完整的 3D 體素賽車遊戲。該代理處理了設計、開發、測試和迭代,通過不斷玩這個遊戲來識別缺失的功能和錯誤。Altman 表示,Codex 的內部使用已經加速了 OpenAI 的開發速度。「我們能夠用 5.3-Codex 更快地推出產品,這無疑是未來的徵兆。」
這款應用程式還引入了自動化功能,使 Codex 能夠運行預定的背景任務,例如問題分類、錯誤檢測和版本總結。完成的任務會被發送到審查隊列,開發者可以在必要時介入。安全性和擴展性是 Codex 的重點,代理被沙箱化並限制在特定文件夾或分支中,進行網絡訪問等升級操作需要獲得許可。
OpenAI 表示,這是其首個在內部網絡安全準備方面得分高的模型。Altman 寫道:「這是我們的第一款在我們的準備框架中對網絡安全得分高的模型」,並補充說,OpenAI 正在試行可信訪問框架,並承諾投入 1,000 萬美元的 API 信用來支持網絡防禦工作。Codex 應用程式現在已在 macOS 上提供,供 ChatGPT Plus、Pro、Business、Enterprise 和 Edu 用戶使用,並臨時擴展至 Free 和 Go 用戶。OpenAI 表示,自去年 12 月中旬以來,Codex 的使用量已經翻倍,過去一個月有超過一百萬的開發者使用。
