ChatGPT 最新的升級使其能夠更有效地完成各種工作任務。這一升級讓 AI 能夠從規劃周日早午餐到製作競爭對手分析的簡報,無需逐步指導,便可完成整個過程。
OpenAI 為 Pro、Plus 和 Team 用戶引入了新的「代理模式」。一旦啟用,ChatGPT 能夠分析網站、與 API 互動、運行代碼,並交付如簡報或電子表格等文件。該系統使用自身的虛擬計算機來結合瀏覽、推理和工具使用,類似於全功能的數字助手。
這意味著用戶可以要求 ChatGPT「分析三個競爭對手並建立一個簡報」,它將通過點擊、篩選、輸入並交付可編輯的輸出來完成這一任務。此次升級整合了之前的兩項功能,運營者可以點擊和滾動網站,而深入研究則專注於信息分析。這些工具在不同情況下往往效果最佳,許多任務則處於它們之間的空白地帶。
OpenAI 表示,結合這些優勢使 ChatGPT 能夠「主動參與網站——點擊、篩選並收集更精確、高效的結果」。
該系統支持 Gmail 或 GitHub 等連接器,能夠融入用戶的應用程序和工作流程。當需要身份驗證時,用戶可以接管瀏覽器以安全登錄,然後 ChatGPT 會恢復任務。它現在可以在瀏覽網頁、下載文件、在終端分析文件和繼續工作流程之間無縫切換,所有操作都在一個不間斷的循環中進行。
該系統能夠記住步驟之間的上下文並支持中途插入。如果用戶需要在過程中更改指令,可以隨時介入,指導方向,代理將自動調整,而無需重新開始。OpenAI 稱其為「比以往模型更具互動性和靈活性」。
在評估中,該模型已經超越了其前身。在 Humanity’s Last Exam 中,它達到了 41.6 的 pass@1 分數,並在被認為是最難的數學基準之一 FrontierMath 中達到 27.4% 的準確率。
隨著能力的擴展,風險也隨之增加。由於代理可以與網站互動並訪問個人連接器,OpenAI 引入了多重安全措施。涉及後果的任務,如購買或電子郵件,需用戶確認。對於高風險行為,如金融轉賬,該模型被訓練為完全拒絕。
OpenAI 為應對的主要威脅是提示注入。這些攻擊在網站代碼中隱藏惡意指令,可能操縱 AI 的行為。為了減輕這一風險,OpenAI 已訓練代理抵抗此類注入,並設置監控系統以檢測攻擊,確保在任何重大步驟之前需要用戶操作。它還提醒用戶在不需要連接器時禁用它們。
瀏覽會話也保持私密。OpenAI 表示,「ChatGPT 不會收集或存儲您在這些會話中輸入的任何數據,例如密碼,因為該模型不需要這些數據,且如果它從未看到這些數據會更安全。」
儘管此次推出標誌著重大進步,OpenAI 將其視為早期階段的發佈。一些功能,如簡報格式和電子表格編輯,仍在測試階段。不過,該公司表示正在努力擴展能力、減少錯誤,並在未來幾個月內支持更高級的現實任務。
日本電話卡推介 / 台灣電話卡推介
一㩒即做:香港網速測試 SpeedTest HK




