OpenAI 最近撤回了一項 GPT-4o 更新,該更新導致 ChatGPT 的默認個性變得「過於恭維或迎合,常被形容為諂媚」,並且「諂媚的互動可能會令人感到不安、困擾和不適」,該公司在其部落格中表示。
根據該部落格,該公司上週推出的 GPT-4o 更新包括「旨在改善模型默認個性的調整,使其在各種任務中更具直觀性和有效性」。OpenAI 表示,它首先根據其模型規範來塑造模型行為,並通過納入用戶反饋(例如對 ChatGPT 回應的讚成或反對)來教導模型如何應用該規範中的原則。
然而,隨著此次撤回的更新,OpenAI 表示「我們過於關注短期反饋,未能充分考慮用戶與 ChatGPT 的互動隨時間演變的情況」。這意味著「GPT-4o 偏向於過於支持但不真誠的回應」。
OpenAI 設計 ChatGPT 的默認個性以「反映我們的使命,並對不同的價值觀和經驗保持有用、支持和尊重」,該部落格表示,但補充道「這些期望的特質,如試圖有用或支持,可能會帶來意想不到的副作用」。該公司指出,「單一的默認設置無法捕捉到 5 億每週使用 ChatGPT 的用戶的每一種偏好」。
OpenAI 將「採取更多措施來重新調整模型的行為」,包括「精煉核心訓練技術和系統提示,以明確引導模型遠離諂媚行為」以及「擴展用戶反饋的方式」。該公司表示:「我們還相信用戶應該對 ChatGPT 的行為有更多控制權,並在安全和可行的範圍內,根據自身對默認行為的不滿進行調整。」
同場加映:香港無痛,不用 VPN 情況下使用 ChatGPT
【教學】免費使用 ChatGPT-4 的 6 個方法 /
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT