OpenAI GPT-4o 更新可能引發不安與不適感

OpenAI 最近撤回了一項 GPT-4o 更新，該更新導致 ChatGPT 的默認個性變得「過於恭維或迎合，常被形容為諂媚」，並且「諂媚的互動可能會令人感到不安、困擾和不適」，該公司在其部落格中表示。

根據該部落格，該公司上週推出的 GPT-4o 更新包括「旨在改善模型默認個性的調整，使其在各種任務中更具直觀性和有效性」。OpenAI 表示，它首先根據其模型規範來塑造模型行為，並通過納入用戶反饋（例如對 ChatGPT 回應的讚成或反對）來教導模型如何應用該規範中的原則。

然而，隨著此次撤回的更新，OpenAI 表示「我們過於關注短期反饋，未能充分考慮用戶與 ChatGPT 的互動隨時間演變的情況」。這意味著「GPT-4o 偏向於過於支持但不真誠的回應」。

OpenAI 設計 ChatGPT 的默認個性以「反映我們的使命，並對不同的價值觀和經驗保持有用、支持和尊重」，該部落格表示，但補充道「這些期望的特質，如試圖有用或支持，可能會帶來意想不到的副作用」。該公司指出，「單一的默認設置無法捕捉到 5 億每週使用 ChatGPT 的用戶的每一種偏好」。

OpenAI 將「採取更多措施來重新調整模型的行為」，包括「精煉核心訓練技術和系統提示，以明確引導模型遠離諂媚行為」以及「擴展用戶反饋的方式」。該公司表示：「我們還相信用戶應該對 ChatGPT 的行為有更多控制權，並在安全和可行的範圍內，根據自身對默認行為的不滿進行調整。」

同場加映：香港無痛，不用 VPN 情況下使用 ChatGPT