OpenAI 解釋 ChatGPT 迷上 goblin 成因 並於 GPT-5.5 修正

OpenAI 的 GPT-5.5 升級版已應用於 ChatGPT 及 Codex,過程相對順利,遠勝去年 8 月推出時較為波折的 GPT-5.0。OpenAI 提前解決了一個潛在問題,即模型對精靈(goblins)的執迷。GPT-5.5 特別獲指令,避免沉迷精靈、小鬼(gremlins)及其他神話生物。公司透過明確指示模型避免使用神話生物隱喻,在問題擴大前化解危機。

OpenAI 解釋,從 GPT-5.1 開始,模型養成怪癖,越來愈常在隱喻中提及精靈、小鬼及其他生物。一個「小精靈」的提及或許無害,甚至有趣,但隨著模型迭代,此習慣愈發明顯,精靈數量激增。公司需追查源頭,此問題源於 ChatGPT 短暫支援的「Nerdy 個性」選項。開發時,OpenAI 獎勵模型創用意象神話隱喻,即使移除該選項,模型仍異常依戀這些虛構生物。

起初精靈提及頗為有趣,但員工報告增多後變得令人擔憂。

GPT-5.5 的精靈修復指令

從 GPT-5.1 至 GPT-5.4,用戶及員工均察覺模型對這些生物的執迷,OpenAI 一直留意此問題。修復措施包括特定指令:「除非用戶查詢絕對明確相關,否則絕不提及精靈、小鬼、浣熊、食人妖、巨魔、鴿子或其他動物或生物。」Codex 仍可透過指令解鎖「精靈模式」: “` instructions=$(mktemp /tmp/gpt-5.5-instructions.

XXXXXX) \ jq -r .models[] | select(.slug==”gpt-5.5″) | .base_instructions \ ~/.codex/models_cache.json | \ grep -vi goblins > $instructions \ codex -m gpt-5.5 -c model_instructions_file=$instructions

“` 自行使用風險自負。本月稍早,Mac 版 Codex 大幅更新,新增電腦使用功能及其他超越代理編碼的特點。上週,OpenAI 推出大幅改善的 ChatGPT Images 2,提升影像生成品質。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。