OpenAI 解釋 ChatGPT 迷上 goblin 成因並於 GPT-5.5 修正

OpenAI 的 GPT-5.5 升級版已應用於 ChatGPT 及 Codex，過程相對順利，遠勝去年 8 月推出時較為波折的 GPT-5.0。OpenAI 提前解決了一個潛在問題，即模型對精靈（goblins）的執迷。GPT-5.5 特別獲指令，避免沉迷精靈、小鬼（gremlins）及其他神話生物。公司透過明確指示模型避免使用神話生物隱喻，在問題擴大前化解危機。

OpenAI 解釋，從 GPT-5.1 開始，模型養成怪癖，越來愈常在隱喻中提及精靈、小鬼及其他生物。一個「小精靈」的提及或許無害，甚至有趣，但隨著模型迭代，此習慣愈發明顯，精靈數量激增。公司需追查源頭，此問題源於 ChatGPT 短暫支援的「Nerdy 個性」選項。開發時，OpenAI 獎勵模型創用意象神話隱喻，即使移除該選項，模型仍異常依戀這些虛構生物。

起初精靈提及頗為有趣，但員工報告增多後變得令人擔憂。

GPT-5.5 的精靈修復指令

從 GPT-5.1 至 GPT-5.4，用戶及員工均察覺模型對這些生物的執迷，OpenAI 一直留意此問題。修復措施包括特定指令：「除非用戶查詢絕對明確相關，否則絕不提及精靈、小鬼、浣熊、食人妖、巨魔、鴿子或其他動物或生物。」Codex 仍可透過指令解鎖「精靈模式」： “` instructions=$(mktemp /tmp/gpt-5.5-instructions.

XXXXXX) \ jq -r .models[] | select(.slug==”gpt-5.5″) | .base_instructions \ ~/.codex/models_cache.json | \ grep -vi goblins > $instructions \ codex -m gpt-5.5 -c model_instructions_file=$instructions

“` 自行使用風險自負。本月稍早，Mac 版 Codex 大幅更新，新增電腦使用功能及其他超越代理編碼的特點。上週，OpenAI 推出大幅改善的 ChatGPT Images 2，提升影像生成品質。

OpenAI 解釋 ChatGPT 迷上 goblin 成因並於 GPT-5.5 修正

GPT-5.5 的精靈修復指令

Henderson

搜尋文章

GPT-5.5 的精靈修復指令

相關文章

Henderson

搜尋文章