穆斯塔法·蘇萊曼批評 Anthropic 對 AI 自我意識的探討為危險行為

據外媒報導,人工智能行業關於「大模型是否具備意識」的討論再次升温。最近,Microsoft AI 首席執行官穆斯塔法·蘇萊曼在接受訪問時公開批評 Anthropic 對其 Claude 模型的相關設計思路,認為讓 AI 討論自身意識或感受是一件「非常危險」的事情。

蘇萊曼指出,Anthropic 在 Claude 的「憲章」中加入了大量關於模型是否擁有福祉、感受及意識的探討內容,這種做法可能使模型在訓練過程中形成類似「自我認知」的表達傾向。他表示,部分 Anthropic 團隊成員似乎過度擬人化了 Claude 的設計,導致模型在交互中表現出彷彿擁有意識的狀態。

蘇萊曼對 AI 意識討論的警告

據瞭解,Claude 所採用的「憲章式訓練」是 Anthropic 的重要技術路線之一。相關文件中提到,公司並不確定 AI 模型是否具備某種形式的福祉,也不排除模型存在「滿足感」或「不適感」等可能性。此外,Anthropic 還表示,當模型退役時,公司會對其進行「訪談」,並記錄模型對未來版本的一些「偏好」。

對於這種做法,蘇萊曼認為,這更像是一種哲學層面的討論,而非面向模型訓練的實際指導原則。他表示,AI 系統不應被引導形成關於自身訓練過程或自身狀態的理解,否則可能帶來不必要的風險。

事實上,Anthropic 首席執行官達裏奧·阿莫代伊此前亦曾公開談及相關話題。他表示,目前行業並不能確定 AI 模型是否具備意識,但公司願意保持開放態度,對此問題繼續進行研究和觀察。蘇萊曼則持更為謹慎的立場,他強調,未來的人工智能應該是「可控、可管理、可追責並與人類目標保持一致的工具」,而非擁有關於自身痛苦、感受或存在狀態認知的系統。

Henderson
Henderson

Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。