穆斯塔法·蘇萊曼批評 Anthropic 對 AI 自我意識的探討為危險行為

據外媒報導，人工智能行業關於「大模型是否具備意識」的討論再次升温。最近，Microsoft AI 首席執行官穆斯塔法·蘇萊曼在接受訪問時公開批評 Anthropic 對其 Claude 模型的相關設計思路，認為讓 AI 討論自身意識或感受是一件「非常危險」的事情。

蘇萊曼指出，Anthropic 在 Claude 的「憲章」中加入了大量關於模型是否擁有福祉、感受及意識的探討內容，這種做法可能使模型在訓練過程中形成類似「自我認知」的表達傾向。他表示，部分 Anthropic 團隊成員似乎過度擬人化了 Claude 的設計，導致模型在交互中表現出彷彿擁有意識的狀態。

蘇萊曼對 AI 意識討論的警告

據瞭解，Claude 所採用的「憲章式訓練」是 Anthropic 的重要技術路線之一。相關文件中提到，公司並不確定 AI 模型是否具備某種形式的福祉，也不排除模型存在「滿足感」或「不適感」等可能性。此外，Anthropic 還表示，當模型退役時，公司會對其進行「訪談」，並記錄模型對未來版本的一些「偏好」。

對於這種做法，蘇萊曼認為，這更像是一種哲學層面的討論，而非面向模型訓練的實際指導原則。他表示，AI 系統不應被引導形成關於自身訓練過程或自身狀態的理解，否則可能帶來不必要的風險。

事實上，Anthropic 首席執行官達裏奧·阿莫代伊此前亦曾公開談及相關話題。他表示，目前行業並不能確定 AI 模型是否具備意識，但公司願意保持開放態度，對此問題繼續進行研究和觀察。蘇萊曼則持更為謹慎的立場，他強調，未來的人工智能應該是「可控、可管理、可追責並與人類目標保持一致的工具」，而非擁有關於自身痛苦、感受或存在狀態認知的系統。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

穆斯塔法·蘇萊曼批評 Anthropic 對 AI 自我意識的探討為危險行為

蘇萊曼對 AI 意識討論的警告

Henderson

搜尋文章