ChatGPT 打破界限,成功通過圖靈測試

當 ChatGPT 使用 GPT-4.5 模型時,它成功通過圖靈測試,讓大多數人誤以為它是人類。在一項加州大學聖地亞哥分校的研究中,近四分之三的參與者在五分鐘的對話中相信這個 AI 是人類。事實上,GPT-4.5 的表現甚至超越了一些實際的人類參與者,他們在盲測中被懷疑為 AI。

參與者在不知情的情況下,與一名人類和一個聊天機器人進行了兩次連續的對話,然後必須辨別出 AI。為了幫助 GPT-4.5 成功,模型在一系列提示中被賦予了一個詳細的人格,要求它表現得像一個年輕、稍微尷尬但精通互聯網的內向者,並帶有一絲乾燥的幽默感。這樣的設置使得 GPT-4.5 顯得出奇地可信。

然而,當這些提示被去除,AI 回到一個空白的個性和歷史時,這種幻覺便崩潰了。此時,GPT-4.5 只能欺騙 36% 的參與者。這一突然的下降告訴我們一個關鍵的信息:這並不是一個意識覺醒的心靈,而是一個角色扮演的語言模型。當它忘記了角色設定時,它就只是一個自動補全的工具。

智慧並不等於意識

這一結果無疑具有歷史意義。艾倫·圖靈在 1950 年提出的假設,即一台能夠進行足夠流暢對話的機器可能擁有類似人類的智慧,自那時以來一直備受爭議。哲學家和工程師們對圖靈測試及其意義進行了深入探討,但如今,理論變得更加真實。

圖靈並未將通過測試等同於意識或自我意識的證明。圖靈測試真正測量的是人類對話的流暢性,而 GPT-4.5 在模擬人類互動的方式上表現出色,甚至能夠分享一些稍微尷尬的趣事。然而,如果認為智慧應該包括自我反思和情感聯繫,那麼對於 AI 是否已經滲透人類生活的擔憂可能不會太大。

GPT-4.5 在發言前不會感到緊張,也不在乎自己是否欺騙了他人。這個模型並不會因通過測試而感到自豪,因為它甚至不知道什麼是測試。它的知識就像詞典對單詞定義的認識一樣。這個模型只是一個包裹在語言外衣中的概率黑箱,讓人感到舒適。

研究人員強調 GPT-4.5 並不具備意識。它是在表演,而非感知。然而,表演的力量是顯而易見的。我們會因電影而流淚,愛上虛構角色。如果一個聊天機器人能夠給出足夠可信的表演,我們的腦海中會自動填補剩下的部分。難怪 25% 的 Z 世代現在認為 AI 已經具備自我意識。

當然,這方面的討論仍然存在。如果一台機器與人類對話,是否重要它並非真正的人類?無論更深層的哲學意義如何,能夠欺騙如此多人的 AI 若落入不道德的手中,可能會成為威脅。當一位流利的客服代表不是一名在塔爾薩忙碌的實習生,而是一個訓練得非常像人類的 AI,專門為像某些人這樣的顧客提供幫助以促使他們升級訂閱時,會發生什麼?

或許目前最好的理解方式是,把它看作是一隻穿著西裝的狗,用後腿走路。當然,它可能看起來像一位小企業家正要前往辦公室,但這只是人類的訓練和感知給予的印象。這並不是自然的外觀或行為,也不意味著銀行會很快向狗發放商業貸款。這一把戲雖然令人印象深刻,但仍然只是一種把戲。

同場加映:香港無痛,不用 VPN 情況下使用 ChatGPT

【教學】免費使用 ChatGPT-4 的 6 個方法 /
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。