Google 人工智能在拼寫上表現不佳，引發搜尋引擎改革爭議

根據 Google 的説法，Google 內部有兩個 “P”。此外，Google 的人工智能概述指出，單詞 “poop” 中恰好有一個 “r”，而單詞 “journalism” 中則有兩個 “d”，但錯誤地拼寫為 j-o-u-r-n-a-d-i-s-m。值得一提的是，Google 確實識別出美國總統姓氏中有一個 “P”，但錯誤地拼寫為 t-r-p-u-m。預測 Google 的人工智能驅動搜索系統會遭遇不佳反響並不需要先見之明。

這種情況我們之前已經經歷過。首次 Google 在搜索中添加人工智能概述時，該功能曾引用了《洋葱報》和 Reddit 上的諷刺文章，建議人們食用石頭並在披薩上塗抹膠水。這一次，隨著 Google 加倍致力於將生成式人工智能作為其已經運營 29 年的旗艦產品的核心，看到其出現失誤並不令人驚訝。

Google 人工智能面臨拼寫挑戰

Google 正在全面改造其搜索引擎，這一改變引發了不少疑慮。Google 在一封電子郵件聲明中告訴 TechCrunch：“計算單詞中的字母對於大型語言模型（LLMs）來説一直是個挑戰，我們正在努力解決這一特定問題。”這些基本的拼寫錯誤看似熟悉。大型語言模型，這種人工智能技術支撐著聊天機器人及其他文本生成工具，並不具備理解拼寫的能力。多年來，人們開玩笑説，每當公司推出新人工智能模型時，都應該詢問它 “草莓” 一詞中有多少個 “r”。

這些人工智能模型能在幾秒鐘內編寫應用程式，或解決困擾數學家數十年的問題，但在拼寫方面卻如同幼兒般脆弱。

Google 的人工智能概述問題不僅僅是一些可笑的拼寫錯誤。Google 已經修復了上週出現的一個問題，當搜索 “disregard” 一詞時，顯示的似乎是該單詞的字典定義，但內容卻顯示為：“已理解。隨時告訴我您有新的提示或問題！”然而，這些拼寫錯誤仍然令人發笑，因為它們難以消除。正如研究人員之前所解釋的，人工智能並不將句子視為由單詞和字母組成的語言單位。許多大型語言模型基於變壓器模型，這些模型將文本分解為標記，這些標記可以是完整的單詞、音節或字母，具體取決於模型。

人工智能的侷限性提醒我們需謹慎使用

與人類的 “閲讀” 不同，人工智能將文本轉換為自身的數字表示，然後在上下文中幫助人工智能生成邏輯回應。阿爾伯塔大學的人工智能研究員及助理教授 Matthew Guzdial 告訴 TechCrunch：“大型語言模型基於這種變壓器架構，這顯著地並不是真正的閲讀文本。當您輸入提示時，它會被轉換為編碼。”他補充道：“當它看到單詞 ‘the’ 時，對 ‘the’ 的含義有一個編碼，但它不知道 ‘T’、‘H’、‘E’ 是什麼。

” 驅動 Google 人工智能概述的基於標記的架構本質上是有限的，研究人員對能否解決拼寫問題並不持樂觀態度。

東北大學的博士生 Sheridan Feucht 在向 TechCrunch 訪問時表示：“對於語言模型而言，確切的 ‘單詞’ 應該是什麼，這是一個難以迴避的問題，即使我們讓人類專家達成一致的完美標記詞彙，模型仍然可能會發現進一步 ‘分塊’ 的有用性。”他推測：“由於這種模糊性，似乎並不存在完美的標記器。”這對於研究人員而言並不一定是一個緊迫的問題，因為大型語言模型的實用性並不在於其拼寫能力。

然而，這些明顯的失誤提醒我們人工智能並不完美，即使它有時似乎是一種超出我們理解的全知力量。我們不能盲目相信人工智能的輸出，而不進行準確性的二次檢查。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

Google 人工智能在拼寫上表現不佳，引發搜尋引擎改革爭議

Google 人工智能面臨拼寫挑戰

人工智能的侷限性提醒我們需謹慎使用

Henderson

搜尋文章