根據 Google 的説法,Google 內部有兩個 “P”。此外,Google 的人工智能概述指出,單詞 “poop” 中恰好有一個 “r”,而單詞 “journalism” 中則有兩個 “d”,但錯誤地拼寫為 j-o-u-r-n-a-d-i-s-m。值得一提的是,Google 確實識別出美國總統姓氏中有一個 “P”,但錯誤地拼寫為 t-r-p-u-m。預測 Google 的人工智能驅動搜索系統會遭遇不佳反響並不需要先見之明。
這種情況我們之前已經經歷過。首次 Google 在搜索中添加人工智能概述時,該功能曾引用了《洋葱報》和 Reddit 上的諷刺文章,建議人們食用石頭並在披薩上塗抹膠水。這一次,隨著 Google 加倍致力於將生成式人工智能作為其已經運營 29 年的旗艦產品的核心,看到其出現失誤並不令人驚訝。
Google 人工智能面臨拼寫挑戰
Google 正在全面改造其搜索引擎,這一改變引發了不少疑慮。Google 在一封電子郵件聲明中告訴 TechCrunch:“計算單詞中的字母對於大型語言模型(LLMs)來説一直是個挑戰,我們正在努力解決這一特定問題。”這些基本的拼寫錯誤看似熟悉。大型語言模型,這種人工智能技術支撐著聊天機器人及其他文本生成工具,並不具備理解拼寫的能力。多年來,人們開玩笑説,每當公司推出新人工智能模型時,都應該詢問它 “草莓” 一詞中有多少個 “r”。
這些人工智能模型能在幾秒鐘內編寫應用程式,或解決困擾數學家數十年的問題,但在拼寫方面卻如同幼兒般脆弱。
Google 的人工智能概述問題不僅僅是一些可笑的拼寫錯誤。Google 已經修復了上週出現的一個問題,當搜索 “disregard” 一詞時,顯示的似乎是該單詞的字典定義,但內容卻顯示為:“已理解。隨時告訴我您有新的提示或問題!”然而,這些拼寫錯誤仍然令人發笑,因為它們難以消除。正如研究人員之前所解釋的,人工智能並不將句子視為由單詞和字母組成的語言單位。許多大型語言模型基於變壓器模型,這些模型將文本分解為標記,這些標記可以是完整的單詞、音節或字母,具體取決於模型。
人工智能的侷限性提醒我們需謹慎使用
與人類的 “閲讀” 不同,人工智能將文本轉換為自身的數字表示,然後在上下文中幫助人工智能生成邏輯回應。阿爾伯塔大學的人工智能研究員及助理教授 Matthew Guzdial 告訴 TechCrunch:“大型語言模型基於這種變壓器架構,這顯著地並不是真正的閲讀文本。當您輸入提示時,它會被轉換為編碼。”他補充道:“當它看到單詞 ‘the’ 時,對 ‘the’ 的含義有一個編碼,但它不知道 ‘T’、‘H’、‘E’ 是什麼。
” 驅動 Google 人工智能概述的基於標記的架構本質上是有限的,研究人員對能否解決拼寫問題並不持樂觀態度。
東北大學的博士生 Sheridan Feucht 在向 TechCrunch 訪問時表示:“對於語言模型而言,確切的 ‘單詞’ 應該是什麼,這是一個難以迴避的問題,即使我們讓人類專家達成一致的完美標記詞彙,模型仍然可能會發現進一步 ‘分塊’ 的有用性。”他推測:“由於這種模糊性,似乎並不存在完美的標記器。”這對於研究人員而言並不一定是一個緊迫的問題,因為大型語言模型的實用性並不在於其拼寫能力。
然而,這些明顯的失誤提醒我們人工智能並不完美,即使它有時似乎是一種超出我們理解的全知力量。我們不能盲目相信人工智能的輸出,而不進行準確性的二次檢查。
📬 免費訂閱 TechRitual 科技精選
按「免費訂閱」即同意收到 TechRitual 嘅科技資訊及優惠。可隨時取消訂閱。

