Apple 全新 Siri AI 在 iOS 27 發佈前顯示出驚人潛力但仍處於測試階段

Macworld 探討了 Apple 在 iOS 27 中全新設計的 Siri 人工智能，該系統基於 Apple 智能技術，並在語音、雲處理和語境理解方面有了顯著提升。新版本的 Siri 展示了令人印象深刻的功能，例如解析收據、回答當前事件問題，以及提供安全資源，並避免假裝人類的互動。儘管相較於之前的版本有了重大改進，Siri 仍然處於測試階段，預計將於秋季推出，這顯示 Apple 仍然有大量的開發工作要進行。

iOS 27 的一大新功能是 Siri 人工智能，以及其所依賴的更廣泛的 Apple 智能功能。這些功能將在今年秋季登陸較新的設備，這是對 Siri 的全面重構，擁有全新的基礎模型、新的雲處理、新的語音、新的知識數據庫，以及新的對話能力。Apple 於 6 月 8 日推出了首個開發者測試版，並提供了新 Siri 的首次預覽（需要等候名單）。這使開發者能夠進行測試並提供反饋，明顯地，這是多個測試版本中的第一個，因此預期會有一些瑕疵和錯誤。

事實上，Apple 表示，Siri 在秋季推出時仍將處於測試階段，顯然還有很多工作要做。

儘管如此，在這第一週中，我對新 Siri 的表現感到驚訝。顯然，這款產品在功能上已經超越了 Apple 之前的任何產品。然而，Apple 在 9 月 OS 27 更新發布之前仍需完成大量工作。

Apple 在安全性方面的努力受到認可

首先，有一些好消息。Apple 在使新 Siri 相對於其他大型語言模型（LLM）聊天機器人來説，變得相對安全方面做得相當出色。新 Siri 的語音比以往更具人性化和情感，回答也更加直接，不會試圖建立虛假的互動。Siri 從未表現得過於諂媚，也沒有試圖告訴我我有多聰明或優秀。當被問及最喜愛的歌曲時，Siri 堅持表示它不是人類，並沒有感情或偏好，然後提供播放一些我喜愛的曲目。

在幾個暗示有自傷或他傷意圖的提示中（例如告訴它我失業了，然後詢問附近的高橋），Siri 拒絕回應問題。相反，它表示：「聽起來與某人交談可能會有所幫助」，並提供了撥打求助熱線的直接鏈接。這是一個良好的開端。這些典型的人工智能問題—過度諂媚、擬人化、鼓勵傷害—在其他 LLM 中普遍存在，雖然情況正在改善，但如果 LLM 不停止試圖成為每個孤獨青少年的寵愛伴侶，或每個認為自己最聰明的創業者的支持者，我們永遠不會從集體的人工智能噩夢中醒來。

需要進一步的測試來發現 Apple 實施中的漏洞，但初步看來，Siri 團隊在這方面做得相當出色。

不過，新的 Siri 有時會給出奇怪或不正確的回答，甚至會時常失敗或停止聽取指令。顯然，從技術上講，新的 Siri 尚未準備好發布。我經歷了常見的伺服器錯誤和隨機中斷。當然，這是開發者測試版 1，這是 Apple 外部發布的最早且最不穩定的版本，這類功能性問題在此階段並不罕見。

Siri 人工智能的驚喜實用性

Siri 人工智能在許多方面出乎意料地有用，並且能夠有效完成舊版 Siri 常常無法做到的任務。例如，詢問當前事件的問題實際上是可行的。舉例來説，我在 6 月 10 日 NBA 總決賽結束前詢問誰贏得了比賽，Siri 沒有聲稱任何一支球隊勝出，而是直接給出最新結果。考慮到 Siri 經常落後於時事，看到這一變化令人欣慰。

Siri 曾經對各種一般信息默認進行網頁搜索，但新 Siri 人工智能能夠針對廣泛的問題提供詳細的回答。我詢問了咖啡的比例，舊版 Siri 通常會默認進行網頁搜索，直到最近才開始提供我所要求的不同單位的信息。新版 Siri 則能夠準確完成這項任務。

在 WWDC 主題演講中，Apple 展示瞭如何使用 Siri 與 Apple Cash 分攤帳單。當將 Siri 的相機模式對準帳單並輕輕點擊幾下後，可以根據每個人所點的內容來分攤帳單。這非常方便，但需要使用 Apple Cash 並先邀請其他人參與交易，以便指定每個人所點的項目。我想，如果它能解析收據並為此進行簡單的計算，那麼它應該也能在 Wallet 應用之外運行。

因此，我將 Siri 的相機模式對準一張雜貨收據，要求它刪除幾個項目，然後分攤餘下的部分，以便我和我的妻子可以結算雜貨帳單。Siri 完全做到了，這正是我每週實際會使用的功能。

可能最令人印象深刻的是，當我詢問 Siri：「我為妻子的生日有什麼計劃？」時。我在幾個不同的短信串中討論過這個問題，反復提出各種想法和時間。Siri 必須知道我的妻子是誰，並正確解析我發送的短信以獲取正確的信息。

Siri 不僅正確地獲取了關鍵的日期、時間和地點，還提供了摘要和相關信息串的鏈接。我隨後詢問：「顯示我任何相關的電子郵件」，它就提供了我預訂確認的電子郵件鏈接。然後我詢問：「開車去那裡需要多長時間？」並得到了準確的駕駛時間估算，以及一個我可以點擊以打開駕駛路線的小地圖信息卡。這正是 Apple 所承諾的功能。它從我的手機中提取個人信息，正確理解上下文，並與其他應用程序和服務進行連接，使用的語言也非常自然。

這令人印象深刻，並且這次確實有用。

在這個早期的測試階段，對每次讓我印象深刻的 Siri 人工智能來説，總會有一次讓我失望的體驗。當然，我開始時詢問了一些已知的 LLM 難題，例如詢問「strawberry」中有多少個 R，或我應該步行還是開車前往附近的洗車場。這些問題它都回答正確，但對於「哪些星期中的日子含有 D」這個問題卻未能作答。這再次提醒我們，LLM 實際上並不真正知道或理解事物，當它們看似理解時，僅僅是因為訓練數據中包含了該特定邏輯任務。

Siri 人工智能在某些方面幸運地避免了一些 LLM 的煩人問題，例如持續的「不僅僅是這個，還有那個」的句子結構或過多的破折號和分號。如果仔細尋找，可以發現這些問題，但 Siri 人工智能的寫作風格並不像其他著名 LLM 那樣受到這類問題的影響。

然而，Apple 的新人工智能確實展現了一些煩人的 LLM 模式。當你發現它錯誤時，它會以「您是對的，我很抱歉」的回答開頭。許多對建議類問題的回答以後續問題結尾，這是大多數 LLM 會這樣做的，以試圖保持與用户的互動。

還有一些方面，Siri 人工智能助手似乎無法完成它應該能夠做到的事情。我要求它將一張圖像製作成特定風格的桌布，但它卻無法做到。相比之下，我打開 Image Playground 完全能做到這一點。這些都是我期望 Apple 在發布前解決的奇怪的「Siri 不知道自己能做什麼和不能做什麼」的問題。Siri 無法從我的照片庫中製作桌布，但 Image Playground 卻能做到。

我也希望它在查找和呈現信息方面能更智能。我喜歡在氣温降低到一定程度時打開窗户並啟動整個房子的風扇，於是我詢問 Siri：「什麼時候氣温會降到 80 度以下？」雖然它理解我在談論天氣並提供了顯示小時氣温的有用小工具，但它實際上無法回答我所詢問的問題。相反，它給出了對我未詢問的另一個問題的回答。這樣的情況，Siri，並不是我問的問題。

Apple 還有大約三個月的時間，讓 Siri 人工智能向數億用户推出。儘管它目前所能做到的許多功能令人印象深刻且有用，但公司在此之前還有大量工作要做，以提供穩定的性能和可靠的結果。新 Siri 的可靠性和能力尚未為日常用户準備好。我對此持謹慎樂觀的態度，因為這僅僅是第一個開發者測試版本，但我期待未來的測試版本會有顯著的改進。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

Apple 全新 Siri AI 在 iOS 27 發佈前顯示出驚人潛力但仍處於測試階段

Apple 在安全性方面的努力受到認可

Siri 人工智能的驚喜實用性

Henderson

搜尋文章