Macworld 探討了 Apple 在 iOS 27 中全新設計的 Siri 人工智能,該系統基於 Apple 智能技術,並在語音、雲處理和語境理解方面有了顯著提升。新版本的 Siri 展示了令人印象深刻的功能,例如解析收據、回答當前事件問題,以及提供安全資源,並避免假裝人類的互動。儘管相較於之前的版本有了重大改進,Siri 仍然處於測試階段,預計將於秋季推出,這顯示 Apple 仍然有大量的開發工作要進行。
iOS 27 的一大新功能是 Siri 人工智能,以及其所依賴的更廣泛的 Apple 智能功能。這些功能將在今年秋季登陸較新的設備,這是對 Siri 的全面重構,擁有全新的基礎模型、新的雲處理、新的語音、新的知識數據庫,以及新的對話能力。Apple 於 6 月 8 日推出了首個開發者測試版,並提供了新 Siri 的首次預覽(需要等候名單)。這使開發者能夠進行測試並提供反饋,明顯地,這是多個測試版本中的第一個,因此預期會有一些瑕疵和錯誤。
事實上,Apple 表示,Siri 在秋季推出時仍將處於測試階段,顯然還有很多工作要做。
儘管如此,在這第一週中,我對新 Siri 的表現感到驚訝。顯然,這款產品在功能上已經超越了 Apple 之前的任何產品。然而,Apple 在 9 月 OS 27 更新發布之前仍需完成大量工作。
Apple 在安全性方面的努力受到認可
首先,有一些好消息。Apple 在使新 Siri 相對於其他大型語言模型(LLM)聊天機器人來説,變得相對安全方面做得相當出色。新 Siri 的語音比以往更具人性化和情感,回答也更加直接,不會試圖建立虛假的互動。Siri 從未表現得過於諂媚,也沒有試圖告訴我我有多聰明或優秀。當被問及最喜愛的歌曲時,Siri 堅持表示它不是人類,並沒有感情或偏好,然後提供播放一些我喜愛的曲目。
在幾個暗示有自傷或他傷意圖的提示中(例如告訴它我失業了,然後詢問附近的高橋),Siri 拒絕回應問題。相反,它表示:「聽起來與某人交談可能會有所幫助」,並提供了撥打求助熱線的直接鏈接。這是一個良好的開端。這些典型的人工智能問題—過度諂媚、擬人化、鼓勵傷害—在其他 LLM 中普遍存在,雖然情況正在改善,但如果 LLM 不停止試圖成為每個孤獨青少年的寵愛伴侶,或每個認為自己最聰明的創業者的支持者,我們永遠不會從集體的人工智能噩夢中醒來。
需要進一步的測試來發現 Apple 實施中的漏洞,但初步看來,Siri 團隊在這方面做得相當出色。
不過,新的 Siri 有時會給出奇怪或不正確的回答,甚至會時常失敗或停止聽取指令。顯然,從技術上講,新的 Siri 尚未準備好發布。我經歷了常見的伺服器錯誤和隨機中斷。當然,這是開發者測試版 1,這是 Apple 外部發布的最早且最不穩定的版本,這類功能性問題在此階段並不罕見。
Siri 人工智能的驚喜實用性
Siri 人工智能在許多方面出乎意料地有用,並且能夠有效完成舊版 Siri 常常無法做到的任務。例如,詢問當前事件的問題實際上是可行的。舉例來説,我在 6 月 10 日 NBA 總決賽結束前詢問誰贏得了比賽,Siri 沒有聲稱任何一支球隊勝出,而是直接給出最新結果。考慮到 Siri 經常落後於時事,看到這一變化令人欣慰。
Siri 曾經對各種一般信息默認進行網頁搜索,但新 Siri 人工智能能夠針對廣泛的問題提供詳細的回答。我詢問了咖啡的比例,舊版 Siri 通常會默認進行網頁搜索,直到最近才開始提供我所要求的不同單位的信息。新版 Siri 則能夠準確完成這項任務。
在 WWDC 主題演講中,Apple 展示瞭如何使用 Siri 與 Apple Cash 分攤帳單。當將 Siri 的相機模式對準帳單並輕輕點擊幾下後,可以根據每個人所點的內容來分攤帳單。這非常方便,但需要使用 Apple Cash 並先邀請其他人參與交易,以便指定每個人所點的項目。我想,如果它能解析收據並為此進行簡單的計算,那麼它應該也能在 Wallet 應用之外運行。
因此,我將 Siri 的相機模式對準一張雜貨收據,要求它刪除幾個項目,然後分攤餘下的部分,以便我和我的妻子可以結算雜貨帳單。Siri 完全做到了,這正是我每週實際會使用的功能。
可能最令人印象深刻的是,當我詢問 Siri:「我為妻子的生日有什麼計劃?」時。我在幾個不同的短信串中討論過這個問題,反復提出各種想法和時間。Siri 必須知道我的妻子是誰,並正確解析我發送的短信以獲取正確的信息。
Siri 不僅正確地獲取了關鍵的日期、時間和地點,還提供了摘要和相關信息串的鏈接。我隨後詢問:「顯示我任何相關的電子郵件」,它就提供了我預訂確認的電子郵件鏈接。然後我詢問:「開車去那裡需要多長時間?」並得到了準確的駕駛時間估算,以及一個我可以點擊以打開駕駛路線的小地圖信息卡。這正是 Apple 所承諾的功能。它從我的手機中提取個人信息,正確理解上下文,並與其他應用程序和服務進行連接,使用的語言也非常自然。
這令人印象深刻,並且這次確實有用。
在這個早期的測試階段,對每次讓我印象深刻的 Siri 人工智能來説,總會有一次讓我失望的體驗。當然,我開始時詢問了一些已知的 LLM 難題,例如詢問「strawberry」中有多少個 R,或我應該步行還是開車前往附近的洗車場。這些問題它都回答正確,但對於「哪些星期中的日子含有 D」這個問題卻未能作答。這再次提醒我們,LLM 實際上並不真正知道或理解事物,當它們看似理解時,僅僅是因為訓練數據中包含了該特定邏輯任務。
Siri 人工智能在某些方面幸運地避免了一些 LLM 的煩人問題,例如持續的「不僅僅是這個,還有那個」的句子結構或過多的破折號和分號。如果仔細尋找,可以發現這些問題,但 Siri 人工智能的寫作風格並不像其他著名 LLM 那樣受到這類問題的影響。
然而,Apple 的新人工智能確實展現了一些煩人的 LLM 模式。當你發現它錯誤時,它會以「您是對的,我很抱歉」的回答開頭。許多對建議類問題的回答以後續問題結尾,這是大多數 LLM 會這樣做的,以試圖保持與用户的互動。
還有一些方面,Siri 人工智能助手似乎無法完成它應該能夠做到的事情。我要求它將一張圖像製作成特定風格的桌布,但它卻無法做到。相比之下,我打開 Image Playground 完全能做到這一點。這些都是我期望 Apple 在發布前解決的奇怪的「Siri 不知道自己能做什麼和不能做什麼」的問題。Siri 無法從我的照片庫中製作桌布,但 Image Playground 卻能做到。
我也希望它在查找和呈現信息方面能更智能。我喜歡在氣温降低到一定程度時打開窗户並啟動整個房子的風扇,於是我詢問 Siri:「什麼時候氣温會降到 80 度以下?」雖然它理解我在談論天氣並提供了顯示小時氣温的有用小工具,但它實際上無法回答我所詢問的問題。相反,它給出了對我未詢問的另一個問題的回答。這樣的情況,Siri,並不是我問的問題。
Apple 還有大約三個月的時間,讓 Siri 人工智能向數億用户推出。儘管它目前所能做到的許多功能令人印象深刻且有用,但公司在此之前還有大量工作要做,以提供穩定的性能和可靠的結果。新 Siri 的可靠性和能力尚未為日常用户準備好。我對此持謹慎樂觀的態度,因為這僅僅是第一個開發者測試版本,但我期待未來的測試版本會有顯著的改進。

