Apple Siri AI 基於 Google Gemini 模型進行優化並增強數據安全性

根據 Macworld 的分析,Apple 的 Siri AI 使用 Google Gemini 的基礎模型作為底座,並透過專有的 Apple 數據進行再訓練,優化以適應 Apple 自家的晶片架構。Apple 目前部署了五款第三代 AI 模型:兩款用於簡單任務的本地模型和三款用於複雜處理的雲端模型,所有模型均通過私有雲計算技術進行安全保護。儘管使用了 Gemini 的基礎架構,Siri AI 提供的使用體驗與 Google 的實現截然不同,Apple 對數據安全和處理過程保持著完全的控制。

本週,Apple 宣佈了一個顯著改進的 Siri 版本,名為 Siri AI。然而,在 X 和 Reddit 等 Apple 愛好者社羣中,已經出現了負面的評價:Siri AI 只是 Google Gemini 的稍舊版本,僅僅擁有自己的介面和聲音。這種看法並不意外,因為在經過數月的傳聞後,Apple 似乎確實在轉向 Google 的 Gemini 技術,以提升 Siri 的性能。儘管如此,在 WWDC 的主要演講中,Gemini 幾乎沒有被提及。

隨後,Apple 為記者舉行了一場私密的「技術深度探討」,由 Craig Federighi 和三位負責 Siri 和 AI 的副總裁詳細解釋了 Siri 與 Google 的關係。

Apple 的新基礎模型

Apple 在 WWDC 上頻繁使用「基礎模型」這一術語。簡而言之,這是一種大型 AI 模型,基於大量數據進行訓練,然後用於在應用中提供特定的 AI 體驗。這些模型可以是語言模型、視覺模型、圖像生成模型或音頻處理模型,現代的基礎模型通常是多模態的,這意味著它們能夠理解並生成所有這些內容的結果。大多數公司將其大型基礎模型擴展至不同的規模。最先進的模型太過龐大,無法在普通 AI 伺服器上運行,因此公司生產了較小版本的模型,以便能在較小的伺服器、桌面電腦及筆記本電腦上運行,甚至是直接在智能手機上運行的小型模型。

Apple 擁有五款基礎模型,處理與 Siri 和 Apple 智能相關的任務。這五款第三代基礎模型中,前兩款是專為直接在設備上運行的小型模型:AFM 3 Core 是我們 30 億參數的密集模型的下一代,提供質量的提升;AFM 3 Core Advanced 是 Apple 最強大的本地模型,原生支持多模態,實現了更具表現力的聲音和更高準確度的聽寫。這款 200 億參數的模型採用稀疏架構,根據請求激活 10 至 40 億個參數,僅在最新的 Apple 設備上運行。

項目規格
AFM 3 Core30 億參數密集模型
AFM 3 Core Advanced200 億參數模型,支持多模態功能
AFM 3 Cloud伺服器端模型,優化速度和性能
ADM 3 Cloud專注於圖像生成和編輯
AFM 3 Cloud Pro最強大的伺服器模型,支持複雜推理

本地模型與三款新的雲端模型相結合:AFM 3 Cloud 是 Apple 的伺服器端模型,優化了速度、效率和性能;ADM 3 Cloud 專注於圖像生成和編輯,解鎖了高級照片編輯工具和全新的圖像遊樂場;AFM 3 Cloud Pro 是 Apple 最具能力的伺服器模型,支持最複雜的用例,包括工具使用和複雜推理。Apple 利用私有雲計算技術,確保請求的加密和安全,並使用自家的伺服器進行運行。

Siri AI 的運作方式

當用户向 Siri 提出請求時,首先會進行解讀,無論是通過輸入文本還是語音識別模型。然後,一個稱為系統協調器的組件將用户的語音轉換為一種隱形的提示,並決定應該使用哪些模型。如果用户請求開啟家庭燈光、設置計時器或查詢天氣,本地模型將處理這些請求。然而,若用户希望生成幾段文本,系統協調器則會將該提示發送到私有雲計算集羣進行處理,並發送實現該請求所需的相關數據。

例如,若用户正撰寫一封電子郵件,列出客人帶來的菜單,系統協調器可能會首先從搜索索引中提取相關的文本消息。當文本生成並發送回用户設備後,請求及所有相關數據將被刪除。所有這些過程均以盡可能高的加密和偽匿名性進行,確保 Apple 或 Google 的任何人無法訪問用户的請求、數據或結果。

Gemini 的角色

在 WWDC 的會後討論中,Federighi 解釋了為何 Siri AI 不是 Gemini。他表示,Apple 並沒有將 Gemini 應用作為自己的應用程式,這些模型不使用 Google 提供給其客户的任何模型,也不使用 Google 為其客户提供模型的基礎設施和方式。他強調,Apple 的知識庫並不依賴 Google 搜索或類似的系統作為基礎。

仔細閲讀 Craig 的話,可以發現他特別指出,客户體驗(應用和助手)並不是 Gemini,也不是 Google 用於服務 Gemini 的伺服器。而且,Siri AI 不會從 Google 的網絡搜索或知識圖中提取信息,而是使用自己的數據。然而,Federighi 並未否認 Apple 的模型本身是基於 Gemini 代碼的。事實上,他明確指出,為在 Apple 晶片上運行的四款模型是「使用專有數據進行訓練,並利用 Gemini 前沿模型的輸出進行精煉」。

這意味著,Apple 似乎是以 Gemini 的基礎模型為起點,針對 Apple 晶片及其需求進行優化和重建,並使用自己的數據、權重和安全措施進行再訓練。用户不應期待從 iPhone 上的 Siri AI 獲得與 Google 在 Pixel 手機上使用的 Gemini 相同的性能、能力和結果。

Henderson
Henderson

Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。