車載 Gemini 的 AI 整合體驗新視野

Gemini 在車輛中的擴展無處不在,雖然某些整合可能會引起關注,但其在車內的應用幾乎無與倫比。以下是使用 Gemini 的體驗以及未來推出時的預期。

車載語音助手並不新鮮,Google Assistant 在 Android Auto 和 Automotive 中已經使用近十年。雖然它在訪問車輛控制方面有其用途,但隨著時間的推移,其許多限制和缺陷也日益明顯。

從安全的角度來看,使用對話控制是一種更安全的導航、獲取信息和使用日益觸控化的車內界面的方式。現代車輛已經不再使用旋鈕和按鈕,Gemini 提供了一種保持眼睛專注於道路的方式來控制主要的音響選項。然而,這還無法完全展現系統的潛力。經過對兩個系統的使用,我們認為這對於未來的駕駛者來說,可能會是一個重要的變化。

隨著 Android Auto 和 Automotive 在與車輛的互動中有所不同,特定佈局和交互方式也進行了重要修訂。

擁有 Android Automotive 或「Google Built-in」的車輛在使用 Gemini 時與支持 Android Auto 的車輛略有不同。首先,這些車輛需要進行大型系統更新,可能通過 OTA 發布,或需要到當地經銷商進行安裝。目前路上約有 50 款車輛符合條件,Google 有一個頁面詳細說明了哪些車輛將獲得更新及其方法。全球有超過 2.5 億用戶使用 Android Auto,因此這將成為即將到來的體驗的重要組成部分。

當可用時,使用者可以在主屏幕上獲得 Gemini 應用。與手機上的聊天機器人界面不同,它顯示的是一個彈出式文本提示條,類似於當前車內的助手界面。這僅僅是語音識別的啟動,並提供基本的視覺提示以顯示其運作。

由於交互或聊天會被記錄到用戶帳戶,使用者可以立即在手機、平板或桌面上查看對話記錄。因此,如果需要再次查看或檢查途中找到的食譜,便可隨時繼續對話。雖然在我們的實地演示前後未能看到這一功能,但據說它應該與目前在各設備上與 Gemini 的對話方式相同。用戶還可能會在中央儀表板的頂部看到麥克風指示燈,顯示當 Gemini 啟動時麥克風是活躍的。

彈出式條也不會干擾其他屏幕信息。

從功能上講,Gemini 在 Android Auto 中的運行方式相同,但界面略有不同。Android Auto 的雙欄佈局和各種音響單元形狀的可擴展性意味著每輛車的顯示可能會不同,特別是根據音響單元的方向。

根據方向盤的位置或地區,語音識別提示條可能位於屏幕的左側或右側。無論如何,它的視覺效果仍然類似,發光的紫色脈動條取代了助手的多彩光暈。

在 Android Automotive 和 Android Auto 中,Gemini Live 的處理方式有很大不同。在後者中,因為它使用手機,因此會彈出一個迷你窗口,顯示使用者在啟動手機時所熟悉的視覺效果。這就像電話通話的界面,具有暫停和結束 Live 會話的按鈕,並配有發光動畫。這種浮動的設計可以說是相當簡約。

在 Android Automotive 車輛中,使用「讓我們談談」命令後,顯得更加微妙。這裡有一個浮動的提示,顯示 Gemini 正在與使用者對話。所有信息都被壓縮,根據屏幕大小,這在視線中顯得不那麼明顯。用戶仍然可以使用相同的按鈕來暫停或結束 Live 會話。

儘管如此,使用案例是相同的,但這些細微差異至關重要。

Gemini Live 在駕駛中得心應手
如前所述,用戶可以提出單獨的查詢或一次性問題,這樣是可以的,而真正的潛力在於 Gemini 在車內的 Live 功能。

得益於與其他 Google 服務的整合以及幾乎完美的自然語言辨識,Gemini Live 可能是我所見過的最自然的技術應用之一。

我們觀看了一個相對受控的演示,但在此過程中詢問了一些獨特的選項,Gemini 能夠靈活應對。這本身並不算驚人,因為大多數 AI 服務在近年來已經變得相當強大,但其對話流暢性意味著不需要非常具體。如果駕駛者被周圍的情況分散注意力,這種特性顯得尤為重要。

例如,在規劃行程時,可以詢問附近的好吃無麩質小吃,或詢問附近地點的問題,包括獲取最近評論的概述。這一切都可以在不看屏幕的情況下完成。與路線相關的查詢幾乎是無窮無盡的,超越了目前車載語音助手的任何功能。

例如,如果用戶的 Google 和 Gmail 帳戶已連接,可以詢問保存的事件的具體位置。用戶可以詢問「當地最好的印度料理在哪裡?」並根據飲食偏好獲得結果。這僅僅是冰山一角,對於忙碌的父母或不太有組織的人來說,這可能會顯得特別有用。

整合將是 Gemini 車載系統的關鍵,儘管目前所展示的功能看起來相當有前景。Gemini 已經發展,功能遠超其推出時的版本,這一點至關重要,因為它將在更廣泛的市場中推出,必須具備足夠的功能。

能夠將內容添加到 Google Keep 列表特別有用,因為用戶在使用 Gemini Live 時幾乎可以執行在手機或平板上能做的所有操作。Google 的示例中,駕駛者詢問了可以用冰箱裡的食材做什麼食譜,然後在規劃前往最近超市的路線時將所需的額外材料添加到購物清單中。這種「幾乎自主」的體驗超越了我們長期以來所經歷的僵化助手。

一個特別有趣的演示展示了 Gemini 在車內的靈活性,例如用戶可以要求播放特定的歌曲,而不需要知道歌曲的名字。只需詢問「在《The O.C.》開頭播放的歌曲」,Gemini 就能找到並在 YouTube Music 上排隊播放。這在手機上目前無法實現,這使其更加令人印象深刻和有用。

自然語言和對話流暢性是 Gemini 在車內的核心特徵。

對於多年的 Android 車載系統使用者來說,雖然最初對 Google Assistant 的整合感到興奮,但現在不再需要使用特定的命令來執行某些操作,令人感到振奮。在駕駛時,保持專注於各種路況已經足夠困難,無需再增加由於語音助手需要特定或精確的短語而產生的複雜性。

Google Assistant 一直對其要求過於具體,這同樣適用於智能音響。Gemini 在這方面顯得格外新鮮,因為用戶可以使用自然語言,這與 Assistant 所能處理的命令相去甚遠。

未能展示每一項功能或使用案例是可以預見的,必然會存在一些邊緣情況,但只要整合持續進步,對於在車內與 Gemini 進行對話的期待依然強烈。其在各方面的被動性都恰到好處,期待其正式推出。

同場加映:香港無痛,不用 VPN 情況下使用 Google Gemini

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【整理】Google Gemini 語音指令:發 WhatsApp、開 Apps、打電話等等


十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。