Google 正在為其 AI 助手 Gemini Live 推出一系列新功能,讓用戶能夠進行即時對話。下週,Gemini Live 將能夠在分享相機畫面的同時,直接在螢幕上突出顯示物體,使 AI 助手更容易指出特定項目。
例如,如果需要為某個項目尋找合適的工具,用戶可以將智能手機的相機對準一組工具,Gemini Live 將在螢幕上突出顯示正確的工具。這一功能將在新發布的 Pixel 10 設備上提供,預計於 8 月 28 日上市。Google 將同時開始向其他 Android 設備推出視覺指引,並計劃在隨後幾周內擴展到 iOS。
此外,Google 也在推出新的整合功能,讓 Gemini Live 能夠與更多應用互動,包括 Messages、Phone 和 Clock。假設在與 Gemini 討論前往目的地的路線時,突然意識到自己晚到了,Google 表示用戶將能夠插入類似「這條路線不錯。現在,發送一條訊息給 Alex,告訴他我大約晚到 10 分鐘。」的請求。接下來,Google 能夠為用戶草擬一條簡訊。
最後,Google 正在為 Gemini Live 推出更新的音頻模型,該公司表示這將「大幅改善」聊天機器人使用人類語音的關鍵要素,如語調、節奏和音高。未來,Gemini 的語調將會根據談論的主題變化,例如在詢問壓力較大的話題時,會使用較平靜的聲音。
用戶還將能夠調整 Gemini 說話的速度,這類似於現在用戶可以調整 ChatGPT 語音模式的風格。如果請求 Gemini 以某個角色或歷史人物的視角重新講述一個故事,聊天機器人可能會採用一種口音來提供「豐富且引人入勝的敘述」。




