Google 在 Chrome 推出搭載 Gemini 3 的自動瀏覽功能,支持多步驟任務處理

Google 今日宣佈推出「Chrome 自動瀏覽」,這是一項「強大的自主體驗」,能夠代替用戶處理多步驟的任務。這項功能目前在桌面版可用,用戶只需在 Chrome 中向 Gemini 提出任務要求,即可啟動自動瀏覽。Google 將能夠在用戶的設備上進行滾動、點擊和輸入文本,並透過雲端模型來支持這些操作。

當自動瀏覽啟動後,Gemini 會確認「任務已開始」,並在新的標籤頁中顯示一個指標和閃爍圖標。Chrome 的右上角會標示自動瀏覽的狀態,當前活動的標籤頁會有光暈,新的 Gemini 側邊欄界面則會一步步顯示其執行的內容。自動瀏覽還可以使用 Google 密碼管理器來自動填寫憑證,但用戶需先授權這一操作。

此外,當用戶在購物時,Gemini 要求用戶實際按下購買按鈕;如果用戶需要分享內容至社交媒體,則也必須按下發布按鈕。在整個過程中,用戶隨時可以接管任務。自動瀏覽在背景中運行,用戶仍然可以繼續瀏覽其他網站。

例如,若用戶計劃舉辦一個 Y2K 主題派對,並找到了完美捕捉那個時代的靈感照片,自動瀏覽結合 Gemini 3 的多模態能力,能夠識別照片中的物品,搜尋類似的商品並將其加入購物車,並確保不超過預算,甚至應用折扣碼。

Google 還提到其他使用案例,例如:預約、填寫表格、收集稅務文件、獲取水電工和電工的報價、檢查帳單是否已支付、提交開支報告、管理訂閱以及續期許可證等。例如,用戶可以提示:「使用我們團隊名冊中的信息為我們的團隊註冊此表格,並填寫他們的名字和職位。」

經過去年的預覽後,Chrome 自動瀏覽今天開始向美國的 AI Pro 和 AI Ultra 訂閱用戶推出。用戶每天可以執行的自主任務數量有所限制。用戶可以提示:「我想去芝加哥,並在這家酒店住宿,日期為 7 月 3 日至 5 日或 7 月 10 日至 12 日。你能查一下這家酒店在這兩個週末的價格嗎?然後再查看一下在 Expedia 上每個週末的航班價格,告訴我哪個週末最便宜?」


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。