Google Chrome 推出「自動瀏覽」功能 以提升人工智能操作能力

Google 正在透過一項名為「Auto Browse」(自動瀏覽)的新功能,悄然將 Chrome 瀏覽器轉型為一個更具自主性的 AI 平台,並與 ChatGPT 等產品展開正面競爭。該功能基於 Google 的 Gemini 系統,目標是將在網頁上填寫表單、收集數據、規劃行程等常規操作,從用戶手中轉移給數字代理來完成。

Auto Browse 的功能與運作



Google 表示,Auto Browse 是其向「代理式 AI」(agentic AI)邁出的重要一步之一,這類系統可以通過具備上下文理解能力的推理,自動化用戶界面的操作。目前,該功能處於預覽階段,僅向付費用戶開放,包括 AI Pro 和 AI Ultra 訂閱方案,並基於最新一代的 Gemini 3 模型運行,其架構受到了 Google 早期實驗性代理框架 Project Mariner 的影響。 當用戶啟動一次 Auto Browse 任務時,Chrome 會打開專用標籤頁,並以動態 AI 圖標加以標識。

這一代理可以在不同網站之間跳轉、跟隨鏈接,並通過模擬鍵盤與鼠標輸入來與表單字段互動。用戶無需全程盯著進度,系統會在任務完成後發出通知;若涉及訪問密碼、發起支付等敏感操作,則會中途彈出請求用戶授權的提示。 類似 OpenAI 的 Atlas 工具,Auto Browse 在用戶意圖與網頁界面之間增加了一個新的抽象層。用戶不再直接操控瀏覽器,而是以自然語言描述目標,由 Gemini 將這些目標拆解為一系列操作並逐步執行。這種方式允許多個後台任務並行運行,旨在降低用戶在重複性網頁操作上的認知負擔。

圍繞 Auto Browse,Chrome 的界面也進行了調整。過去靜態的 Gemini 按鈕如今默認以側邊欄(Sidepanel)的形式常駐,而不是彈出式窗口,使 AI 能夠持續訪問當前頁面內容。在這一側邊欄中,Gemini 可以直接在 Chrome 內協調 Gmail、日曆、地圖、YouTube、購物和機票等 Google 服務,實現跨服務聯動。 此外,Google 在瀏覽器中引入了 Nano Banana 圖像編輯功能,使用戶無需下載文件即可在本地對圖片進行編輯。在處理視覺任務時,用戶可以在速度更快的標準模型與畫質更高的 Gemini Pro 之間切換,以兼顧效率與質量。

不過,Auto Browse 的運行高度依賴雲端:代理在網頁上執行的所有互動操作,會被實時傳輸至 Google 伺服器,由 Gemini 模型進行處理。 根據 Google 的說明,網頁內容可能會在用戶賬戶下被臨時記錄,並保存在 Gemini 應用活動(Gemini Apps Activity)數據中,具體取決於用戶的隱私設置。目前 Google 尚未明確這些在 Auto Browse 會話中訪問的內容是否會被用於訓練未來的 AI 系統。 在使用門檻方面,AI Pro 訂閱用戶每天可啟動最多 20 次瀏覽任務,AI Ultra 用戶每天可獲得 200 次會話配額。

雖然目前的預覽功能無需額外購買,但 Google 尚未公布何時向免費用戶開放訪問權限。為減少誤操作風險,Google 已為 Auto Browse 設置保護規則,禁止其在未經用戶明確確認的情況下執行交易性操作,例如直接提交支付信息。實際使用中,自動瀏覽可以識別待購買商品並代填訂單表單,但會在最終結帳步驟前停止,等待用戶親自確認。 Auto Browse 是否能從實驗性預覽走向主流應用,仍取決於用戶是否信任這樣的代理,讓它在網絡世界中代表自己瀏覽和行動。

Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。