Google 正準備讓 Gemini 驅動的代理程式控制你的電腦並「整理你的檔案」,以對抗 Claude Cowork。目前,macOS 版的 Gemini 應用程式包含兩個主要功能:一個類似網頁版應用程式的原生聊天介面,以及一個 alt-space 快捷鍵,可從任何位置開啟 Gemini。後者具備分享當前視窗給 Gemini 的優勢,讓 AI 獲得你當前任務的視覺脈絡。
經過我們 APK Insight 團隊的深入檢查,Google 似乎計劃透過新的代理驅動電腦使用功能,擴大 Gemini 在 Mac 上的存在。近期試用過 Claude Cowork 的用戶很可能熟悉該工具直接控制電腦以完成特定任務的能力。
一起完成工作吧。你正在做什麼?
透過四個範例提示,我們能清楚了解 Google 對此專案的野心,這些提示可提供給你的 Gemini 代理程式:
| 提示 | 描述 |
|---|---|
| Convert my files to a sheet | 掃描本地資料夾如發票或報告,提取資料並結構化成 Google Sheet。 |
| Organize my folders | 在 Desktop 或 Downloads 資料夾中找出未整理檔案,按類型或脈絡分組,並歸檔雜亂檔案。 |
| Standardize my files | 讀取檔案元數據,大量重新命名數百個混亂檔案至乾淨、可讀的子資料夾。 |
| Close the loop on my last meeting | 擷取最新 Meet 會議記錄或筆記文件,草擬後續電郵包含重點及行動項目。 |
前三個提示強烈強調使用 Gemini 整理 Mac 上的檔案,並整合至 Google Workspace 應用程式。在後 Claude Cowork 時代,這些已是生產力基本要求。背後將利用 Screen Access 及 Accessibility 功能,讓 Gemini 觀看畫面並控制滑鼠/鍵盤。同時,第四個提示將焦點從本地電腦轉移至 Google 應用程式如 Meet、Docs 及 Gmail。
整體而言,這些提示顯示 Google 讓 Gemini 代你完成更多工作。值得一提的是,macOS 版 Gemini 代理程式可能擁有比 Android 版更廣泛功能。到目前為止,只有少數 Android 裝置如 Galaxy S26 系列,能要求 Gemini 自動化簡單應用程式內任務如訂購食物。相比之下,Google 似乎準備將 macOS 版 Gemini 打造成 Claude Cowork 的真正競爭對手。
考慮到 Google 自去年 Gemini 2.5 Computer Use 預覽以來已實驗此類代理工作,這項開發確實遲來已久。新代理功能對使用 Google Workspace 的組織用戶而言,亦是好消息。
📬 免費訂閱 TechRitual 科技精選
每 3 日由 AI 精選 5 篇最重要香港科技新聞,直送你信箱
或者


