Google 發佈離線語音輸入應用「Google AI Edge Eloquent」,免費下載並支持自動語音識別

更新(4 月 7 日,太平洋時間晚上 10:30):該公司已更新應用商店的列表,移除了 Android 應用的相關信息,但同時也添加了 iOS 鍵盤將很快推出的說明。Google 在周一低調發佈了一款名為「Google AI Edge Eloquent」的離線語音識別應用,旨在與 Wispr Flow、SuperWhisper、Willow 等競爭。該應用免費下載,一旦下載了基於 Gemma 的自動語音識別(ASR)模型,使用者就可以開始在手機上進行語音輸入。

在應用內,使用者可以看到實時的轉錄內容,當按下暫停時,應用會自動過濾掉「呃」、「啊」等填充詞,並潤飾文本。轉錄內容下方有「重點」、「正式」、「簡短」和「長篇」等選項,以便轉換文本。此外,用戶還可以關閉雲端模式,以使用本地處理功能。(當雲端模式開啟時,應用會使用基於雲端的 Gemini 模型來清理文本。)如果需要,Google AI Edge Eloquent 還可以從 Gmail 帳戶導入某些關鍵詞、名稱和行話,用戶也能添加自定義詞彙。

該應用會顯示轉錄會話的歷史記錄,並允許用戶在其中搜索。使用者可以查看上次會話中轉錄的詞語、每分鐘字數以及總共講述的詞語數量。「Google AI Edge Eloquent 是一款先進的語音識別應用,旨在縮短自然語言與專業文本之間的距離。與標準的語音識別軟件逐字轉錄的方式不同,Eloquent 利用 AI 捕捉用戶的意圖,會自動編輯掉「呃」、「啊」和中途自我更正的內容,輸出乾淨、準確的文本。」該公司的應用商店描述中如此提到。

目前,該應用僅在 iOS 平台上可用,應用商店的描述中提到有 Android 版本的計劃。(我們已聯繫 Google 獲取更多信息,若有回覆將會更新報導。)根據描述,Eloquent 提供了「無縫的 Android 集成」,可以設置為用戶的默認鍵盤,以便在任何文本欄位進行系統範圍的訪問。此外,該應用還將能使用浮動按鈕功能,與 Wispr Flow 在 Android 上使用的相似,便於從任何地方輕鬆訪問轉錄功能。

隨著語音轉文本模型的技術不斷提升,基於 AI 的轉錄應用在用戶中越來越受歡迎。透過這款實驗應用,Google 正在參與這一趨勢。如果這項測試成功,未來我們可能會看到 Android 系統上改善的轉錄功能。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。