Google 於週一悄然推出了一款名為「Google AI Edge Eloquent」的離線優先語音轉錄應用程式,專為 iOS 設計,以應對 Wispr Flow、SuperWhisper、Willow 等競爭者。這款應用程式免費下載,下載完基於 Gemma 的自動語音識別(ASR)模型後,使用者便可開始在手機上進行語音轉錄。應用程式顯示實時轉錄內容,當使用者暫停時,應用程式會自動過濾掉「嗯」和「啊」等填充詞,並潤飾文本。
在轉錄文本下方,提供「關鍵要點」、「正式」、「簡短」和「長篇」等選項,以轉換文本格式。此外,使用者還可以關閉雲端模式,僅使用本地處理。(當雲端模式開啟時,應用程式會使用基於雲端的 Gemini 模型進行文本清理。)Google AI Edge Eloquent 還可以從 Gmail 帳號中導入某些關鍵字、名稱及行話,使用者也可自行添加自定義單詞到列表中。
該應用程式能顯示轉錄會話的歷史記錄,並允許使用者搜索所有記錄。它還可以顯示在上次會話中轉錄的單詞、每分鐘的字數以及總共講出的字數。Google 在 App Store 的描述中提到,「Google AI Edge Eloquent 是一款先進的語音轉錄應用程式,旨在縮短自然語言與專業文本之間的距離。與標準的語音轉錄軟件不同,Eloquent 利用 AI 捕捉使用者的意圖,並自動編輯掉『嗯』、『啊』及中途自我修正的片段,輸出乾淨且準確的文本。」
目前該應用程式僅在 iOS 上可用,但 App Store 的描述中提及有 Android 版本。Google 正在對此進行回覆,若有進一步消息將會更新。根據描述,Eloquent 提供「無縫的 Android 整合」,可設置為使用者的預設鍵盤,實現系統範圍內在任何文本輸入框的訪問。此外,應用程式還將能夠使用類似於 Wispr Flow 在 Android 上的浮動按鈕功能,便於隨時進行轉錄。
隨著語音轉文本模型的日益成熟,AI 驅動的轉錄應用程式受到越來越多使用者的青睞。透過這款實驗性應用程式,Google 正在加入這一趨勢。如果這項測試成功,未來有可能在 Android 上看到改進的轉錄功能。




