Google 發佈離線 AI 口述應用程式「Google AI Edge Eloquent」,支援即時轉錄功能

Google 於週一悄然推出了一款名為「Google AI Edge Eloquent」的離線優先語音轉錄應用程式,專為 iOS 設計,以應對 Wispr Flow、SuperWhisper、Willow 等競爭者。這款應用程式免費下載,下載完基於 Gemma 的自動語音識別(ASR)模型後,使用者便可開始在手機上進行語音轉錄。應用程式顯示實時轉錄內容,當使用者暫停時,應用程式會自動過濾掉「嗯」和「啊」等填充詞,並潤飾文本。

在轉錄文本下方,提供「關鍵要點」、「正式」、「簡短」和「長篇」等選項,以轉換文本格式。此外,使用者還可以關閉雲端模式,僅使用本地處理。(當雲端模式開啟時,應用程式會使用基於雲端的 Gemini 模型進行文本清理。)Google AI Edge Eloquent 還可以從 Gmail 帳號中導入某些關鍵字、名稱及行話,使用者也可自行添加自定義單詞到列表中。

該應用程式能顯示轉錄會話的歷史記錄,並允許使用者搜索所有記錄。它還可以顯示在上次會話中轉錄的單詞、每分鐘的字數以及總共講出的字數。Google 在 App Store 的描述中提到,「Google AI Edge Eloquent 是一款先進的語音轉錄應用程式,旨在縮短自然語言與專業文本之間的距離。與標準的語音轉錄軟件不同,Eloquent 利用 AI 捕捉使用者的意圖,並自動編輯掉『嗯』、『啊』及中途自我修正的片段,輸出乾淨且準確的文本。」

目前該應用程式僅在 iOS 上可用,但 App Store 的描述中提及有 Android 版本。Google 正在對此進行回覆,若有進一步消息將會更新。根據描述,Eloquent 提供「無縫的 Android 整合」,可設置為使用者的預設鍵盤,實現系統範圍內在任何文本輸入框的訪問。此外,應用程式還將能夠使用類似於 Wispr Flow 在 Android 上的浮動按鈕功能,便於隨時進行轉錄。

隨著語音轉文本模型的日益成熟,AI 驅動的轉錄應用程式受到越來越多使用者的青睞。透過這款實驗性應用程式,Google 正在加入這一趨勢。如果這項測試成功,未來有可能在 Android 上看到改進的轉錄功能。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。