Google Docs 新增「音頻」文本轉語音功能

Gemini 在 Google Docs 中的新功能現已推出,使用者可以創建文件的音頻版本。

在網頁版中,用戶可在工具菜單中找到新增的「音頻」選項,位於語音輸入和 Gemini 之間。點擊「收聽此標籤」後,將會開啟一個圓角矩形的播放器,並顯示持續時間。這個浮動窗口可以在屏幕上的任何位置移動。

播放器除了播放/暫停和進度條外,還提供控制播放速度和切換「清晰、自然的聲音」的選項。可選擇的聲音類型包括:

聲音類型
敘述者
教育者
教師
說服者
解釋者
教練
激勵者

編輯者還可以在文檔中的任何位置添加音頻按鈕,供文檔的觀眾使用。

Google Docs 的音頻功能非常實用,尤其適合希望「大聲聽到內容、更好地吸收信息或幫助發現寫作中的錯誤」的用戶。

目前此功能僅在網頁版的英文環境中推出,並將於接下來幾周內逐步推廣。此功能適用於 Google AI Pro 和 Ultra 訂閱用戶,還包括:

– Business Standard 和 Plus
– Enterprise Standard 和 Plus
– 擁有 Gemini Education 或 Gemini Education Premium 附加功能的客戶
– 擁有 Gemini Business 或 Gemini Enterprise 附加功能的客戶*

同時,Google Docs 的 Android 版本也在推出生成圖像的功能,這同樣適用於 AI Pro/Ultra 訂閱用戶。


十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。