xAI 為 Grok 平台發佈 STT 同 TTS API

xAI 近日宣布正式推出 Grok 平台的語音轉文本(STT)與文本轉語音(TTS)API,面向開發者開放。該更新旨在透過 AI 模型提供高保真、低延遲的語音交互能力,讓應用程式能整合更自然的語音對話體驗。 xAI 表示,新加入的 STT 與 TTS 接口可將語音輸入轉換為文本,或將文本內容合成語音輸出,從而涵蓋語音交互鏈路中的關鍵環節。以 API 形式提供後,開發者可在自家產品中調用相關服務,用於語音助手、語音客服、會議記錄或無障礙朗讀等場景的功能建置,並與現有文本對話能力結合,形成端到端的語

音對話流程。

Grok 平台多模態擴展

xAI 此前已向開發者提供 Grok 相關 API,讓 Grok 模型能整合至第三方應用。公開的開發者資料顯示,相關適配與調用已在部分開發工具生態中提供範例。此次語音功能的加入,標誌 Grok 平台在多模態交互方向進一步擴展,為開發者提供從文本到語音的接口選項。xAI 尚未披露 STT 與 TTS API 的具體計費、可用語種及模型版本涵蓋範圍。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。