作為全球人工智能領域的領軍企業,OpenAI 最近同時面臨芯片合作僵局與語音智能功能的重大更新。據外媒最新消息,OpenAI 與博通(Broadcom)的 AI 芯片合作陷入僵局。雙方去年宣布聯合研發定制人工智能芯片,代號為 Nexus 的完整項目總規模達 10 吉瓦,其中第一階段需消耗 1.3 吉瓦數據中心算力容量,造價約 180 億美元(約 1404 億 HKD)。按此成本測算,僅芯片生產環節總成本就高達 1800 億美元(約 1.404 萬億 HKD),未計入數據中心建設及其他配套開支。這筆巨額融資對 OpenAI 至關重要,因為公司預計到 2029 年,其運營資金消耗將超 2000 億美元(約 1.56 萬億 HKD)。自研芯片是 OpenAI 降低伺服器成本、提升毛利率戰略的核心一環,但目前談判已現僵局。
內部備忘錄及兩名參與談判的知情人士透露,博通要求以第一階段融資為條件,必須由Microsoft(Microsoft)承諾採購約 40% 的芯片產能。Microsoft將把這些芯片部署至自家數據中心,再向 OpenAI 出租算力使用。知情人士指出,Microsoft擁有數十年數據中心運營經驗,且信用資質頂尖,一旦承諾採購,將讓博通確信投資能回本。然而,一名 OpenAI 高管在上月內部備忘錄中向同事透露,若Microsoft拒絕,項目融資條款將直接改寫。協議已增設條款:若Microsoft實際採購量未達標,OpenAI 須自行尋找其他接盤方。這不僅考驗 OpenAI 的融資能力,也凸顯供應鏈依賴大型雲巨頭的風險。
語音 API 新功能全面升級
與此同時,OpenAI 於周四宣布,其 API 現新增多項語音智能功能,助開發者打造可對話、轉錄及翻譯的應用。新推出的 GPT‑Realtime‑2 模型具備 GPT‑5 級別推理能力,較前代 GPT-Realtime-1.5 更能處理複雜用戶請求,實現逼真語音模擬對話。公司同時發布 GPT‑Realtime‑Translate,提供實時翻譯服務,支持超過 70 種輸入語言(即可理解語言)及 13 種輸出語言,能「跟上」用戶對話節奏。此外,GPT-Realtime-Whisper 帶來即時語音轉文字功能,在互動發生時捕捉轉錄。「這些模型將實時音頻從簡單問答推向真正能工作的語音介面:傾聽、推理、翻譯、轉錄,並在對話中採取行動」,OpenAI 表示。
這些更新適用於多個領域,包括客戶服務、教育、媒體、活動及創作者平台等,特別利好希望擴展客戶服務能力的企業。雖然功能強大,但 OpenAI 亦意識到潛在濫用風險,如用於垃圾訊息、詐騙或其他網上濫用。公司已內置護欄,嵌入特定觸發機制,若偵測到違反有害內容指引,對話將被中止。所有新語音模型均納入 OpenAI 的 Realtime API,按使用計費:Translate 及 Whisper 按分鐘計,GPT‑Realtime‑2 則按 token 消耗。這項更新不僅強化 OpenAI 的開發者生態,也為其在語音 AI 領域鞏固領先地位,與芯片項目的融資挑戰形成鮮明對比。
📬 免費訂閱 TechRitual 科技精選
每 3 日由 AI 精選 5 篇最重要香港科技新聞,直送你信箱


