OpenAI 發佈首款專用 AI 加速器 Jalapeño 提升大型語言模型效能

OpenAI 最近推出其首款定製人工智能加速器,名為 Jalapeño,這標誌著該公司進軍晶片設計領域,旨在降低大型語言模型(LLM)運行的成本並提升效率。該晶片是與 Broadcom 和 Celestica 合作開發,專門針對人工智能推斷而設計,即從訓練好的人工智能模型中生成回應的過程。OpenAI 表示,初步測試顯示 Jalapeño 在每瓦特的性能表現上顯著優於當前最先進的人工智能加速器,儘管詳細的基準測試結果將稍後公佈。

這項公告擴展了 OpenAI 控制其產品背後基礎設施的努力。除了構建模型和應用程式如 ChatGPT 和 Codex,該公司現在還設計為其提供動力的硬體。

根據公司資料,Jalapeño 的工程樣品已經在實驗室運行機器學習工作負載,包括 GPT-5.3-Codex-Spark,並達到生產目標頻率和功率水平。與一般用途的人工智能加速器不同,Jalapeño 專為 LLM 推斷而建。OpenAI 表示,其架構是圍繞現代人工智能模型的計算、記憶體、網絡和服務需求設計的。該公司聲稱,這款晶片減少了數據移動,同時平衡了計算、記憶體和網絡資源,以改善硬體利用率。

Broadcom 貢獻了矽實現和網絡技術,包括其 Tomahawk 網絡平台。

Jalapeño 加速器將推動人工智能技術的發展

OpenAI 的總裁兼聯合創始人 Greg Brockman 表示:「Jalapeño 是我們長期全棧基礎設施策略的一部分,旨在使計算資源更加豐富,從而使人工智能變得更快、更可靠,且對個人和企業更加經濟實惠,並能用於解決更重要的問題。」負責 OpenAI 硬體項目的 Richard Ho 表示,這款加速器是針對最重要的前沿人工智能系統工作負載進行優化的。他表示:「根據初步測試,Jalapeño 將高效地執行我們最重要的工作負載,接近硬體的理論極限。」

這款晶片還旨在支持更廣泛人工智能行業中的未來 LLM,而不單是 OpenAI 自身的模型。

根據這些公司的説法,Jalapeño 從初始設計到生產佈局僅用了九個月。OpenAI 將這項努力描述為高性能先進半導體實現的最快 ASIC 開發週期之一。開發過程涉及 OpenAI 與 Broadcom 工程師之間的廣泛軟硬體協同設計。OpenAI 還表示,該公司的人工智能模型被用來加速晶片設計和優化工作流程的某些部分。Broadcom 總裁兼首席執行官 Hock Tan 表示:「我們與 OpenAI 的合作代表了對於未來十年人工智能所需的物理基礎設施擴展的基本承諾。」

這些公司計劃在 2026 年開始在千兆瓦級數據中心部署這款加速器。

Jalapeño 是 OpenAI 所描述的多代計算平台中的首個產品,該平台將結合 OpenAI 設計的加速器、Broadcom 的網絡和連接技術以及 Celestica 的系統集成專業知識。OpenAI 表示,提高推斷效率可能會轉化為更快的 ChatGPT 回應、更低的人工智能運行成本,以及隨著需求不斷增長而更可靠地訪問先進的人工智能服務。

Henderson
Henderson

Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。