ARM 發佈 Lumex:可自定義的 3nm 芯片設計

ARM 今日發佈了其下一代 CPU 和 GPU 設計,同時推出了 Lumex 計算子系統 (CSS)。過去,像 MediaTek 和 Samsung 這類公司會授權 CPU 和 GPU 設計,然後組裝成一個芯片組。而 Lumex CSS 則是一個即用型解決方案。

需要明確的是,ARM 並不會開始銷售芯片。相反,它為多個代工廠的 3nm 半導體節點設計了生產就緒的實現方案。

ARM 表示,其矽材料和 OEM 夥伴將能夠「將這些實現方案作為靈活的構建模塊,從而專注於在 CPU 和 GPU 集群層面上的差異化」。

CPU主要優勢
C1-Ultra旗艦級峰值性能
單線程性能提升 25%
年年雙位數 IPC 增長
適合大型模型推理、計算攝影、內容創作、生成式 AI
C1-PremiumC1-Ultra 性能,面積效率更高
比 C1-Ultra 小 35%
適合次旗艦移動細分市場、語音助手、多任務處理
C1-Pro持續效率
持續性能提升 16%
視頻播放、串流推理
C1-Nano極高的能效
效率提升 26%,使用更少的面積
可穿戴設備、最小形狀因子

新設計不固定,但新部件具有高度可定制性。新的 C1-DSU 允許從 1 到 14 顆 CPU 核心的設計,並可選擇四種選項中的三種類型,分別為 C1-Ultra、C1-Premium、C1-Pro 和 C1-Nano。對於 GPU,Mali-G1 可擴展至 1 到 24 個著色器。

Lumex CSS 平台具備 ARM 的「秘密武器」,使其優於之前的定制芯片設計。新的系統互聯 L1 擁有芯片組的系統級緩存 (SLC),與標準 RAM 設計相比,其漏電減少了 71%,從而最小化了閒置功耗。

此外,新的內存管理單元 (MMU) L1 使安全且具成本效益的虛擬化成為可能(通常用於在同一台計算機上同時運行多個操作系統)。

在性能方面,C1 CPU 計算集群在六個行業基準測試中的平均表現提高了 30%。對於遊戲和視頻串流等應用,平均速度提高了 15%。而在視頻播放、網頁瀏覽和社交媒體等其他工作負載中,效率平均提高了 12%。這是與 ARM 之前的設計相比的數據。

專注於高端硬件,ARM C1-Ultra CPU 在每個時鐘周期的指令數 (IPC) 相比 Cortex-X925 有了雙位數的改進。Mali-G1 Ultra GPU 在光柵化處理上快 20%,而在光線追蹤任務中速度是 Immortalis-G925 的兩倍。

新推出的可擴展矩陣擴展 2 (SME2) 是 ARM 推動更高設備內 AI 性能的核心——新 CPU 的速度提高了最多 5 倍,效率可提升至 3 倍。此外,G1 GPU 在推理方面比前一代快 20%。

ARM 的新硬件為設備內 AI 提供了巨大的改進。

來自 Samsung、honor 和 Google 等主要行業夥伴的幾個引用如下:

「在 Samsung,我們很高興能繼續與 ARM 合作,利用 ARM 的計算子系統平台開發下一代旗艦移動產品。這一合作使我們能夠突破設備內 AI 的界限,為用戶提供更智能、更快速和更高效的體驗。」—— Nak Hee Seong,Samsung Electronics SOC IP 開發部副總裁。

「在 honor,我們的使命是為更多用戶帶來高端體驗,特別是通過我們的中高端智能手機。借助 ARM Lumex CSS 平台,我們能夠提供流暢的性能、智能 AI 特性和卓越的能效,提升日常移動體驗。」—— honor。

「SME2 增強的硬件使更多先進的 AI 模型(如 Gemma 3)能夠直接在多種設備上運行。隨著 SME2 的不斷擴展,它將使移動開發者能夠無縫部署下一代 AI 功能,最終使終端用戶在智能手機上獲得低延遲的普遍可用體驗。」—— Iliyan Malchev,Google Android 的傑出軟體工程師。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。