AMD Intel 聯手發佈 ACE 白皮書 加速 x86 矩陣運算指令集

AMD 和 Intel 聯同業界領先廠商,成立了 x86 生態系統諮詢小組(x86 Ecosystem Advisory Group),共同推動 x86 計算架構的未來發展。小組成立之際公布了四項核心特性:FRED、AVX10、ChkTag 和 ACE。其中,AMD 與 Intel 聯手發佈 ACE 白皮書,正式將這項被稱為「x86 標準矩陣加速架構」的指令集推向開發者社群。

ACE 矩陣加速架構詳解

ACE 的核心目標直指 x86 芯片的矩陣運算性能實現數量級提升。矩陣運算是神經網絡和大語言模型的基礎運算單元,現有的 AVX10 等 SIMD 指令集雖能完成矩陣運算,但在計算密度和擴展性上存在明顯缺陷。ACE 透過引入基於外積運算的矩陣加速機制,在消費相同輸入向量的前提下,計算密度達到等效 AVX10 雙積操作的 16 倍。 在數據格式支援方面,ACE 原生涵蓋當前 AI 領域的主流精確度標準,包括 INT8、OCP FP8、OCP MXFP8、OCP MXINT8 和 BF16。

作為 AVX10 的擴展指令集,ACE 的軟件生態適配已在推進中,Deep Learning 和 HPC 底層庫、NumPy、SciPy 等 Python 科學計算庫,以及 PyTorch 和 TensorFlow 等主流機器學習框架均已啟動整合工作。 AMD 和 Intel 在白皮書中強調,ACE 的設計理念是低摩擦、廣覆蓋,從筆記本到伺服器級計算機,開發者無需針對不同硬件平台重寫代碼。

這與將 AI 計算遷移到專用加速器的方案形成鮮明對比,後者往往需要額外的代碼適配和遷移成本。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。