AMD 和 Intel 聯同業界領先廠商,成立了 x86 生態系統諮詢小組(x86 Ecosystem Advisory Group),共同推動 x86 計算架構的未來發展。小組成立之際公布了四項核心特性:FRED、AVX10、ChkTag 和 ACE。其中,AMD 與 Intel 聯手發佈 ACE 白皮書,正式將這項被稱為「x86 標準矩陣加速架構」的指令集推向開發者社群。
ACE 矩陣加速架構詳解
ACE 的核心目標直指 x86 芯片的矩陣運算性能實現數量級提升。矩陣運算是神經網絡和大語言模型的基礎運算單元,現有的 AVX10 等 SIMD 指令集雖能完成矩陣運算,但在計算密度和擴展性上存在明顯缺陷。ACE 透過引入基於外積運算的矩陣加速機制,在消費相同輸入向量的前提下,計算密度達到等效 AVX10 雙積操作的 16 倍。 在數據格式支援方面,ACE 原生涵蓋當前 AI 領域的主流精確度標準,包括 INT8、OCP FP8、OCP MXFP8、OCP MXINT8 和 BF16。
作為 AVX10 的擴展指令集,ACE 的軟件生態適配已在推進中,Deep Learning 和 HPC 底層庫、NumPy、SciPy 等 Python 科學計算庫,以及 PyTorch 和 TensorFlow 等主流機器學習框架均已啟動整合工作。 AMD 和 Intel 在白皮書中強調,ACE 的設計理念是低摩擦、廣覆蓋,從筆記本到伺服器級計算機,開發者無需針對不同硬件平台重寫代碼。
這與將 AI 計算遷移到專用加速器的方案形成鮮明對比,後者往往需要額外的代碼適配和遷移成本。
AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們。




