AMD Intel 聯手發佈 ACE 白皮書加速 x86 矩陣運算指令集

Henderson
30/04/2026

AMD 和 Intel 聯同業界領先廠商，成立了 x86 生態系統諮詢小組（x86 Ecosystem Advisory Group），共同推動 x86 計算架構的未來發展。小組成立之際公布了四項核心特性：FRED、AVX10、ChkTag 和 ACE。其中，AMD 與 Intel 聯手發佈 ACE 白皮書，正式將這項被稱為「x86 標準矩陣加速架構」的指令集推向開發者社群。

ACE 矩陣加速架構詳解

ACE 的核心目標直指 x86 芯片的矩陣運算性能實現數量級提升。矩陣運算是神經網絡和大語言模型的基礎運算單元，現有的 AVX10 等 SIMD 指令集雖能完成矩陣運算，但在計算密度和擴展性上存在明顯缺陷。ACE 透過引入基於外積運算的矩陣加速機制，在消費相同輸入向量的前提下，計算密度達到等效 AVX10 雙積操作的 16 倍。在數據格式支援方面，ACE 原生涵蓋當前 AI 領域的主流精確度標準，包括 INT8、OCP FP8、OCP MXFP8、OCP MXINT8 和 BF16。

作為 AVX10 的擴展指令集，ACE 的軟件生態適配已在推進中，Deep Learning 和 HPC 底層庫、NumPy、SciPy 等 Python 科學計算庫，以及 PyTorch 和 TensorFlow 等主流機器學習框架均已啟動整合工作。 AMD 和 Intel 在白皮書中強調，ACE 的設計理念是低摩擦、廣覆蓋，從筆記本到伺服器級計算機，開發者無需針對不同硬件平台重寫代碼。

這與將 AI 計算遷移到專用加速器的方案形成鮮明對比，後者往往需要額外的代碼適配和遷移成本。

Henderson

Henderson 是 TechRitual Hong Kong 科技編輯，專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來，累計撰寫數千篇科技報導及產品評測，內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。