作為國產全自主 CPU 的代表,龍芯在轉向 LoongArch 架構後,不斷獲得各大軟件系統的優化。日前更新的 GNU C 庫 glibc 版本,已實現顯著性能提升。在日前合併的代碼中,有一項針對 LoongArch 架構的特定優化加入到 Git 代碼庫中,該優化可默認為 LoongArch64 啟用透明大頁存(Transparent Huge Pages, THP)對棧的額載段。
此優化後,可將 ELF 可執行文件的額載段與 THP 邊界對齊,從而透過減少快表(TLB)壓力並提升指令獲取效率,從而在運行大類二進制程序時帶來穩定的性能提升。
性能測試數據
| 測試項目 | 優化前 | 優化後改善幅度 | |—————————|——–|———————| | Rust Cargo 編譯指令 TLB 缺失率 | – | 暴降 72% | | Rust Cargo 編譯 CPU 周期 | – | 減少 4.
7% | | Rust Cargo 編譯實際運行時間(wall time) | – | 節省約 4.2% | | LLVM 編譯 Linux 內核實際運行時間 | – | 縮短約 12% | 此優化帶來的默認 THP 對棧額載段機制,為 LoongArch 架構帶來顯著性能提升。目前龍芯已發展至龍芯 6000 系列,其中龍芯 3A/B 桌面版有 4-8 核的,伺服器版龍芯 3C6000 系列有 16 至 64 核架構,2025 年已
在一些典型應用場景落地,包括專用伺服器、算力伺服器,龍芯公司表示希望今年能實現批量銷售。 值得留意的是,對 PC 玩家來說,龍芯去年宣佈一款名為龍芯 B6600 的 8 核桌面處理器,與 3A6000 相比,工藝不變,結構優化,升級為 LA864,同頻性能比 LA664 架構的龍芯 3A6000 大幅提升 30% 左右。主要頻率預計仍是 2.5GHz,但會掌握單核超頻技術,一般可再提升 20%,將爭取達到 3.
0GHz。據悉,龍芯 3B6600 單核、多核性能能達到 Intel 12/13 代 Alder Lake 中高階水準,也就是能匹敵 i5、i7 系列,超過當時市場銷售的 50% 以上桌面 CPU。




