龍芯獲 GNU C 優化 TLB 缺失率降 72% 性能顯著提升

作為國產全自主 CPU 的代表,龍芯在轉向 LoongArch 架構後,不斷獲得各大軟件系統的優化。日前更新的 GNU C 庫 glibc 版本,已實現顯著性能提升。在日前合併的代碼中,有一項針對 LoongArch 架構的特定優化加入到 Git 代碼庫中,該優化可默認為 LoongArch64 啟用透明大頁存(Transparent Huge Pages, THP)對棧的額載段。

此優化後,可將 ELF 可執行文件的額載段與 THP 邊界對齊,從而透過減少快表(TLB)壓力並提升指令獲取效率,從而在運行大類二進制程序時帶來穩定的性能提升。

性能測試數據

| 測試項目 | 優化前 | 優化後改善幅度 | |—————————|——–|———————| | Rust Cargo 編譯指令 TLB 缺失率 | – | 暴降 72% | | Rust Cargo 編譯 CPU 周期 | – | 減少 4.

7% | | Rust Cargo 編譯實際運行時間(wall time) | – | 節省約 4.2% | | LLVM 編譯 Linux 內核實際運行時間 | – | 縮短約 12% | 此優化帶來的默認 THP 對棧額載段機制,為 LoongArch 架構帶來顯著性能提升。目前龍芯已發展至龍芯 6000 系列,其中龍芯 3A/B 桌面版有 4-8 核的,伺服器版龍芯 3C6000 系列有 16 至 64 核架構,2025 年已

在一些典型應用場景落地,包括專用伺服器、算力伺服器,龍芯公司表示希望今年能實現批量銷售。 值得留意的是,對 PC 玩家來說,龍芯去年宣佈一款名為龍芯 B6600 的 8 核桌面處理器,與 3A6000 相比,工藝不變,結構優化,升級為 LA864,同頻性能比 LA664 架構的龍芯 3A6000 大幅提升 30% 左右。主要頻率預計仍是 2.5GHz,但會掌握單核超頻技術,一般可再提升 20%,將爭取達到 3.

0GHz。據悉,龍芯 3B6600 單核、多核性能能達到 Intel 12/13 代 Alder Lake 中高階水準,也就是能匹敵 i5、i7 系列,超過當時市場銷售的 50% 以上桌面 CPU。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。