Nvidia 再有更新，直接將 H100 GPU 的 AI 性能提昇最多 8 倍

Nvidia 與一系列科技合作夥伴攜手合作，開發了一款具有突破性的軟體，預計能將旗艦 H100 Tensor Core GPU 的性能提升一倍。這款名為 TensorRT-LLM 的開放源碼更新預計在未來幾週內發布，該系統的最新版本在性能上超越了 A100，達到了八倍的提升，而之前 H100 只能達到四倍的性能提升。這一測試是在 GPT-J 6B 上進行的，該模型被用於摘要 CNN 和 Daily Mail 的文章。

在 Meta 的 Llama2 LLM 上進行測試時，搭載 TensorRT-LLM 的 H100 GPU 在更新前比 A100 GPU 的性能提升了 4.6 倍，而更新後則提升了 2.6 倍。

Nvidia H100 GPU 的性能再度提升

大型語言模型的多樣性和動態性使得批量請求並行執行變得困難，這意味著一些請求的完成時間比其他請求更早。為了解決這個問題，Nvidia 與其合作夥伴將 TensorRT-LLM 嵌入了一種更強大的調度技術，稱為 in-flight batching。這種技術利用了文本生成可以分解為多個子任務的特點。

簡單來說，系統在處理下一個請求之前，不需要等待一個請求的整個批量任務完成，而是可以同時處理來自不同請求的新批量任務。TensorRT-LLM 包括 TensorRT 深度學習編譯器，並且包含了優化的核心、預處理和後處理步驟，以及多 GPU 和多節點通信原語。

結果 Nvidia 的 GPU 在性能上取得了突破性的成果，為新的大型語言模型實驗、快速定制和最佳性能鋪平了道路。這款軟體使用了張量平行處理技術，將個別權重矩陣分散在多個設備上，從而實現了高效的推論；每個模型在多個 GPU 和多個伺服器上並行運行。

TensorRT-LLM 還包括了 Llama 2、GPT-2、GPT-3 以及 Falcon、Mosaic MPT、BLOOM 等數十種熱門語言模型的完全優化和可直接運行的版本。這些模型可以通過 Python API 進行訪問。該更新版本已提供早期訪問，並將很快整合到 Nvidia NeMo 框架中，該框架是 Nvidia AI Enterprise 的一部分。研究人員可以通過 NeMo 框架、NGC 門戶或 GitHub 上的源代碼庫進行訪問。

蘋果首次在印度降低 iPhone 價格，因應進口稅減少政策。

iPhone 市場份額在中國下降，但兩個因素可能會扭轉這一趨勢。

iPhone 17 可能加入無反光鏡相機功能以提升 Portrait 模式拍攝效果

honor X60i 所有顏色渲染圖洩漏

三星 Galaxy S25 Ultra 的電池容量可能令人失望

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 10天 15GB，關東+關西最快有 123Mbps 速度

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 6天 6GB，夠用得來速度都幾好

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 15天 10GB，真正即插即用好重要

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 13天 15GB，實試 iPhone Samsung 換卡即用唔駛設定

Pixel Buds Pro 2 洩漏顯示硬體升級及受 AirPods 啟發的設計變更

Meta AI 將為 Quest 3 提供個人助手功能

Oura Ring 4 洩漏顯示其計劃如何對抗 Samsung Galaxy Ring 的競爭

Google 可能計劃推出一款搭載 Gemini 的競爭對手，與 Ray-Ban Meta 智能眼鏡抗衡。

Google 試圖奪取 Meta 的 Ray-Ban 合作夥伴關係

【整理】如何在 Apple TV 安裝使用 VPN！

【詳解】VPN 是什麼？選擇、推薦及「免費」服務介紹 2024

【教學說明】如何在 iPhone (iOS 17) 上設定 VPN

【詳解】如何為 iPhone 選擇 VPN？私隱、無日誌政策、易用、速度，5 個 VPN 服務供應商推介

保護人工智慧：VPN在人工智慧系統安全中的作用

【開箱評價】Bodysonic 日系摺疊式靜音循環風扇 (6寸)：靜靜地涼風，枱頭最佳

【開箱評價】Bodysonic 電動冷凍迷你風扇：今個暑假，「掂」住就涼哂啦～！

【開箱評價】CMF Phone 1 手機：中低階但有組件元素勁吸引

【推介評價】日本電話卡 – B4Travel 雙 5G 網絡 10天 15GB，關東+關西最快有 123Mbps 速度

Sharp AQUOS R8 Pro 有提供支援 WiFi 6 / 6e / WiFi 7嗎？

Nvidia 再有更新，直接將 H100 GPU 的 AI 性能提昇最多 8 倍

【2023最新日本電話卡】16 大日本上網 SIM 卡推介：不限速 / 無限數據！速度 / 價錢 / 日數大比拼

【手機比較】小米 Mix Flip 與 Oppo Find N3 Flip：規格表、效能、攝影功能

【推薦】2023 年最新 Mesh WiFi 6 / 6E 原理解說、優點及路由器推介

現代網民必知！你需要用到 VPN 的 4 大理由

【開箱評價】HONOR X7b 5G 千元手機：1.08億像素可以，勝在夠抵！

【開箱評測】Honor Magic6 Pro 手機：有無線充啦！影相表現相當出眾

電話卡

比較系列

Stock

推薦內容

教學 101

關於我們