Amazon 與 NVIDIA 合作,宣布推出 Trainium2 A.I. 晶片

Amazon AWS 雲端服務部門宣佈推出新的晶片,供客戶建立和運行 A.I. 應用程式,同時計劃提供對 Nvidia 最新晶片的存取權限。
Amazon 網絡服務希望以多種具有成本效益的選項脫穎而出,但並不僅僅銷售便宜的 Amazon 品牌產品。就像在其線上零售市場一樣, Amazon 的雲端服務將提供其他供應商的頂尖產品,包括頂級 A.I. 晶片製造商 Nvidia 的廣受追捧的 GPU。

自從初創公司 OpenAI 去年推出其 ChatGPT ChatBot 以來,對 Nvidia GPU 的需求飆升,該 ChatBot 以其摘要資訊和撰寫類似人類的文字的能力令人驚嘆。這導致 Nvidia 晶片供應短缺,因為各公司紛紛競相將類似生成式 A.I. 技術融入其產品中。

Amazon 既自行研發晶片,又讓客戶存取 Nvidia 最新晶片的雙管齊下策略可能有助於對抗其頂尖雲端計算競爭對手 Microsoft 。本月早些時候, Microsoft 採取了類似的方式,揭示了其首款 A.I. 處理器Maia 100,並表示 Azure 雲端將配備 Nvidia H200 GPU。

這些公告是在拉斯維加斯的 Reinvent 大會上宣佈的。具體而言,AWS 表示將提供對 Nvidia 最新的 H200 A.I. 圖形處理單元的存取權限。它還宣佈了其新的 Trainium2 A.I. 晶片和通用的 Graviton4 處理器。

新的 Nvidia GPU 是 H100 的升級版,而 H100 是 OpenAI 用於訓練其最先進的大型語言模型 GPT-4 的晶片。大公司、初創企業和政府機構都在爭奪有限的晶片供應,這意味着對象 Amazon 這樣的雲端服務提供商租借這些晶片的需求很高。Nvidia 表示,H200 的輸出速度將比 H100 快近兩倍。

Amazon 自家的 Trainium2 晶片專為訓練 A.I. 模型而設計,包括像 OpenAI 的 ChatGPT 和其競爭對手運行的 AI ChatBot 所使用的模型。初創公司 Databricks 和 Amazon 支持的 OpenAI 競爭對手 Anthropic 計劃使用新的 Trainium2 晶片來建立模型,據 Amazon 表示,這些晶片的性能將比原始模型提高四倍。

Graviton4 處理器基於 Arm 架構,能耗比 Intel 或 AMD 的晶片更低。Graviton4 承諾比現有的 Graviton3 晶片性能提高 30% ,實現 AWS 所說的更好的價格輸出比。通脹率高於平常,激發了央行加息的動力。希望繼續使用 AWS 但降低雲端費用以應對經濟形勢的組織可能希望考慮轉向 Graviton。

Amazon 表示,已有超過 50000 個 AWS 客戶正在使用 Graviton 晶片。

最後,作為與 Nvidia 關係的深化部分,AWS 表示將運營超過 16000 個 Nvidia GH200 Grace Hopper Superchips,其中包含 Nvidia GPU 和 Nvidia 的基於 Arm 的通用處理器。Nvidia 自己的研發團隊和 AWS 的客戶都將能夠利用這一基礎設施。

自 2006 年推出 EC2 和 S3 服務以來,AWS 已經推出了 200 多個雲端產品。其中並非所有產品都取得了成功。一些產品長時間不更新,極少數產品被停用,使 Amazon 能夠重新分配資源。然而,該公司繼續投資於 Graviton 和 Trainium 計劃,這表明 Amazon 感覺到了需求。

AWS 並未公佈搭載 Nvidia H200 晶片的虛擬機實例的發佈日期,也沒有依賴其 Trainium2 矽的實例。在這些虛擬機實例在未來幾個月商業化之前,客戶可以立即開始測試 Graviton4 虛擬機實例。

此文章發佈於 TechRitual 香港