MIT 新 AI 在超級電腦速度下篩選百萬分子

在現今快速變化的醫療科技領域,藥物發現的過程正受到前所未有的加速,而 Boltz-2 作為一款次世代生物分子基礎模型,成為了這場競賽中的重要助力。這款模型由麻省理工學院的 Jameel Clinic 和 CSAIL 與位於猶他州的生技初創公司 Recursion 合作開發,能夠以超級計算機的速度進行藥物發現。Boltz-2 在兩個月前正式發佈,該模型將複雜的結構預測和結合親和力的估算整合在同一平台上,從而幫助研究人員在數小時內篩選出龐大的分子庫,而不再需要耗時數週。這一創新極大地壓縮了以往耗費巨大時間和成本的研究開發周期,迅速推進整個流程。

Boltz-2 的核心在於其接近基於物理的自由能擾動(FEP)模擬的準確性,這被認為是預測分子結合緊密程度的金標準,而其速度卻能達到傳統方法的 1,000 倍。在 Recursion 的 BioHive-2 超級計算機上,這款模型能夠同時處理數百萬對配體-蛋白質,並在約 20 秒內返回每對的結合結果,這一速度為藥品研究帶來了翻天覆地的變化。科學家們不再需要在實驗室中逐一測試化合物,或是等待幾周的物理模擬結果,而是可以在超級計算機的規模上進行數字化的分子篩選。

Boltz-2 的成功不僅歸功於生物學的進步,更在於其工程技術的突破。Recursion 的 BioHive-2 超級計算機基於 NVIDIA 的 DGX SuperPOD 和 H100 Tensor Core GPU,經過優化以處理超過三百萬個標記範例的龐大訓練數據,這些數據幫助模型在單次前向傳遞中同時學習姿勢和效能。NVIDIA 的工程師也在此過程中發揮了關鍵作用,通過剖析模型來消除計算瓶頸,並引入自訂的 cuEquivariance 核心,加速了關鍵的「三角形」運算,從而將訓練和推斷成本壓縮了最多 3 倍。這些優化措施不僅減少了內存使用量,還使 Boltz-2 成為藥品製造商可行的生產級工具。

對於企業而言,這款模型還被包裝為 Boltz-2 NIM,這是一個生產就緒的微服務,可以接收蛋白質、RNA、DNA 或配體序列,並返回 3D 結構和親和力預測,並提供企業級支持。NIM 的部署路徑為生物製藥公司提供了更高的通量和更低的計算支出,這在開發新藥的高風險競賽中是至關重要的。Boltz-2 於 6 月 6 日正式以 MIT 許可證發佈,代碼、權重和訓練流程均可供學術和商業用途。經過 Recursion 的 BioHive-2 訓練並由 NVIDIA 加速,該模型以高達 1,000 倍的速度實現接近 FEP 的準確性,標誌著人工智慧驅動的藥物發現領域的重大進展。Boltz-2 以 MIT 許可證發佈,允許自由重新訓練、微調和部署,而企業級推斷則通過 NVIDIA Boltz-2 NIM 在 NVIDIA AI Enterprise 許可下獲得支持。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。