人造智能熱潮正迅速耗盡一項AI開發不可或缺的資源:算力。這場嚴重的算力短缺已令重度用戶陷入困擾,迫使企業放棄部分產品,並引發服務穩定性問題。這些問題為AI熱潮敲響警鐘——正當海量用戶開始依賴先進AI工具提升生產力時,算力瓶頸卻限制了這些強大新工具的實際效能。 過去數月,「智能體AI」需求呈現爆炸式增長。這類自主型AI工具能獨立完成各類任務,從編寫軟件代碼到為生產經理安排行程。
企業正爭相搶奪算力資源,以服務不斷擴大並使用戶體驗強度顯著提升的用戶群。「所有人都喺度傾石油,但我認為全球真正短缺嘅係Token。」矽谷工程師兼科技投資者Ben Pouladian表示。Token係AI中用於衡量任務消耗算力的計量單位。「而家嘅AI早唔止係我哋企喺雪櫃前問菜單嘅聊天機械人,它喺統籌任務時變得越來越智能。」這一切指向科技繁榮史上重複出現的經典問題:從19世紀鐵路擴張到21世紀初電信與互聯網爆發,需求增速遠超企業獲取資源、建造基礎設施的速度。
歷史上,漲價往往係解決供應短缺的唯一手段,但對前AI公司而言風險巨大——它們正為爭奪用戶展開激烈競爭。
算力成本急升與服務不穩
用於訓練同運作AI模型的圖形處理器(GPU)租賃價格自去年秋季以來大幅上漲。熱門聊天機械人Claude及其爆紅的編程工具Claude Code的開發公司Anthropic近期頻繁遭遇服務中斷。該公司已開始喺高峰時段對用戶實行Token用量限制,但此舉引發大量用戶抱怨,稱自己很快便觸及用量上限。 據報道,OpenAI已暫停其視頻生成應用Sora,部分原因係釋出算力,以支持代號為Spud的全新AI模型驅動的編程與企業級產品。
OpenAI面向企業用戶的API平台Token用量,從去年10月的每分鐘60億激增至3月下旬的150億。「我確實花咗大量時間尋找一切能即時調用的算力。」OpenAI財務長Sarah Friar喺近期一次面向投資者的公開會議表示,「由於算力不足,我哋被迫放棄一些項目,做出非常艱難的取捨。」 去年度底,規模最大的上市AI雲計算公司之一CoreWeave將價格上調達20%,並要求小型客戶簽訂至少三年的服務合約,先前此期限僅為一年。
美國銀行分析師上月底恢復對該公司的評級並給予「買入」評級,稱其服務需求至少至2029年前將持續供不應求。 紐約數據提供商Ornn的數據顯示,近數月來,英偉達全系列GPU喺雲端數據中心的現貨租賃價格平均大升。Ornn Compute價格指數顯示,英偉達最先進的Blackwell系列晶片每小時租金已達US$4.08,約 HK$31.82,比兩個月前的US$2.75,約 HK$21.
45上漲48%。 自2月中旬以來,Anthropic全系統頻繁宕機,部分企業客戶已轉而使用其他AI供應商的模型。軟件開發平台Retool創辦人兼首席執行官David Hsu表示,他原本偏好使用Anthropic的Opus 4.6模型驅動公司AI智能體工具,因其最合企業場景。但他近期已切換至OpenAI的模型。「Anthropic的服務一直喺度中斷。」 互聯網核心服務的可可靠性通常用「四個九」衡量,即99.
99%的在線率,亦係軟件公司對客戶的常見承諾。截至4月8日,Anthropic的Claude API近90天在線率僅為98.95%。「呢個好唔尋常。」AI推理初創公司Baseten聯合創辦人兼首席技術官Amir Haghighat表示,「諗下AWS、數據庫、RDS或Stripe,它們需要極高的穩定性同在線率。但AI領域目前並非如此,這唔係你期望從提供智能能力的公司那裡得到的服務質素。
」 喺服務頻繁中斷的同時,Anthropic正經歷爆炸式增長。2025財年尾,該公司年度收入規模達90億美元,約 HK$702億;至今年2月,此數字激增至140億美元,約 HK$1,092億;兩個月後再度翻倍,達300億美元,約 HK$2,340億。 3月下旬,Anthropic突然宣布,將喺太平洋時間工作日早5點至11點的高峰時段限制用戶Token消耗額度。
用戶紛紛喺社交平台抱怨。一位用戶喺X上寫道:「我好幾個星期都未觸及Claude Code限額,結果呢個星期45分鐘就用完。」「我哋正全力滿足Claude日漸增長的需求。」Claude Code負責人兼開發主管喬治·謝爾尼喺X上表示,「算力係我哋管理的資源,我哋會優先確保產品與API的客戶。」




