即使是頂尖的 AI 系統,在職場上也難以實現經濟可行性。這引發了一個關鍵問題:下一步該如何?倫敦一場反 AI 遊行中,有人派發傳單,上面寫道:「步驟 1:培育數位超級智能。步驟 2:?步驟 3:?」這是由國際活動組織 Pause AI 製作的傳單,呼籲「在搞清楚步驟 2 前暫停 AI 發展」。這讓人Lenovo到 1998 年《南方公園》經典一集「Gnomes」,其中小精靈的商業計劃是「階段 1:收集內褲。
階段 2:?階段 3:盈利」,如今已成為諷刺創業策略和政策提案的網路迷因。Elon Musk 也曾以此調侃其火星任務融資計劃。目前,AI 產業正處於類似狀態:企業已建構技術(步驟 1),並承諾帶來變革(步驟 3),但中間路徑仍是問號。
AI 職場表現的現實差距
Pause AI 主張步驟 2 需透過監管實現,但具體形式和執行者仍存爭議。AI 支持者則視其為救贖,OpenAI 首席科學家 Jakub Pachocki 近日表示,這是「經濟轉型技術」,將帶領人類邁向光明未來。他們大致知曉終點,但路線各異,能否成功到達仍未知。近期兩項研究凸顯現實落差。一項來自 Anthropic 的分析預測大型語言模型(LLMs)將影響特定職業,以下為主要發現:
| 高影響職業 | 低影響職業 |
|---|---|
| 經理人、建築師、媒體從業者 | 園丁、建築工人、酒店業從業者 |
這些預測僅基於 LLMs 在任務上的表面表現,而非實際職場效能。另一項由 AI 招聘初創 Mercor 在 2 月發表的報告,更嚴峻:研究人員測試 OpenAI、Anthropic 和 Google DeepMind 的頂級 AI 代理,在 480 項銀行家、顧問和律師常見任務中,幾乎全數失敗。分歧源於多重因素,包括宣稱者的利益衝突(如 Anthropic 自身的涉入),以及過度依賴 AI 編碼工具進展。
事實上,LLMs 在策略判斷等非編碼任務上表現欠佳,且部署時須融入既有工作流程,有時反倒降低效率。要實現轉型,或許需重塑流程,但這需時間和勇氣。目前,缺乏共識導致資訊真空,充斥未經證實的狂言,一篇社群貼文即可撼動市場。業界亟需更多證據,而非猜測,這要求模型開發者提供透明度、研究與企業協作,以及新型評估方法,以檢驗真實部署效果。科技業與全球經濟押注 AI 的轉型潛力,但這仍非鐵板釘釘之事。




