AI 系統職場經濟可行性成疑 企業建置技術後續路徑不明

即使是頂尖的 AI 系統,在職場上也難以實現經濟可行性。這引發了一個關鍵問題:下一步該如何?倫敦一場反 AI 遊行中,有人派發傳單,上面寫道:「步驟 1:培育數位超級智能。步驟 2:?步驟 3:?」這是由國際活動組織 Pause AI 製作的傳單,呼籲「在搞清楚步驟 2 前暫停 AI 發展」。這讓人Lenovo到 1998 年《南方公園》經典一集「Gnomes」,其中小精靈的商業計劃是「階段 1:收集內褲。

階段 2:?階段 3:盈利」,如今已成為諷刺創業策略和政策提案的網路迷因。Elon Musk 也曾以此調侃其火星任務融資計劃。目前,AI 產業正處於類似狀態:企業已建構技術(步驟 1),並承諾帶來變革(步驟 3),但中間路徑仍是問號。

AI 職場表現的現實差距

Pause AI 主張步驟 2 需透過監管實現,但具體形式和執行者仍存爭議。AI 支持者則視其為救贖,OpenAI 首席科學家 Jakub Pachocki 近日表示,這是「經濟轉型技術」,將帶領人類邁向光明未來。他們大致知曉終點,但路線各異,能否成功到達仍未知。近期兩項研究凸顯現實落差。一項來自 Anthropic 的分析預測大型語言模型(LLMs)將影響特定職業,以下為主要發現:

高影響職業低影響職業
經理人、建築師、媒體從業者園丁、建築工人、酒店業從業者

這些預測僅基於 LLMs 在任務上的表面表現,而非實際職場效能。另一項由 AI 招聘初創 Mercor 在 2 月發表的報告,更嚴峻:研究人員測試 OpenAI、Anthropic 和 Google DeepMind 的頂級 AI 代理,在 480 項銀行家、顧問和律師常見任務中,幾乎全數失敗。分歧源於多重因素,包括宣稱者的利益衝突(如 Anthropic 自身的涉入),以及過度依賴 AI 編碼工具進展。

事實上,LLMs 在策略判斷等非編碼任務上表現欠佳,且部署時須融入既有工作流程,有時反倒降低效率。要實現轉型,或許需重塑流程,但這需時間和勇氣。目前,缺乏共識導致資訊真空,充斥未經證實的狂言,一篇社群貼文即可撼動市場。業界亟需更多證據,而非猜測,這要求模型開發者提供透明度、研究與企業協作,以及新型評估方法,以檢驗真實部署效果。科技業與全球經濟押注 AI 的轉型潛力,但這仍非鐵板釘釘之事。

AI 內容聲明:本文由 AI 工具輔助撰寫初稿,經 TechRitual 編輯團隊審閱、修訂及事實查核後發佈。如有任何錯誤或需要更正,歡迎聯絡我們

Henderson
Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。部分文章由 AI 工具輔助撰寫,經編輯團隊審閱及事實查核後發佈。