AI 系統職場經濟可行性成疑企業建置技術後續路徑不明

即使是頂尖的 AI 系統，在職場上也難以實現經濟可行性。這引發了一個關鍵問題：下一步該如何？倫敦一場反 AI 遊行中，有人派發傳單，上面寫道：「步驟 1：培育數位超級智能。步驟 2：？步驟 3：？」這是由國際活動組織 Pause AI 製作的傳單，呼籲「在搞清楚步驟 2 前暫停 AI 發展」。這讓人Lenovo到 1998 年《南方公園》經典一集「Gnomes」，其中小精靈的商業計劃是「階段 1：收集內褲。

階段 2：？階段 3：盈利」，如今已成為諷刺創業策略和政策提案的網路迷因。Elon Musk 也曾以此調侃其火星任務融資計劃。目前，AI 產業正處於類似狀態：企業已建構技術（步驟 1），並承諾帶來變革（步驟 3），但中間路徑仍是問號。

AI 職場表現的現實差距

Pause AI 主張步驟 2 需透過監管實現，但具體形式和執行者仍存爭議。AI 支持者則視其為救贖，OpenAI 首席科學家 Jakub Pachocki 近日表示，這是「經濟轉型技術」，將帶領人類邁向光明未來。他們大致知曉終點，但路線各異，能否成功到達仍未知。近期兩項研究凸顯現實落差。一項來自 Anthropic 的分析預測大型語言模型（LLMs）將影響特定職業，以下為主要發現：

高影響職業	低影響職業
經理人、建築師、媒體從業者	園丁、建築工人、酒店業從業者

這些預測僅基於 LLMs 在任務上的表面表現，而非實際職場效能。另一項由 AI 招聘初創 Mercor 在 2 月發表的報告，更嚴峻：研究人員測試 OpenAI、Anthropic 和 Google DeepMind 的頂級 AI 代理，在 480 項銀行家、顧問和律師常見任務中，幾乎全數失敗。分歧源於多重因素，包括宣稱者的利益衝突（如 Anthropic 自身的涉入），以及過度依賴 AI 編碼工具進展。

事實上，LLMs 在策略判斷等非編碼任務上表現欠佳，且部署時須融入既有工作流程，有時反倒降低效率。要實現轉型，或許需重塑流程，但這需時間和勇氣。目前，缺乏共識導致資訊真空，充斥未經證實的狂言，一篇社群貼文即可撼動市場。業界亟需更多證據，而非猜測，這要求模型開發者提供透明度、研究與企業協作，以及新型評估方法，以檢驗真實部署效果。科技業與全球經濟押注 AI 的轉型潛力，但這仍非鐵板釘釘之事。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

AI 系統職場經濟可行性成疑企業建置技術後續路徑不明

AI 職場表現的現實差距

Henderson

搜尋文章

AI 職場表現的現實差距

相關文章

Henderson

搜尋文章