Campbell Brown 終其職業生涯一直追尋準確資訊,先前擔任知名電視記者,後來成為 Facebook 第一位也是唯一一位專職新聞主管。如今,眼見 AI 改變人們消費資訊的方式,她擔憂歷史即將重演。這次,她不打算坐等他人修補。公司 Forum AI——她最近在舊金山 StrictlyVC 晚會上與 TechCrunch 的 Tim Fernholz 討論——評估基礎模型在所謂「高風險議題」上的表現,包括地緣政治、心理健康、金融、招聘等領域,這些議題「沒有明確的對錯答案,充滿模糊、細微差別與
複雜性」。
Forum AI 的專家基準測試
理念是尋找全球頂尖專家,讓他們設計基準測試,然後訓練 AI 評審員大規模評估模型。在 Forum AI 的地緣政治工作上,Brown 招募了 Niall Ferguson、Fareed Zakaria、前國務卿 Tony Blinken、前眾議院議長 Kevin McCarthy,以及曾在歐巴馬政府領導網絡安全的 Anne Neuberger。目標是讓 AI 評審員與這些人類專家達成約 90% 共識,她表示 Forum AI 已能達到此門檻。
Brown 追溯 Forum AI 的起源,這家公司 17 個月前在紐約成立,源於一個特定時刻。「我在 Meta 任職時,ChatGPT 首次公開發佈,」她回憶,「不久後我就意識到,這將成為所有資訊流動的管道,但它並不優秀。」這對她子女的影響讓那一刻幾乎具有存在性危機。「如果我們不找出解決方法,我的孩子們會變得很笨,」她當時想。
最令她沮喪的是,準確性似乎無人重視。
她說,基礎模型公司「極度專注於編碼與數學」,而新聞與資訊更難。但她主張,更難並不代表可忽略。事實上,Forum AI 開始評估領先模型時,結果並不樂觀。她舉例 Gemini 從中國共產黨網站抽取資訊,用於「與中國無關的故事」,並指出幾乎所有模型都有左傾政治偏見。她還提到更細微的失敗,包括遺漏脈絡、遺漏觀點、未經承認的稻草人謬誤。「路還很長,」她說。「但我也認為,有些非常簡單的修正就能大幅改善結果。」
Brown 在 Facebook 工作多年,見證平台優化錯誤目標的後果。「我們嘗試的許多事情都失敗了,」她告訴 Fernholz。她建立的事實查核計劃已不復存在。教訓是,即使社群媒體視而不見,優化互動性對社會有害,讓許多人資訊更匱乏。她希望 AI 能打破此循環。「現在結果可能兩極,」她說;公司可給用戶想要的,或「給人們真實、誠實、準確的東西。」她承認 AI 優化真相的理想版本聽來天真。
但她認為企業可能是意外盟友。使用 AI 作信貸決定、貸款、保險與招聘的企業在意責任,「他們會希望你優化正確性。」
Forum AI 也押注此企業需求賭注業務,儘管將合規興趣轉為穩定收入仍是挑戰,尤其當前市場多滿足於 Brown 視為不足的勾選審計與標準基準。合規環境,她說,「是笑話。」紐約市通過首個要求 AI 審計的招聘偏見法時,州審計長發現逾半數違規未被偵測。
她表示,真正評估需領域專長,處理不僅已知情境,還包括「可能惹禍但人們想不到的邊緣案例」。這項工作耗時。「聰明通才不行。」
Brown 的公司去年秋天由 Lerer Hippeau 領投籌得 US$3 (約 HK$23) million,她獨特定位描述 AI 產業自我形象與多數用戶現實的脫節。「你聽大科技公司領袖說,『這技術將改變世界』、『會讓你失業』、『會治癒癌症』,」她說。
「但對一般人僅用聊天機器人問基本問題,他們仍得到大量垃圾與錯誤答案。」AI 信任度極低,她認為這種懷疑在許多情況下合理。「矽谷的對話圍繞一件事,而消費者間的對話完全不同。」

