前 Meta 新聞主管 Campbell Brown 創 Forum AI 評估生成模型高風險議題表現

Campbell Brown 終其職業生涯一直追尋準確資訊，先前擔任知名電視記者，後來成為 Facebook 第一位也是唯一一位專職新聞主管。如今，眼見 AI 改變人們消費資訊的方式，她擔憂歷史即將重演。這次，她不打算坐等他人修補。公司 Forum AI——她最近在舊金山 StrictlyVC 晚會上與 TechCrunch 的 Tim Fernholz 討論——評估基礎模型在所謂「高風險議題」上的表現，包括地緣政治、心理健康、金融、招聘等領域，這些議題「沒有明確的對錯答案，充滿模糊、細微差別與

複雜性」。

Forum AI 的專家基準測試

理念是尋找全球頂尖專家，讓他們設計基準測試，然後訓練 AI 評審員大規模評估模型。在 Forum AI 的地緣政治工作上，Brown 招募了 Niall Ferguson、Fareed Zakaria、前國務卿 Tony Blinken、前眾議院議長 Kevin McCarthy，以及曾在歐巴馬政府領導網絡安全的 Anne Neuberger。目標是讓 AI 評審員與這些人類專家達成約 90% 共識，她表示 Forum AI 已能達到此門檻。

Brown 追溯 Forum AI 的起源，這家公司 17 個月前在紐約成立，源於一個特定時刻。「我在 Meta 任職時，ChatGPT 首次公開發佈，」她回憶，「不久後我就意識到，這將成為所有資訊流動的管道，但它並不優秀。」這對她子女的影響讓那一刻幾乎具有存在性危機。「如果我們不找出解決方法，我的孩子們會變得很笨，」她當時想。
最令她沮喪的是，準確性似乎無人重視。

她說，基礎模型公司「極度專注於編碼與數學」，而新聞與資訊更難。但她主張，更難並不代表可忽略。事實上，Forum AI 開始評估領先模型時，結果並不樂觀。她舉例 Gemini 從中國共產黨網站抽取資訊，用於「與中國無關的故事」，並指出幾乎所有模型都有左傾政治偏見。她還提到更細微的失敗，包括遺漏脈絡、遺漏觀點、未經承認的稻草人謬誤。「路還很長，」她說。「但我也認為，有些非常簡單的修正就能大幅改善結果。」
Brown 在 Facebook 工作多年，見證平台優化錯誤目標的後果。「我們嘗試的許多事情都失敗了，」她告訴 Fernholz。她建立的事實查核計劃已不復存在。教訓是，即使社群媒體視而不見，優化互動性對社會有害，讓許多人資訊更匱乏。她希望 AI 能打破此循環。「現在結果可能兩極，」她說；公司可給用戶想要的，或「給人們真實、誠實、準確的東西。」她承認 AI 優化真相的理想版本聽來天真。

但她認為企業可能是意外盟友。使用 AI 作信貸決定、貸款、保險與招聘的企業在意責任，「他們會希望你優化正確性。」
Forum AI 也押注此企業需求賭注業務，儘管將合規興趣轉為穩定收入仍是挑戰，尤其當前市場多滿足於 Brown 視為不足的勾選審計與標準基準。合規環境，她說，「是笑話。」紐約市通過首個要求 AI 審計的招聘偏見法時，州審計長發現逾半數違規未被偵測。

她表示，真正評估需領域專長，處理不僅已知情境，還包括「可能惹禍但人們想不到的邊緣案例」。這項工作耗時。「聰明通才不行。」
Brown 的公司去年秋天由 Lerer Hippeau 領投籌得 US$3 (約 HK$23) million，她獨特定位描述 AI 產業自我形象與多數用戶現實的脫節。「你聽大科技公司領袖說，『這技術將改變世界』、『會讓你失業』、『會治癒癌症』，」她說。

「但對一般人僅用聊天機器人問基本問題，他們仍得到大量垃圾與錯誤答案。」AI 信任度極低，她認為這種懷疑在許多情況下合理。「矽谷的對話圍繞一件事，而消費者間的對話完全不同。」

前 Meta 新聞主管 Campbell Brown 創 Forum AI 評估生成模型高風險議題表現

Forum AI 的專家基準測試

Henderson

搜尋文章

Forum AI 的專家基準測試

相關文章

Henderson

搜尋文章