專為特定用途設計的小型語言模型(SLMs),為政府機構提供實用的 AI 運作方案,確保所需的安全性、信任度和控制力。AI 熱潮席捲各行各業,公共部門機構正面臨加速採用的壓力,同時卻受制於獨特的保安、管治及營運限制,與企業界截然不同。因此,專用 SLMs 成為在這些環境中運作 AI 的理想途徑。Capgemini 一項研究顯示,全球 79% 公共部門高管對 AI 數據安全存疑,這在政府數據高度敏感及受法律規管的背景下並不意外。
Elastic AI 副總裁 Han Xiao 表示:「政府機構必須嚴格限制發送至網絡的數據類型,這為數據管理設下諸多界限。」敏感資訊控制的需求,是 AI 部署面臨的眾多挑戰之一,尤其相較私營部門的標準營運假設。私營企業擴展 AI 時,通常假設雲端持續連接、中央化基礎設施、模型透明度不完整及數據流動限制較少。但對許多政府機構而言,接受這些條件可能危險甚至不可能。
它們需確保數據留在掌控中、可驗證,並將營運中斷減至最低,同時常在互聯網連接有限或不可靠的環境運作。這些複雜性阻礙許多公共部門 AI 試驗項目轉向實用階段。Han Xiao 指出:「許多人低估 AI 的營運挑戰。公共部門需要 AI 在各種數據上可靠運作,並能擴展而不崩潰。營運連續性常被忽視。」Elastic 對公共部門領袖的調查發現,65% 受訪者難以即時大規模使用數據。
基礎設施限制加劇問題,政府機構難以取得用於訓練及存取複雜 AI 模型的圖形處理單元(GPUs)。Han Xiao 補充:「政府不像私營部門常購買 GPUs,它們不習慣管理 GPU 基礎設施,這成為公共部門運行模型的瓶頸。」公共部門的諸多硬性要求,使大型語言模型(LLMs)難以適用,但 SLMs 可本地部署,提供更高保安及控制。SLMs 是專門 AI 模型,通常僅用數十億參數,而非數千億,計算需求遠低於最大 LLMs。
公共部門無需建置更大模型於遠端中央位置。一項實證研究顯示,SLMs 表現與 LLMs 相若或更佳。它們讓敏感資訊有效利用,避開維護大型模型的複雜性。Han Xiao 形容:「用 ChatGPT 校對很容易,但在無網絡環境運行自家大型語言模型就極難。」SLMs 專為部門需求打造,數據安全儲存模型外,僅於查詢時存取。精細提示確保僅檢索最相關資訊,提供更準確回應。
透過智能檢索、向量搜尋及可驗證來源錨定等方法,可建構適合公共部門的 AI 系統。
SLMs 革新公共部門數據應用
公共部門下一階段 AI 採用,或許是將 AI 工具帶到數據旁,而非將數據送往雲端。Gartner 預測,到 2027 年,小型專用 AI 模型使用量將是 LLMs 的三倍。Han Xiao 表示:「公共部門聽到 AI 多Lenovo ChatGPT,但我們可更具野心。AI 可革新政府搜尋及管理海量數據的方式。」超越聊天機械人,AI 最即時機會在於大幅改善搜尋。公共部門擁有大量非結構化數據,如技術報告、採購文件、會議記錄及發票。
現代 AI 可處理混合媒體,包括可讀 PDF、掃描檔、圖像、試算表及錄音,並支援多語言。SLM 驅動系統可索引這些內容,提供客製回應及多語言複雜文本草稿,確保輸出符合法律。Han Xiao 說:「公共部門數據豐富,但不知如何善用,不知潛力。」更強大之處在於,AI 助員工解讀數據。「現代 AI 提供全新視角,發掘數據價值。」經良好訓練的 SLM 可解讀法律規範、從公眾諮詢提取洞見、支援數據驅動決策,並提升公眾服務及行政資訊存取。
這有助公共部門營運大幅改善。聚焦 SLMs,將討論從模型全面性轉向效率。LLMs 帶來高性能及計算成本,需專用硬件,多數公共機構負擔不起。SLMs 雖需初始投資,但資源需求較低,成本更親民並減低環境影響。公共機構常面臨嚴格審計,SLM 演算法可記錄及認證為透明。有些國家如歐洲的 GDPR 隱私規例,SLMs 可設計符合。客製訓練數據產生更精準結果,減少錯誤、偏見及幻覺。
Han Xiao 解釋:「大型語言模型依訓練數據生成文本,有截止日期,之後查詢易幻覺。我們可強制模型依驗證來源運作。」本地伺服器或單一裝置儲存數據,亦減低風險。這非孤立,而是策略自主,帶來信任、韌性及相關性。優先任務特定模型、本地數據處理及持續監測,即可建構持久 AI 能力,支援現實決策。Han Xiao 建議:「勿從聊天機械人入手,從搜尋開始。大部分所謂 AI 智能,實為尋找正確資訊。
」




