Gorilla:大語言模型無縫連接海量 API,解決工具呼叫痛點

開發者喺整合大型語言模型 (LLM) 時,經常遇到模型無法準確呼叫外部 API 嘅困境,尤其係處理複雜工具時,輸出經常出現幻覺或錯誤參數,令應用開發效率大打折扣。Gorilla 正正針對呢個痛點,透過連接海量 API,將 LLM 轉化為強大嘅工具代理,面向 AI 開發者同研究人員,提供更可靠嘅工具使用體驗。呢個基於 LLaMA 架構嘅開放模型,不單止理解自然語言指令,更能精準生成正確嘅 API 呼叫,極大提升 LLM 喺實際應用中嘅實用性。

Gorilla 針對 API 工具精準生成正確呼叫語法

Gorilla 嘅獨特之處在於佢專門訓練咗超過 1,600 個真實世界 API 工具,包括流行服務如 OpenAI、GitHub 同 Wolfram Alpha 等。模型喺理解用戶意圖後,能夠直接輸出符合 API 規範嘅 JSON 格式呼叫,減少咗傳統 LLM 常見嘅語法錯誤。例如,用戶要求「取得天氣資訊」,Gorilla 唔會亂生成參數,而係精準指定 endpoint 同所需 fields,確保呼叫即時生效。呢種工具調優方法,喺同類產品入面比較少見,大大降低咗開發者手動修正嘅負擔。

[2305.15334] Gorilla: Large Language Model Connected with Massive APIs 介面截圖
[2305.15334] Gorilla: Large Language Model Connected with Massive APIs 官方頁面截圖

比主流 LLM 高 15 倍準確率喺工具呼叫任務

喺 ToolBench 基準測試中,Gorilla 展現出壓倒性優勢,對比 GPT-4 同 Claude 等主流模型,佢喺 API 工具精確匹配率上高達 15 倍以上。呢個成績源自佢獨有嘅訓練數據集,包含超過 200 萬個 API 文檔同自然語言查詢對,模型學會咗從文檔中提取關鍵資訊,如參數類型同驗證規則。研究顯示,Gorilla 特別擅長處理長尾 API,即係少用但專業嘅工具,解決咗一般 LLM 喺 niche 場景下嘅盲點。

另外,Gorilla 支援零樣本工具學習,唔需要額外微調,即可適應新 API。開發者只需提供 API 文檔,模型就能生成相應呼叫,呢點喺快速原型開發中特別實用。相比之下,傳統方法往往要花費大量時間訓練或提示工程,Gorilla 則簡化咗整個流程。

開源架構支援自訂擴展超過千個外部 API

作為開源項目,Gorilla 基於 7B 同 70B LLaMA 模型,提供完整代碼同權重,開發者可以輕鬆喺自家環境部署。佢已經整合咗上千個 API 來自不同領域,如天氣、翻譯、程式碼生成同搜尋引擎等,用戶透過簡單提示即可觸發多工具鏈式呼叫。例如,一條指令就能串聯 GitHub API 查詢 repo,再用 Wolfram 計算數據,形成完整工作流。呢種模組化設計,令 Gorilla 成為構建 AI 代理嘅理想基石。

論文仲提到,Gorilla 喺隱私敏感應用中表現出色,因為所有處理喺本地進行,唔依賴雲端服務。研究團隊來自 UC Berkeley,強調咗模型嘅泛化能力,即使面對未見過嘅 API 文檔,都能維持高準確率。對於企業開發者嚟講,呢個開源方案提供咗低成本進入 LLM 工具時代嘅途徑。

從研究到實作,Gorilla 加速 LLM 工具代理落地

總括嚟講,Gorilla 唔單止係一個模型,更係 LLM 生態嘅重要進展。佢透過大規模 API 連接,解決咗工具呼叫嘅核心挑戰,讓開發者專注業務邏輯而非語法修正。未來,隨著更多 API 整合,Gorilla 有望推動更多智能代理應用,從自動化腳本到複雜工作流皆適用。研究人員同開發者不妨試下呢個框架,體驗工具增強 LLM 嘅真正潛力。

產品名稱:Gorilla / Large Language Model Connected with Massive APIs
官方網站:https://arxiv.org/abs/2305.15334

📬 免費訂閱 TechRitual 科技精選

按「免費訂閱」即同意收到 TechRitual 嘅科技資訊及優惠。可隨時取消訂閱。

TechRitual 編輯
TechRitual 編輯