Google 發起 Gemma,一個家庭開源模型系列

在過去的幾週中, Google 先後推出了 Gemini 1.0 Ultra 和 Gemini 1.5 Pro,現在又推出了一個名為 Gemma 的新型小型開源模型家族。它有兩個變體,一個有 2B 個參數,另一個有 7B 個參數。

這些開源模型採用商業許可證,這意味着它們可以自由使用或修改,以用於商業目的,與 Gemini 不同,後者是專有模型。該公司表示,儘管體積小,Gemma 模型具有強大的功能,並基於用於創建 Gemini 模型的研究和技術。

Gemma 模型可以輕鬆運行在 你的 Notebook 電腦上
Google 表示,Gemma 開源模型體積相當小,可以輕鬆部署在 Notebook 電腦或桌面電腦上。它們已經在包括網頁文件、代碼和數學在內的英文數據集上進行了訓練。

Gemma 模型非常適合文本摘要、生成、推理、問答等應用。至於訓練數據集, Google 表示 Gemma 模型總共訓練了 6 萬億個標記。

雖然這些模型是開源的,但 Google 對其進行了廣泛的安全、偏見和風險測試。他們嚴格應用了兒童性虐待物料(CSAM)過濾器,以刪除任何有害內容。除此之外,還對模型進行了許多敏感數據過濾,以排除個人資訊。 Google 還為開發人員提供了負責任的生成 AI 工具包,以便負責地使用這些模型。Gemma 模型是開源的,但它有一些禁止使用政策,禁止開發人員用於「危險、非法或惡意活動」,等等。

基準測試而言,Gemma 2B 模型在 MMLU 測試中得分為 42.3,而 7B 模型得分為 64.3。在 HellaSwag 測試中,2B 模型得分 71.4,7B 模型得分 81.2。相比之下, Microsoft 的 2.7B Phi-2 模型在 MMLU 測試中得分為 56.7,Meta 的 Llama 2(7B)得分為 45.3。然而, Google 自家的 Gemini Nano 2(3.2B)模型在同一測試中得分為 55.8。

總的來說,認為 Google 釋放開源模型以促進研究和創新是一個很好的舉措。 你可以在 Kaggle 上開始使用 Gemma 模型,或者在 GitHub 上查看 Gemma 模型的官方 PyTorch 實現。 你還可以在 Vertex AI 上了解 Gemma。

此文章發佈於 TechRitual 香港 - 日本電話卡
十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。