日本係「生成式人工智能」落後,但點解呢?

生成式 A.I. 自從 OpenAI 推出其 ChatBot ChatGPT 以來,一直是科技界最熱門的話題。據高盛研究顯示,生成式 A.I. 的突破有望在未來十年內推動全球 GDP 增長 7% ,即將近 7 萬億美元。

生成式 A.I. 的關鍵在於大型語言模型,這些模型是 ChatGPT 和百度的 Ernie Bot 等的基礎,能夠處理龐大的數據集以生成文本和其他內容。然而,日本在開發這些算法方面目前落後於美國、中國和歐盟,日本語言模型初創企業 Kotoba Technology 的聯合創始人小島憲之表示。

據 Reuters 5 月份引用國有研究機構聯盟的研究報告稱,中國的組織,包括科技巨頭阿里巴巴和騰訊,在過去三年內在國內至少推出了 79 個語言模型。小島表示,OpenAI 、 Microsoft 、 Google 和 Meta 等美國企業巨頭在推動該國語言模型的發展方面發揮了重要作用。

小島表示,日本在生成式 A.I. 方面的落後主要源於在深度學習和更廣泛的軟件開發方面的相對不足。深度學習需要一個「強大的軟件工程師社區」來開發必要的基礎設施和應用程式。然而,根據經濟產業省的數據,到 2030 年,日本將面臨 78,9000 名軟件工程師的缺口。根據 IMD 世界數字競爭力排名,日本在技術知識方面目前排名第 28 位,共有 63 個國家參與排名。

日本還面臨着硬件挑戰,因為語言模型需要使用 IBM 的 Vela 和 Microsoft 的 Azure 等 A.I. 超級電腦進行訓練。但據日本亞洲新聞報導,日本沒有一家私營公司擁有具有這些功能的「世界一流機器」。

小島解釋說,政府控制的超級電腦 Fugaku「是日本追求語言模型的關鍵」。他說:「訪問這樣的大型超級電腦是語言模型開發的支柱,因為傳統上這是過程中最重要的瓶頸。」

東京工業大學和東北大學計劃與 Fugaku 的開發商富士通和理研合作,利用 Fugaku 開發主要基於日本數據的語言模型,富士通在 5 月份宣佈。富士通還表示,這些組織計劃在 2024 年發表研究成果,以幫助其他日本研究人員和工程師開發語言模型。

據日本亞洲新聞報導,日本政府還將投資 68 億日元(約合 4820 萬美元),即總成本的一半,建設一台新的超級電腦,該計算機將於明年初開始運營。該超級電腦將專門用於語言模型訓練,以促進日本在生成式 A.I. 方面的發展。

大型科技公司也加入了這場競爭,以提升日本在生成式 A.I. 領域的地位。據當地媒體報導,軟銀的移動部門表示計劃開發自己的生成式 A.I. 平台。這一舉措得到了軟銀 CEO 孫正義的支持,他在股東年度大會上宣佈該投資公司計劃從「防守模式」轉向「進攻模式」,並加大對 A.I. 的關注。

NTT 等公司也宣佈計劃在本財年內開發自己的語言模型,旨在為企業創建「輕量高效」的服務。NTT 表示,未來五年將向數據中心和 A.I. 等增長領域投入 8 萬億日元,這是其之前投資水平的 50% 增加。

儘管在生成式 A.I. 領域尚未迎頭趕上,但日本正通過這些私營部門的努力邁出第一步。一旦建立了「強大的基礎設施」,使用先前先驅者的開源