DeepSeek 新推出 AI 模型 V3-0324 或將改變 AI 競爭格局

中國 AI 初創公司 DeepSeek 最近在 Hugging Face 上推出了升級版 AI 模型 V3-0324,該模型在推理和編碼能力上相較於前代產品有顯著提升。DeepSeek 宣稱其 AI 模型可以與美國 AI 開發商如 OpenAI 和 Anthropic 的產品相媲美,甚至超越。

根據公司的測試,DeepSeek 的 V3 模型新版本在推理和編碼能力上都有可量化的提升。雖然這些改進聽起來並不算顛覆性,但其進步的速度以及 DeepSeek 的未來計劃使得這次發布具有一定的意義。DeepSeek 成立於去年,從去年 12 月推出的原始 V3 模型開始,迅速發展。隨後在一個月後推出了 R1 模型以支持更全面的研究,現在則是名為 V3-0324 的新版本,該版本定於 2024 年 3 月發布。

這些改進使得該模型的性能接近 OpenAI 的 GPT-4 或 Anthropic 的 Claude 2 模型。然而,根據 DeepSeek 的說法,即使性能未必完全相同,其運行成本卻要便宜得多。這一點在 AI 使用和成本不斷上升的背景下,無疑是一個重要的賣點。訓練 AI 模型的成本向來高昂,而 OpenAI 和 Google 擁有的龐大雲端預算,是許多公司無法輕易達到的,除非與 Microsoft 等公司建立合作關係。如果 DeepSeek 的低成本成果變得更為普遍,這種獨占性將會消失。

美國在 AI 模型領域的主導地位也開始動搖,部分原因在於像 DeepSeek 這樣的中國初創公司。當最熱門的模型來自深圳或杭州時,已不再令人感到驚訝。地緣政治因素以及商業考量也促使部分美國政府官員呼籲禁止 DeepSeek 的發展。

儘管如此,DeepSeek 最新的發布不會立即改變所有人的日程安排。這暗示著,為支持下一代 AI 所需的計算能力和能源需求,可能並不像預期的那麼驚人。這也意味著,負責重寫簡歷或調試網站的 AI 聊天機器人,可能也能流利地使用普通話。

【教學】免費使用 ChatGPT-4 的 6 個方法

【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced

【整理】Google Gemini 語音指令:發 WhatsApp、開 Apps、打電話等等

十斗
十斗https://www.techritual.com/author/tenten/
十斗在知名大學取得了計算機科學與工程學位,並在學術研究方面表現出色。她的研究領域包括人工智能、機器學習和數據科學。一斗為十升,一升為十合,一合為十分之一升。謝靈運言天下才學一石,曹植占八斗,以此讚譽。後用以比喻才學極高。