中國 AI 初創公司 DeepSeek 最近在 Hugging Face 上推出了升級版 AI 模型 V3-0324,該模型在推理和編碼能力上相較於前代產品有顯著提升。DeepSeek 宣稱其 AI 模型可以與美國 AI 開發商如 OpenAI 和 Anthropic 的產品相媲美,甚至超越。
根據公司的測試,DeepSeek 的 V3 模型新版本在推理和編碼能力上都有可量化的提升。雖然這些改進聽起來並不算顛覆性,但其進步的速度以及 DeepSeek 的未來計劃使得這次發布具有一定的意義。DeepSeek 成立於去年,從去年 12 月推出的原始 V3 模型開始,迅速發展。隨後在一個月後推出了 R1 模型以支持更全面的研究,現在則是名為 V3-0324 的新版本,該版本定於 2024 年 3 月發布。
這些改進使得該模型的性能接近 OpenAI 的 GPT-4 或 Anthropic 的 Claude 2 模型。然而,根據 DeepSeek 的說法,即使性能未必完全相同,其運行成本卻要便宜得多。這一點在 AI 使用和成本不斷上升的背景下,無疑是一個重要的賣點。訓練 AI 模型的成本向來高昂,而 OpenAI 和 Google 擁有的龐大雲端預算,是許多公司無法輕易達到的,除非與 Microsoft 等公司建立合作關係。如果 DeepSeek 的低成本成果變得更為普遍,這種獨占性將會消失。
美國在 AI 模型領域的主導地位也開始動搖,部分原因在於像 DeepSeek 這樣的中國初創公司。當最熱門的模型來自深圳或杭州時,已不再令人感到驚訝。地緣政治因素以及商業考量也促使部分美國政府官員呼籲禁止 DeepSeek 的發展。
儘管如此,DeepSeek 最新的發布不會立即改變所有人的日程安排。這暗示著,為支持下一代 AI 所需的計算能力和能源需求,可能並不像預期的那麼驚人。這也意味著,負責重寫簡歷或調試網站的 AI 聊天機器人,可能也能流利地使用普通話。
【說明】4 個方法,讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT
【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced
【整理】Google Gemini 語音指令:發 WhatsApp、開 Apps、打電話等等