來源:CNBC
作者:Arjun Kharpal
中國初創公司 DeepSeek 近日在未正式宣布的情況下,悄然釋出了其升級版人工智慧推理模型。
該公司並未發布正式公告,而是將升級版 DeepSeek R1 模型上傳至 AI 模型平台 Hugging Face。
今年,DeepSeek 憑藉其免費開源的 R1 推理模型迅速崛起,並擊敗了包括 Meta 和 OpenAI 在內的競爭對手。其低開發成本和極短開發周期震驚全球市場,引發外界對美國科技巨頭在基礎設施上的高額支出是否過度的擔憂,也曾導致 Nvidia 等主要美國科技股市值蒸發數十億美元(儘管後來已大致回升)。
如同首度發佈 R1 模型時一樣,此次升級仍低調進行。R1 是一種「推理模型」,意味著它能透過逐步邏輯思考執行更複雜任務。
根據模型評測網站 LiveCodeBench 的資料,升級版 R1 模型在表現上僅次於 OpenAI 的 o4-mini 和 o3 推理模型。
Hugging Face 的 AI 研究員 Adina Yakefu 告訴 CNBC:「DeepSeek 最新升級在推理能力、數學和程式碼表現上更為強勁,正在接近像 Gemini 和 O3 這樣的頂級模型。」
她補充道,該模型在「推理能力和減少幻覺(即 AI 生成錯誤資訊的情況)」方面有重大改進,並表示:「這一版本顯示 DeepSeek 不僅在追趕,而是在直接競爭。」
DeepSeek 已成為中國 AI 發展的代表,顯示儘管美國試圖限制中國獲取晶片與技術,中國仍在持續推進 AI 創新。本月,中國科技巨頭百度和騰訊也表示正在提升其 AI 模型效率,以應對美國的半導體出口管制。
Nvidia 執行長黃仁勳在週三抨擊了美國的出口限制政策。
他表示:「美國的政策建立在中國無法製造 AI 晶片的假設上。這一假設本來就值得懷疑,現在顯然是錯的。」
黃仁勳補充說:「問題不是中國會不會有 AI,而是中國已經有了。」