輝達 (NVDA.US) 中國媒體《字母榜》報導,當眾多大模型玩家在模型更新和產品體驗上激烈角逐時,曾憑藉 R1 模型爆紅的 DeepSeek 卻逐漸陷入困境。今年一月開始的爆發式成長僅維持 2 個月,自四月起每月活躍用戶數開始下滑。
QuestMobile 數據顯示,截至五月,每月活躍用戶規模為 1.69 億,季減 5.1%,下載量排名也大降,從曾在中美兩地蘋果 App Store 免費應用程式下載榜奪冠,到下跌至 30 名之後。
SemiAnalysis 報告也顯示,DeepSeek 用戶使用率從年初 7.5% 的高點降至 5 月底的 3%,官網訪問量同期下降 29%。
梁文鋒並非毫無準備,早在 2 月《路透社》就爆料 DeepSeek 內部正加速推出 R2 模型,原本打算 5 月初發布,但官方希望儘早推出,但直到 7 月中旬,R2 模型仍未見蹤影。
《The Information》報導指出,輝達 (NVDA.US) H20 晶片意外禁售導致算力儲備緊缺是一大原因,梁文鋒擔心新模型上線後因調用量過高影響體驗。
今年初 R1 模型爆火帶旺 H20 晶片在中國市場的需求,但美國 4 月實施新出口管制措施後,所幸今 (15) 日輝達公告指出,正提交重新銷售 H20 晶片的申請,美國政府保證授予許可證,輝達將盡快啟動交付程序,這對梁文鋒來說猶如一場及時雨。
中國國內其他大模型玩家都在努力提升模型效能和性價比,百度創辦人李彥宏吐槽 DeepSeek 除無多模態外,使用還慢又貴,市面上多數大模型 API 調用價格更低、速度更快。
「AI 六小龍」也紛紛推出新款挑戰 DeepSeek,本月初新上線的 Kimi K2 開源模型,總參數量達 1 兆,在多項基準效能測試中反超 DeepSeek 擅長的程式碼、數學推理任務,價格也與 DeepSeek 標準時段對齊。
此外,今年 6 月中旬更新的 MiniMax-M1 模型號稱全球首個開源大規模混合架構推理模型,強化學習成本低。
儘管 DeepSeek 官方應用程式和官網流量下跌,但第三方平台託管的 R1 與 V3 使用量自發布以來成長近 20 倍。
對此 SemiAnalysis 認為,這敗在了 Token 經濟學上,DeepSeek 為控製成本嚴格控制上下文窗口在 64K,而 Kimi K2 支持最長 128K 上下文,MiniMax - M1 則支持業內最高的 100 萬上下文輸入。
專家指出,梁文鋒追求模型開源和實現 AGI,但為維持開發者群體活躍和產品用戶使用率,必須盡快推出新模型 V4 和 R2,像是 OpenAI 執行長奧特曼便以高頻更新讓 OpenAI 保持熱度。此外,DeepSeek 暫不支援多模態功能,在呼叫工具建構 Agent 方面能力有著明顯弱點。若不改進,可能會將更多模型呼叫需求推向對手。
在通用 Agent 大爆發的當下,梁文鋒能否藉助 R1 開啟的深度思考浪潮,在 Agent 時代創造新驚喜,值得期待。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網