<匯港通訊> 小米集團(01810)表示,於6月8日晚上正式推出 Xiaomi MiMo-V2.5-Pro-UltraSpeed 模式,成為全球首個在通用 GPU 上推理速度突破 1000 tokens/s 的萬億參數模型,刷新旗艦模型全球推理最快速度。
由即日起至6月23日,MiMo-V2-Pro-UltraSpeed 模式將以申請制形式限時開放,通過申請的用戶可透過 API 體驗該服務。MiMo-V2.5-Pro-UltraSpeed API 亦同步上線,採用限時體驗價,定價為 MiMo-V2.5-Pro 的 3 倍,同時提供約 10 倍的輸出速度提升;目前僅支援 API 體驗,不支援 Token Plan。
MiMo-V2.5-Pro-UltraSpeed 透過對模型推理系統進行全鏈路工程優化,在不降低模型能力的前提下,首次將推理速度提升至1000 tokens/s,並無需訂製晶片,只需使用通用 GPU 即可實現。這項突破不但打破業界長期以來「快、強、通用 GPU 無法兼得」的限制,亦顯示小米 MiMo 大模型在推理工程能力方面已躋身全球第一梯隊。
Xiaomi MiMo-V2.5-Pro-UltraSpeed 的推出,標誌着旗艦大模型正式邁向更高推理效率階段,亦為未來更廣泛的即時應用場景提供更多可能。
隨着 MiMo-V2.5-Pro-UltraSpeed 將推理速度提升至 1000 tokens/s,萬億參數大模型已具備接近即時完成複雜任務的能力,智能編程、Agent 協同及高頻量化交易等場景的應用門檻亦正逐步降低。
接連完成三項重要技術突破 小米 AI 進展遠超預期。
自4月底以來,小米 AI 於模型能力、推理成本及推理效率三個維度接連取得突破:4月23日,MiMo-V2.5-Pro 在全球權威大模型測評平台 Artificial Analysis 上,獲得綜合智能指數與 Agent 指數全球開源模型並列第一;5月27日,Xiaomi MiMo-V2.5 系列模型 API 因技術優化宣布最高降價 99%,並同步調整 Token Plan 計費體系。6月8日,MiMo-V2.5-Pro-UltraSpeed 以 1000 tokens/s 創下萬億參數旗艦模型推理速度新紀錄。
#AI (SY)
新聞來源 (不包括新聞圖片): 滙港資訊