桌面版
最近搜看股票
報價
即時報價
市場
新聞
指數
返回
放大 +
縮小 -
DeepSeek新模型MODEL1曝光
推薦
2
利好
5
利淡
3
AASTOCKS新聞
據內媒報道,DeepSeek-R1發布一周年之際,新模型「MODEL1」曝光。DeepSeek在GitHub更新FlashMLA代碼,橫跨114個文件中有28處提到「MODEL1」,與V32作為不同的模型出現。
報道指,V32是DeepSeek-V3.2,「MODEL很可能是新架構。代碼中的具體差異體現在KV緩存佈局、稀疏性處理和FP8解碼方面,在內存優化上有多處不同。
相關內容
中國12月工業生產按年增長5.2%,高於先前的4.8%。預測為5%。
早前有消息稱,DeepSeek將在2月中春節前後發布下一代旗艦模型。(ta/w)
AASTOCKS新聞
已將連結複製到剪貼簿