DeepSeek-V3.2-Exp模型正式发布并开源,模型引入稀疏Attention架构。华为云表示已第一时间完成对DeepSeek-V3.2-Exp模型的适配工作。基於稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能,最大可支持160K长序列上下文长度。目前该模型已正式上架华为云大模型即服务平台MaaS,为企业及开发者提供模型体验和API服务。(ta/w)