DeepSeek-V3.2-Exp模型正式發布並開源

DeepSeek-V3.2-Exp模型正式發布並開源

ChaincatcherChaincatcher2025/09/29 10:17
顯示原文

ChainCatcher 消息,DeepSeek-V3.2-Exp 模型今日正式發布並開源。該模型引入稀疏 Attention 架構,此架構能有效降低計算資源消耗並提升模型推理效率。目前,該模型已正式上架華為雲大模型即服務平台 MaaS,針對 DeepSeek-V3.2-Exp 模型,華為雲此次仍沿用大 EP 並行方案部署,基於稀疏 Attention 結構疊加實現長序列親和的上下文並行策略,並兼顧模型時延和吞吐性能。

0

免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與