O modelo DeepSeek-V3.2-Exp foi oficialmente lançado e tornado open source
De acordo com ChainCatcher, o modelo DeepSeek-V3.2-Exp foi oficialmente lançado e tornado open source hoje. O modelo introduz uma arquitetura de Attention esparsa, que pode reduzir efetivamente o consumo de recursos computacionais e aumentar a eficiência de inferência do modelo. Atualmente, o modelo já está disponível na plataforma MaaS (Model as a Service) de grandes modelos da Huawei Cloud. Para o modelo DeepSeek-V3.2-Exp, a Huawei Cloud continua utilizando a solução de paralelismo EP em larga escala, implementando uma estratégia de paralelismo de contexto afinada para sequências longas baseada na estrutura de Attention esparsa, equilibrando tanto a latência quanto o desempenho de throughput do modelo.
Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.
Talvez também goste
USD1 será lançado em breve na rede Aptos
A participação em BTC do ETF de bitcoin à vista da Monochrome na Austrália aumentou para 1.067 unidades.
TOKEN2049 Mesa Redonda: Stablecoins e a transformação trilionária dos pagamentos
Populares
MaisPreços de criptomoedas
Mais








