Модель DeepSeek-V3.2-Exp офіційно випущена та стала з відкритим кодом
ChainCatcher повідомляє, що модель DeepSeek-V3.2-Exp сьогодні офіційно випущена та стала відкритим кодом. Модель впроваджує архітектуру розрідженого Attention, яка дозволяє ефективно знизити споживання обчислювальних ресурсів і підвищити ефективність інференсу моделі. Наразі ця модель вже офіційно доступна на платформі Huawei Cloud MaaS (Model as a Service). Для моделі DeepSeek-V3.2-Exp Huawei Cloud продовжує використовувати велику EP паралельну схему розгортання, базуючись на структурі розрідженого Attention, що дозволяє реалізувати стратегію контекстної паралельності для довгих послідовностей, одночасно забезпечуючи низьку затримку та високу пропускну здатність моделі.
Відмова від відповідальності: зміст цієї статті відображає виключно думку автора і не представляє платформу в будь-якій якості. Ця стаття не повинна бути орієнтиром під час прийняття інвестиційних рішень.
Вас також може зацікавити
RedStone: обсяг RWA досягне 60 мільярдів доларів у 2026 році
4E: BTC: битва китів на День подяки, Solana ETF припинив серію безперервних чистих надходжень
