تم إصدار نموذج DeepSeek-V3.2-Exp رسميًا وأصبح مفتوح المصدر
أفاد ChainCatcher أنه تم اليوم إطلاق نموذج DeepSeek-V3.2-Exp رسميًا وإتاحته كمصدر مفتوح. أدخل النموذج بنية Attention متفرقة، وهي بنية قادرة على تقليل استهلاك موارد الحوسبة بشكل فعال وتعزيز كفاءة استدلال النموذج. حاليًا، تم إدراج هذا النموذج رسميًا على منصة خدمات النماذج الكبيرة من Huawei Cloud (MaaS). بالنسبة لنموذج DeepSeek-V3.2-Exp، اعتمدت Huawei Cloud مرة أخرى خطة النشر المتوازي الكبيرة (EP)، حيث تم دمج بنية Attention المتفرقة لتحقيق استراتيجية التوازي السياقي المتوافقة مع التسلسلات الطويلة، مع مراعاة كل من زمن استجابة النموذج وأداء الإنتاجية.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
أنفقت Strategy مبلغ 22.1 مليون دولار لشراء 196 وحدة BTC إضافية
اشترت Strategy حوالي 196 بيتكوين بقيمة تقارب 22.1 مليون دولار الأسبوع الماضي.
بولندا تعتمد نسخة جديدة من "قانون سوق الأصول المشفرة"، والمخالفون قد يواجهون غرامة تصل إلى 2.8 مليون دولار.
ستعقد SEC الأمريكية وCFTC أول اجتماع مائدة مستديرة مشترك منذ 14 عامًا
Trending news
المزيدأسعار العملات المشفرة
المزيد








