Alibaba yanada samaraliroq Qwen3-Next sun’iy intellekt modelini taqdim etdi
Jinse Finance xabariga ko‘ra, Alibaba kompaniyasiga qarashli Tongyi Qianwen yangi avlod asosiy model arxitekturasi Qwen3-Next’ni taqdim etdi va ushbu arxitekturaga asoslangan Qwen3-Next-80B-A3B seriyali modelini ochiq manba sifatida chiqardi. Ushbu arxitektura Qwen3’ning MoE model arxitekturasi bilan solishtirganda quyidagi asosiy yaxshilanishlarni amalga oshirdi: aralash e’tibor mexanizmi, yuqori siyraklikdagi MoE tuzilmasi, trening barqarorligini oshiruvchi bir qator optimallashtirishlar hamda inferens samaradorligini oshiruvchi ko‘p tokenli bashorat mexanizmi. Qwen3-Next model arxitekturasiga asoslanib, Alibaba Qwen3-Next-80B-A3B-Base modelini tayyorladi, bu model 80 milliard parametrga ega bo‘lib, faqat 3 milliard parametri faollashtiriladi. Ushbu Base modeli Qwen3-32B zich modeliga yaqin yoki undan biroz yaxshi natijalarga erishgan, lekin uning trening xarajati (GPU soatlari) Qwen3-32B’ning o‘ndan biriga ham yetmaydi, 32k va undan yuqori kontekstda esa inferens tezligi Qwen3-32B’dan o‘n baravar yuqori, bu esa trening va inferensda nihoyatda yuqori samaradorlikni ta’minlaydi.
Mas'uliyatni rad etish: Ushbu maqolaning mazmuni faqat muallifning fikrini aks ettiradi va platformani hech qanday sifatda ifodalamaydi. Ushbu maqola investitsiya qarorlarini qabul qilish uchun ma'lumotnoma sifatida xizmat qilish uchun mo'ljallanmagan.
Sizga ham yoqishi mumkin
Bir manzil zanjirda 57.38 WBTC sotdi, taxminan 6.517 million AQSh dollari qiymatida
Trendda
Ko'proqKripto narxlari
Ko'proq








