وكالات:
◾ DeepSeek تطلق نموذجًا ضخمًا بـ 671 مليار معامل وكفاءة معالجة عالية
◾ النموذج يتفوق على المنافسين مفتوحي المصدر ويقترب من أداء النماذج المغلقة
◾ تكلفة تدريب منخفضة نسبيًا بلغت 5.57 مليون دولار مقارنة بمئات الملايين للنماذج المنافسة
أعلنت شركة DeepSeek الصينية الناشئة عن إطلاق نموذج الذكاء الاصطناعي الجديد DeepSeek-V3، المتاح عبر منصة Hugging Face. يستخدم النموذج هندسة “مزيج الخبراء” التي تُفعّل معاملات محددة فقط من أصل 671 مليار معامل، مما يضمن معالجة المهام بدقة وكفاءة.
المميزات التقنية الرئيسية:
تدرب النموذج على 14.8 تريليون رمز متنوعة عالية الجودة، مع استخدام تحسينات برمجية وأجهزة متطورة خفضت تكلفة التدريب إلى 5.57 مليون دولار، مقارنة بـ 500 مليون دولار لتدريب نموذج Llama-3.1.
الأداء والمقارنات:
النموذج متاح حاليًا عبر:
يمثل هذا التطور خطوة مهمة في تقليص الفجوة بين النماذج مفتوحة ومغلقة المصدر، مما يوفر خيارات متعددة للشركات ويمنع احتكار تقنيات الذكاء الاصطناعي.
المصدر: عالم التقنية