أكّدت نتائج إختبار Aider Polyglot، وهو اختبار متخصّص في تقييم قدرة النماذج الذكية على كتابة الأكواد البرمجية، تفوّق DeepSeek V3 بشكل كبير على منافسيه.
وتمّ
تدريب DeepSeek V3 على قاعدة بيانات ضخمة تحتوي على تريليونات من الكلمات قد تصل إلى 12.8 تريليون توكن "وحدة تمثيل البيانات النصية"، وهذا ما يقارب من 9.6 مليون
كلمة لكل مليون توكن.
وهذا أتاح له إكتساب فهم عميق للغة البشرية ومعالجتها بكفاءة عالية، لذلك تمكّنت
القاعدة البيانات الضخمة النموذج من التعلّم من مجموعة واسعة من النصوص والموضوعات، مما زاد من تنوع قدراته.
كما يعتمد نموذج DeepSeek V3 الذكي على بنية معقّدة تضم 685 مليار متغيّر، وهو ما يزيد بكثير عن عدد المتغيرات في نماذج أخرى مثل Llama 3.1 من ميتا الذي يحتوي على 405 مليار متغير، وبسبب هذا العدد الكبير من المتغيرات فإن DeepSeek V3 يمنح قدرة أكبر على التعلم والاستدلال.
مميزات DeepSeek V3
تمكن DeepSeek V3 من تحقيق نتائج مبهرة في مجموعة واسعة من المهام، بما في ذلك:
كتابة الأكواد البرمجية: أظهر النموذج قدرة استثنائية على كتابة أكواد برمجية عالية الجودة وكفاءة، متفوقاً على نماذج أخرى رائدة مثل GPT-4 من OpenAI.
إنشاء النصوص: يمكن لـ DeepSeek V3 توليد نصوص إبداعية وم informative بأشكال مختلفة، مثل المقالات والقصص والشعر.
الترجمة الفورية: كما يتميز النموذج بقدرته على ترجمة النصوص بدقة وسرعة بين اللغات المختلفة.
عيوب استخدام نموذج DeepSeek V3 الذكي
رغم التقدم التقني الذي حققه DeepSeek V3، إلا أنه يواجه بعض الانتقادات بسبب وجود قيود على إجاباته، فإن النظام يرفض الإجابة على أسئلة حساسة مثل أحداث ميدان تيانانمين، وهو ما يعكس الرقابة الحكومية الصارمة على محتوى الإنترنت في
الصين.
تبرر شركة DeepSeek هذه القيود بأنها تتبع توجيهات الحكومة الصينية، والتي تشدد على ضرورة أن تخضع جميع النماذج الذكية للاختبار والموافقة من قبل الجهات الحكومية المختصة، وتؤكد الشركة أن هذه الإجراءات تهدف إلى ضمان استخدام التكنولوجيا الذكية بشكل آمن ومسؤول.
في حين أظهرت اختبارات حديثة على النموذج اللغوي الكبير DeepSeek V3 مشكلة غريبة تتمثل في خلط النموذج بين هويته وهوية نماذج أخرى، فقد لاحظ العديد من المستخدمين أن النموذج يجيب أحيانًا على الأسئلة باعتباره ChatGPT، وهو أحد أشهر نماذج الذكاء الاصطناعي، بل ويعرض تفاصيل حول
واجهة برمجة التطبيقات الخاصة بـ ChatGPT.
يعود سبب هذه المشكلة إلى أن نموذج DeepSeek V3 الذكي تم تدريبه على كم هائل من البيانات المتاحة على الإنترنت، والتي تتضمن معلومات عن العديد من النماذج اللغوية الكبيرة، بما في ذلك ChatGPT، وبالتالي، أصبح النموذج يخلط بين المعلومات التي تعلمها، مما يؤدي إلى ظهور مثل هذه الأخطاء.
كما تعتمد معظم النماذج اللغوية الكبيرة على البيانات المفتوحة المصدر المتاحة على الإنترنت، والتي قد تحتوي على معلومات غير دقيقة أو متناقضة، وهذا يزيد من صعوبة ضمان دقة وسلامة النتائج التي يقدمها النموذج.
لا يقتصر هذا النوع من المشاكل على DeepSeek V3 فقط، بل واجهته نماذج أخرى مثل Gemini من Google، والذي خلط في بعض الأحيان بين هويته وهوية نموذج Wenxinyiyan الخاص بشركة بايدو، وهذا يؤكد أن مشكلة الخلط بين الهويات هي تحدٍ شائع يواجه مطوري النماذج اللغوية الكبيرة.