تحديث DeepSeek V3 يقود نموذجًا جديدًا للذكاء الاصطناعي الخوارزمية تساعد في تطوير Web3

robot
إنشاء الملخص قيد التقدم

تحديث DeepSeek V3 يقود نموذجًا جديدًا في الذكاء الاصطناعي

في الليلة الماضية، أصدرت DeepSeek تحديث النسخة V3 على منصة معينة - DeepSeek-V3-0324، حيث وصلت معلمات النموذج إلى 6850 مليار، مع تحسينات ملحوظة في قدرات البرمجة وتصميم واجهة المستخدم وقدرات الاستدلال.

في مؤتمر GTC 2025 الذي أقيم مؤخرًا، أشاد الرئيس التنفيذي لشركة تكنولوجيا معينة بـ DeepSeek. وأكد أن السوق كان يعتقد سابقًا أن النموذج الفعال لـ DeepSeek سيقلل من الفهم لطلب الشرائح، وهو أمر خاطئ، وأن احتياجات الحوسبة المستقبلية ستزداد فقط، وليس تنقص.

تعتبر DeepSeek كمنتج يمثل اختراقًا في الخوارزميات، والعلاقة بينه وبين توفير الرقائق تستحق المناقشة. دعونا نبدأ بتحليل أهمية قوة الحوسبة والخوارزميات في تطوير صناعة الذكاء الاصطناعي.

من مسابقة القدرة الحاسوبية إلى الابتكار الخوارزمي: النموذج الجديد للذكاء الاصطناعي الذي تقوده DeepSeek

التعايش والتطور المشترك للقوة الحاسوبية والخوارزميات

في مجال الذكاء الاصطناعي، أدت زيادة قوة الحوسبة إلى توفير أساس لتشغيل خوارزميات أكثر تعقيدًا، مما يسمح للنماذج بمعالجة كميات أكبر من البيانات، وتعلم أنماط أكثر تعقيدًا؛ بينما تعمل تحسينات الخوارزميات على استخدام قوة الحوسبة بشكل أكثر كفاءة، مما يعزز فعالية استخدام موارد الحوسبة.

العلاقة التعايشية بين القوة الحاسوبية والخوارزميات تعيد تشكيل مشهد صناعة الذكاء الاصطناعي:

  1. تباين المسارات التقنية: تسعى بعض الشركات لبناء تجمعات حسابية ضخمة، بينما تركز أخرى على تحسين كفاءة الخوارزميات، مما يؤدي إلى تشكيل مدارس تقنية مختلفة.

  2. إعادة بناء سلسلة الصناعة: أصبحت شركة شرائح معينة رائدة في قوة الذكاء الاصطناعي من خلال نظامها البيئي، بينما خفض مزودو الخدمة السحابية من عتبة النشر من خلال خدمات القوة الحسابية المرنة.

  3. تعديل تخصيص الموارد: تسعى الشركات إلى تحقيق التوازن بين الاستثمار في البنية التحتية للأجهزة وتطوير الخوارزميات الفعالة.

  4. ظهور مجتمع المصادر المفتوحة: نماذج المصادر المفتوحة مثل DeepSeek و LLaMA تتيح مشاركة ابتكارات الخوارزميات ونتائج تحسين قوة الحوسبة، مما يسرع من تكرار التقنية وانتشارها.

الابتكار التكنولوجي لـ DeepSeek

نجاح DeepSeek مرتبط ارتباطًا وثيقًا بالابتكار التكنولوجي الخاص بها. فيما يلي شرح موجز لنقاط الابتكار الرئيسية لديها:

تحسين هيكل النموذج

تستخدم DeepSeek بنية تجمع بين Transformer و MOE (Mixture of Experts) ، وتقدم آلية انتباه خفية متعددة الرؤوس (Multi-Head Latent Attention, MLA). هذه البنية تشبه فريق خبراء فعال ، قادر على استدعاء الخبراء الأكثر ملاءمة وفقاً لمهام مختلفة ، مما يزيد بشكل كبير من كفاءة النموذج ودقته.

طرق التدريب المبتكرة

قدمت DeepSeek إطار عمل للتدريب بدقة مختلطة FP8. يمكن لهذا الإطار اختيار دقة الحساب المناسبة ديناميكيًا بناءً على احتياجات مراحل التدريب المختلفة، مما يزيد من سرعة التدريب ويقلل من استخدام الذاكرة مع ضمان دقة النموذج.

تحسين كفاءة الاستدلال

في مرحلة الاستدلال، قدمت DeepSeek تقنية التنبؤ متعدد الرموز (Multi-token Prediction, MTP). تتيح هذه التقنية التنبؤ بعدة رموز في وقت واحد، مما يعزز من سرعة الاستدلال بشكل كبير، وفي نفس الوقت يقلل من تكلفة الاستدلال.

خوارزمية التعلم المعزز突破

لقد حسّن خوارزمية التعلم المعزز الجديدة GRPO (تحسين مكافأة العقوبة العامة) من DeepSeek عملية تدريب النموذج. تعمل هذه الخوارزمية على تحسين أداء النموذج مع تقليل الحسابات غير الضرورية، مما يحقق التوازن بين الأداء والتكلفة.

تشكلت هذه الابتكارات في نظام تقني متكامل، مما قلل بشكل شامل من متطلبات قوة الحوسبة من التدريب إلى الاستدلال. الآن، يمكن لبطاقات الرسوميات الاستهلاكية العادية تشغيل نماذج الذكاء الاصطناعي القوية، مما خفض بشكل كبير من عتبة تطبيقات الذكاء الاصطناعي، مما يتيح لمزيد من المطورين والشركات المشاركة في الابتكار في مجال الذكاء الاصطناعي.

تأثير على موردي الشرائح

هناك وجهات نظر تقول إن DeepSeek قد تجاوزت طبقة البرمجيات لشركة رقائق معينة، وبالتالي تخلصت من اعتمادها عليها. في الواقع، تقوم DeepSeek بتحسين الخوارزميات مباشرة من خلال مجموعة التعليمات الأساسية الخاصة بتلك الشركة. من خلال العمل على هذا المستوى، يمكن لـ DeepSeek تحقيق تحسينات دقيقة في الأداء.

إن تأثير ذلك على موردي الشرائح ذو وجهين. من ناحية، أصبح DeepSeek مرتبطاً بشكل أعمق بأجهزته ونظامه البيئي، وقد يؤدي انخفاض عتبة تطبيقات الذكاء الاصطناعي إلى توسيع حجم السوق الكلي؛ ومن ناحية أخرى، قد تؤدي تحسينات خوارزميات DeepSeek إلى تغيير هيكل الطلب في السوق على الشرائح عالية الأداء، حيث يمكن لبعض نماذج الذكاء الاصطناعي التي كانت تتطلب بطاقات GPU عالية الأداء أن تعمل بكفاءة الآن على بطاقات الرسوميات المتوسطة أو حتى الاستهلاكية.

أهمية صناعة الذكاء الاصطناعي في الصين

أدت تحسينات خوارزمية DeepSeek إلى توفير مسار اختراق تقني لصناعة الذكاء الاصطناعي في الصين. في ظل القيود المفروضة على الرقائق المتقدمة، خفف مفهوم "البرمجيات تعوض عن الأجهزة" الاعتماد على الرقائق المستوردة المتطورة.

في المنبع، خفضت الخوارزميات الفعالة الضغط على متطلبات قوة الحوسبة، مما سمح لمقدمي خدمات الحوسبة بتمديد فترة استخدام الأجهزة من خلال تحسين البرمجيات وزيادة عائد الاستثمار. في المصب، خفضت النماذج المفتوحة المصدر المحسنة من عتبة تطوير تطبيقات الذكاء الاصطناعي. العديد من الشركات الصغيرة والمتوسطة لا تحتاج إلى موارد حوسبة كبيرة، ويمكنها أيضاً تطوير تطبيقات تنافسية بناءً على نموذج DeepSeek، مما سيؤدي إلى ظهور المزيد من حلول الذكاء الاصطناعي في المجالات الرأسية.

التأثير العميق لـ Web3 + AI

بنية تحتية للذكاء الاصطناعي اللامركزي

تقدم تحسينات خوارزمية DeepSeek طاقة جديدة للبنية التحتية للذكاء الاصطناعي في Web3. تجعل البنية المبتكرة والخوارزميات الفعالة ومتطلبات الطاقة المنخفضة استنتاج الذكاء الاصطناعي اللامركزي ممكنًا. تعتبر بنية MoE مناسبة بشكل طبيعي للنشر الموزع، حيث يمكن أن تمتلك العقد المختلفة شبكات خبراء مختلفة، دون الحاجة إلى تخزين النموذج الكامل في عقدة واحدة، مما يقلل بشكل كبير من متطلبات التخزين والحساب في العقدة الواحدة، وبالتالي يزيد من مرونة وكفاءة النموذج.

إطار تدريب FP8 يقلل من الحاجة إلى موارد حسابية متطورة، مما يسمح بإضافة المزيد من الموارد الحاسوبية إلى شبكة العقد. هذا لا يقلل فقط من عتبة المشاركة في حسابات الذكاء الاصطناعي اللامركزية، ولكنه يعزز أيضًا القدرة والكفاءة الحسابية للشبكة بأكملها.

أنظمة متعددة الوكلاء

  1. تحسين استراتيجيات التداول الذكية: من خلال تحليل بيانات السوق في الوقت الفعلي، وتوقع تقلبات الأسعار على المدى القصير، وتنفيذ التداولات على السلسلة، ومراقبة نتائج التداول، تساعد العمليات التعاونية للعديد من العوامل الذكية المستخدمين على تحقيق عوائد أعلى.

  2. التنفيذ التلقائي للعقود الذكية: يعمل العديد من الوكلاء بشكل متعاون لمراقبة العقود الذكية وتنفيذها وإشراف النتائج، مما يحقق أتمتة منطق الأعمال الأكثر تعقيدًا.

  3. إدارة المحفظة الاستثمارية الشخصية: تساعد الذكاء الاصطناعي المستخدمين في العثور على أفضل فرص الرهان أو توفير السيولة في الوقت الحقيقي بناءً على تفضيلات المخاطر والأهداف الاستثمارية والوضع المالي للمستخدم.

تسعى DeepSeek، تحت قيود القدرة الحاسوبية، إلى إيجاد اختراقات من خلال الابتكار في الخوارزميات، مما يفتح مساراً تطويرياً متميزاً لصناعة الذكاء الاصطناعي في الصين. يتم تقليل عتبة التطبيق، ودفع الاندماج بين Web3 والذكاء الاصطناعي، وتقليل الاعتماد على الشرائح عالية الأداء، وتمكين الابتكار المالي، وهذه التأثيرات تعيد تشكيل مشهد الاقتصاد الرقمي. لم يعد تطوير الذكاء الاصطناعي مستندًا فقط إلى سباق القدرة الحاسوبية، بل أصبح سباقًا للتعاون الأمثل بين القدرة الحاسوبية والخوارزميات. في هذه المسابقة الجديدة، يقوم مبتكرون مثل DeepSeek بإعادة تعريف قواعد اللعبة باستخدام الحكمة الصينية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • مشاركة
تعليق
0/400
MeaninglessGweivip
· 07-16 21:46
مرة أخرى في موجة ai
شاهد النسخة الأصليةرد0
SleepyArbCatvip
· 07-16 21:44
نم نوما جيدا أولا، على أي حال فإن الذكاء الاصطناعي ليس في عجلة من أمره لارتفع...zzzz
شاهد النسخة الأصليةرد0
Hash_Banditvip
· 07-16 21:44
التجزئة التعدين بأقصى صعوبة... بصراحة، هذا الإصدار 3 يبدو كترقية لـ asic حقًا
شاهد النسخة الأصليةرد0
BearMarketBarbervip
· 07-16 21:32
قوة الحوسبة التصفية القسرية 下一个
شاهد النسخة الأصليةرد0
RugpullAlertOfficervip
· 07-16 21:29
رائع归 رائع敢不敢全开源
شاهد النسخة الأصليةرد0
LayerHoppervip
· 07-16 21:28
لقد حان الوقت لشراء بطاقة رسومات جديدة مرة أخرى
شاهد النسخة الأصليةرد0
ContractExplorervip
· 07-16 21:28
لا بد من الاستمرار في التدوير
شاهد النسخة الأصليةرد0
  • تثبيت