اللامركزية AI تدريب في الطليعة: Prime Intellect و Pluralis يستكشفان شبكة التعاون القابلة للتحقق

الكأس المقدسة للذكاء الاصطناعي في العملات الرقمية: استكشاف الحدود في التدريب اللامركزي

في سلسلة القيمة الكاملة للذكاء الاصطناعي، يعد تدريب النموذج هو المرحلة الأكثر استهلاكًا للموارد والأعلى من حيث عتبة التكنولوجيا، حيث يحدد مباشرة الحد الأقصى لقدرات النموذج وفعالية تطبيقاته الفعلية. مقارنةً بمرحلة الاستدلال التي تتطلب استدعاء خفيف الوزن، يتطلب تدريب النموذج استثمارًا مستمرًا في قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعله "الصناعة الثقيلة" الحقيقية لبناء أنظمة الذكاء الاصطناعي. من حيث نماذج الهيكلية، يمكن تقسيم أساليب التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي سيتم مناقشته بشكل رئيسي في هذه المقالة.

تعتبر التدريب المركزية هي الطريقة التقليدية الأكثر شيوعًا، حيث يتم تنفيذ جميع عمليات التدريب بواسطة مؤسسة واحدة في مجموعة محلية عالية الأداء، من الأجهزة، والبرامج الأساسية، ونظام جدولة المجموعات، إلى جميع مكونات إطار التدريب التي يتم تنسيق تشغيلها بواسطة نظام تحكم موحد. تسمح هذه البنية التحتية المتكاملة بمشاركة الذاكرة، وتزامن التدرجات، وآلية التحمل، مما يؤدي إلى تحقيق أقصى كفاءة، مما يجعلها مناسبة لتدريب نماذج كبيرة مثل GPT وGemini، حيث تتمتع بمزايا الكفاءة العالية وقابلية التحكم في الموارد، ولكنها تواجه أيضًا مشاكل مثل احتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقاط المفردة.

يعتبر التدريب الموزع الطريقة السائدة الحالية لتدريب النماذج الكبيرة، حيث يتمثل جوهره في تقسيم مهمة تدريب النموذج ثم توزيعها على عدة آلات لتنفيذها بشكل متعاون، وذلك لتجاوز قيود الحساب والتخزين على جهاز واحد. على الرغم من وجود خصائص "اللامركزية" من الناحية الفيزيائية، إلا أن التحكم والتنسيق والتزامن لا يزال يتم بواسطة هيئة مركزية، وغالبًا ما يعمل في بيئة شبكة محلية سريعة، من خلال تقنية NVLink للنقل السريع، يتم تنسيق المهام الفرعية بشكل موحد بواسطة العقدة الرئيسية. تشمل الطرق السائدة:

  • التوازي البياني: كل عقدة تدرب معلمات بيانات مختلفة مع مشاركة المعلمات، يجب مطابقة أوزان النموذج
  • التوازي النموذجي: نشر أجزاء مختلفة من النموذج على عقد مختلفة لتحقيق قابلية التوسع العالية
  • توازي الأنابيب: تنفيذ متسلسل على مراحل، وزيادة معدل النقل
  • توازي المصفوفات: تقسيم دقيق لحساب المصفوفة، وزيادة دقة التوازي

التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، مقارنةً بمدير واحد يقوم بتوجيه عدد من موظفي "المكاتب" عن بُعد للتعاون في إنجاز المهام. حاليًا، يتم تدريب جميع النماذج الكبيرة الرئيسية تقريبًا بهذه الطريقة.

كأس قداسة Crypto AI: استكشاف الحدود للتدريب اللامركزي

اللامركزية التدريبية تمثل مسارًا مستقبليًا أكثر انفتاحًا ومقاومة للرقابة. تتمثل ميزتها الأساسية في: عدة عقد غير موثوقة ( قد تكون أجهزة كمبيوتر منزلية، أو وحدات معالجة الرسوميات السحابية، أو أجهزة حافة ) تتعاون لإنجاز مهام التدريب دون وجود منسق مركزي، عادةً من خلال بروتوكولات تحرك توزيع المهام والتعاون، وتستخدم آلية تحفيز تشفير لضمان نزاهة المساهمات. التحديات الرئيسية التي تواجه هذا النموذج تشمل:

  • صعوبة تنسيق الأجهزة المتغايرة وتقسيم المهام: صعوبة تنسيق الأجهزة المتغايرة وكفاءة منخفضة في تقسيم المهام
  • عائق كفاءة الاتصال: الاتصال الشبكي غير مستقر، وعائق مزامنة التدرج واضح
  • نقص التنفيذ الموثوق: عدم وجود بيئة تنفيذ موثوقة، مما يجعل من الصعب التحقق مما إذا كانت العقدة تشارك حقًا في الحساب
  • نقص التنسيق الموحد: لا يوجد جهاز تحكم مركزي، توزيع المهام، وآلية التراجع عن الأخطاء معقدة

يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين من جميع أنحاء العالم، يساهمون كل منهم بقوة الحوسبة لتدريب النموذج بشكل متعاون، لكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال يمثل تحديًا هندسيًا منهجيًا، يتضمن بنية النظام، بروتوكولات الاتصال، أمان التشفير، آليات الاقتصاد، والتحقق من النموذج، وغيرها من المستويات، لكن ما إذا كان يمكن "التعاون بشكل فعال + تحفيز الصدق + نتائج صحيحة" لا يزال في مرحلة استكشاف النماذج الأولية المبكرة.

التعلم الفيدرالي كحلقة انتقالية بين التوزيع واللامركزية، يركز على الاحتفاظ بالبيانات محليًا، وتجمع معلمات النموذج مركزيًا، ويُناسب السيناريوهات التي تركز على الامتثال للخصوصية ( مثل الرعاية الصحية والمالية ). يتمتع التعلم الفيدرالي بهيكل هندسي للتدريب الموزع وقدرة على التعاون المحلي، بينما يمتلك أيضًا ميزة توزيع البيانات للتدريب اللامركزي، ولكنه لا يزال يعتمد على طرف موثوق للتنسيق، ولا يتمتع بخصائص مفتوحة تمامًا ومضادة للرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في سيناريوهات الامتثال للخصوصية، حيث يكون في مهام التدريب، هيكل الثقة وآلية الاتصال أكثر اعتدالًا، مما يجعله مناسبًا ليكون كهيكل نشر انتقالي في الصناعة.

كأس المقدس للذكاء الاصطناعي للعملات المشفرة: استكشاف الحدود في التدريب اللامركزي

اللامركزية تدريب الحدود، الفرص والطرق الواقعية

من منظور نمط التدريب، فإن التدريب اللامركزي لا يناسب جميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، وارتفاع متطلبات الموارد، أو صعوبة التعاون، فإنه بطبيعته غير مناسب لإنجاز المهام بكفاءة بين العقد غير المتجانسة وبدون ثقة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالبًا على ذاكرة وصول عشوائي عالية، وزمن استجابة منخفض، وعرض نطاق ترددي عالي، مما يجعل من الصعب تقسيمها ومزامنتها بفعالية في الشبكات المفتوحة؛ كما أن المهام التي تتطلب خصوصية البيانات وقيود السيادة تكون مقيدة بالقوانين والامتثال والأخلاقيات، مما يمنع المشاركة المفتوحة؛ بينما تفتقر المهام التي لا تحفز التعاون إلى دوافع المشاركة الخارجية. تشكل هذه الحدود معًا القيود الحقيقية للتدريب اللامركزي الحالي.

لكن هذا لا يعني أن التدريب اللامركزي هو فكرة زائفة. في الواقع، تظهر التطبيقات الواضحة للتدريب اللامركزي في أنواع المهام الخفيفة الهيكل والمتوازية وسهلة التحفيز. بما في ذلك على سبيل المثال لا الحصر: ضبط LoRA، مهام ما بعد التدريب المتعلقة بمحاذاة السلوك مثل RLHF، DPO(، تدريب وتسمية البيانات المتجمع، تدريب نماذج أساسية صغيرة قابلة للتحكم في الموارد، وسيناريوهات التدريب التعاوني التي تشارك فيها أجهزة الحافة. هذه المهام عمومًا تتمتع بخصائص عالية من التوازي، وانخفاض الترابط، وقابلية تحمل القدرة الحسابية غير المتجانسة، مما يجعلها مناسبة جدًا للتدريب التعاوني عبر شبكات P2P، وبروتوكولات Swarm، والمحسنات الموزعة.

![كأس القدر للعملات الرقمية: استكشاف الحدود للتدريب اللامركزي])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(

تحليل المشاريع الكلاسيكية لتدريب اللامركزية

في الوقت الحالي، تشمل المشاريع الرائدة في مجال التدريب اللامركزي والتعلم الفيدرالي، مشاريع بلوكتشين الممثلة مثل Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai الكثير من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في الأبحاث النظرية الحالية؛ بينما مسارات التنفيذ لـ Gensyn وFlock.io واضحة نسبياً، ويمكن رؤية التقدم الهندسي الأولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية والهندسة المعمارية وراء هذه المشاريع الخمسة بشكل متسلسل، وستستكشف المزيد من الفروقات والعلاقات التكاملية في نظام تدريب الذكاء الاصطناعي اللامركزي.

) Prime Intellect: رائد شبكة التعلم المعزز التعاوني القابل للتحقق من مسارات التدريب

تسعى Prime Intellect إلى بناء شبكة تدريب ذكاء اصطناعي لا تتطلب الثقة، بحيث يمكن لأي شخص المشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect من خلال ثلاثة وحدات PRIME-RL و TOPLOC و SHARDCAST، في إنشاء نظام تدريب ذكاء اصطناعي اللامركزية يتمتع بالتحقق والانفتاح وآلية تحفيز كاملة.

01، هيكل بروتوكول Prime Intellect وقيمة الوحدات الرئيسية

![كأس القدر للذكاء الاصطناعي: استكشاف الحدود في التدريب اللامركزي]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(

)# 02، شرح آلية التدريب الرئيسية لـ Prime Intellect

PRIME-RL: هيكل مهمة التعلم المعزز غير المتزامن المنفصل

PRIME-RL هو إطار نمذجة وتنفيذ المهام المصمم خصيصًا من قبل Prime Intellect لمشاهد التدريب اللامركزية، مصمم خصيصًا للشبكات غير المتجانسة والمشاركة غير المتزامنة. إنه يعتمد على التعلم المعزز ككائن أولوي للتكيف، ويفصل هيكليًا عمليات التدريب والاستدلال وتحميل الأوزان، مما يسمح لكل عقدة تدريب بإكمال دورة المهام بشكل مستقل محليًا، والتعاون من خلال واجهات معيارية وآليات التحقق والتجميع. بالمقارنة مع عمليات التعلم تحت الإشراف التقليدية، فإن PRIME-RL أكثر ملاءمة لتحقيق التدريب المرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام، ويضع الأساس لدعم المهام المتعددة بالتوازي وتطور الاستراتيجيات.

TOPLOC: آلية تحقق سلوك التدريب الخفيف الوزن

TOPLOC هو آلية جوهرية للتحقق من التدريب اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان عقدة معينة قد أكملت فعلاً تعلم سياسة فعالة بناءً على بيانات الملاحظة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب النموذج بالكامل، بل يكمل التحقق الهيكلي الخفيف من خلال تحليل "تسلسل الملاحظة ↔ تحديث السياسة" بين المسارات المحلية المتسقة. لأول مرة، يحول هذا آثارية السلوك خلال عملية التدريب إلى كائنات يمكن التحقق منها، وهو الابتكار الرئيسي لتحقيق توزيع المكافآت على التدريب بدون ثقة، مما يوفر مسارًا قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.

SHARDCAST: بروتوكول تجميع ونشر الوزن غير المتزامن

SHARDCAST هو بروتوكول نشر وتجمع أوزان مصمم من قبل Prime Intellect، تم تحسينه خصيصًا لبيئات الشبكة الحقيقية التي تتسم باللامركزية، وقيود النطاق الترددي، وتغير حالات العقد. يجمع بين آلية نشر gossip واستراتيجيات التزامن المحلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية باستمرار في حالات غير متزامنة، مما يحقق التقارب التدريجي للأوزان وتطورات متعددة النسخ. بالمقارنة مع طرق AllReduce المركزية أو المتزامنة، فإن SHARDCAST يعزز بشكل ملحوظ قابلية التوسع وقدرة التحمل للتدريب اللامركزي، مما يجعله الأساس الرئيسي لبناء توافق وزن مستقر وتكرار تدريب مستمر.

OpenDiLoCo: إطار الاتصال غير المتزامن المتناثر

OpenDiLoCo هو إطار تحسين الاتصالات الذي تم تنفيذه بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect بناءً على مفهوم DiLoCo الذي اقترحته DeepMind، تم تصميمه خصيصًا للتحديات الشائعة في التدريب اللامركزي مثل قيود النطاق الترددي، وتنوع الأجهزة، وعدم استقرار العقد. يتم بناء هيكله على أساس توازي البيانات، من خلال إنشاء هياكل طوبولوجية نادرة مثل Ring وExpander وSmall-World، مما يتجنب تكاليف الاتصال العالية الناتجة عن التزامن العالمي، حيث يمكن إكمال تدريب النموذج التعاوني بالاعتماد فقط على العقد المجاورة المحلية. بالجمع بين التحديث غير المتزامن وآلية تحمل النقاط العالقة، يجعل OpenDiLoCo وحدات معالجة الرسوميات الاستهلاكية والأجهزة الطرفية قادرة على المشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل كبير إمكانية المشاركة في التدريب التعاوني العالمي، وهو أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.

PCCL: مكتبة الاتصالات المتزامنة

PCCL هو مكتبة اتصالات خفيفة الوزن مصممة خصيصًا من قبل Prime Intellect لبيئة التدريب اللامركزية للذكاء الاصطناعي، تهدف إلى حل عنق الزجاجة في التكيف الذي تواجهه مكتبات الاتصالات التقليدية على الأجهزة المتباينة والشبكات ذات النطاق الترددي المنخفض. يدعم PCCL الطوبولوجيا النادرة، وضغط التدرج، والتزامن منخفض الدقة، واستعادة النقاط، ويمكن تشغيله على وحدات معالجة الرسومات الاستهلاكية والعقد غير المستقرة، وهو المكون الأساسي الذي يدعم القدرة على الاتصال غير المتزامن لبروتوكول OpenDiLoCo. لقد عزز بشكل كبير من تحمل عرض النطاق الترددي لشبكة التدريب وتوافق الأجهزة، مما يمهد الطريق لبناء شبكة تدريب تعاونية مفتوحة حقًا وغير موثوقة.

![كأس القدر للذكاء الاصطناعي: استكشافات متقدمة في التدريب اللامركزي]###https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(

)# 03، شبكة Prime Intellect للتحفيز وتقسيم الأدوار

بنى Prime Intellect شبكة تدريب قابلة للتحقق وبدون إذن، مزودة بآلية تحفيز اقتصادية، مما يسمح لأي شخص بالمشاركة في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. يعمل البروتوكول على أساس ثلاثة أنواع من الأدوار الأساسية:

  • مُطلق المهمة: تحديد بيئة التدريب، النموذج الأولي، دالة المكافأة ومعايير التحقق
  • عقد التدريب: تنفيذ التدريب المحلي، تقديم تحديثات الوزن ومسارات المراقبة
  • عقد التحقق: استخدام آلية TOPLOC للتحقق من صحة سلوك التدريب والمشاركة في حساب المكافآت وتجميع الاستراتيجيات

تشمل العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجمع الأوزان ###SHARDCAST( وتوزيع المكافآت، مما يشكل حلقة تحفيزية حول "السلوك التدريبي الحقيقي".

![كأس القدر للذكاء الاصطناعي: استكشاف الحدود للتدريب اللامركزي])https://img-cdn.gateio.im/webp-social/moments-0a322ea8b70c3d00d8d99606559c1864.webp(

)# 04، INTELLECT-2: إصدار أول نموذج تدريب اللامركزي القابل للتحقق

أصدرت Prime Intellect INTELLECT-2 في مايو 2025، وهو أول نموذج تعلم تعزيز كبير في العالم تم تدريبه بواسطة عقد لامركزية غير موثوقة ومتزامنة. حجم المعلمات يصل إلى 32B. تم تدريب نموذج INTELLECT-2 من قبل أكثر من 100 عقدة GPU غير متجانسة منتشرة عبر ثلاث قارات، باستخدام بنية غير متزامنة بالكامل، ومدة التدريب

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • 4
  • مشاركة
تعليق
0/400
Blockwatcher9000vip
· منذ 17 س
هذه الموجة حقًا مثيرة للاهتمام
شاهد النسخة الأصليةرد0
SelfRuggervip
· منذ 17 س
مستكشف الحدود yyds
شاهد النسخة الأصليةرد0
NFTFreezervip
· منذ 17 س
استهلاك الموارد كبير جدًا
شاهد النسخة الأصليةرد0
BlockchainThinkTankvip
· منذ 17 س
ينصح بمتابعة بحذر، حيث أن هذا المشروع يحمل مخاطر عدم إمكانية تتبع قوة الحوسبة.
شاهد النسخة الأصليةرد0
  • تثبيت