استكشاف مستقبل الذكاء الاصطناعي: تقنيات وتحديات التدريب اللامركزي

الكأس المقدسة للذكاء الاصطناعي في العملات المشفرة: استكشاف المقدمة للتدريب اللامركزي

تدريب الذكاء الاصطناعي هو الجزء الأكثر أهمية في سلسلة قيمة الذكاء الاصطناعي بأكملها، حيث يحدد بشكل مباشر الحد الأقصى لقدرات النموذج وفعالية التطبيق. مقارنةً باستدعاءات الاستدلال منخفضة الوزن، يتطلب عملية التدريب استثمارًا مستمرًا في قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "الصناعة الثقيلة" الحقيقية لبناء أنظمة الذكاء الاصطناعي. من حيث نماذج الهيكل، يمكن تقسيم طرق التدريب إلى أربع فئات: التدريب المركز، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي نناقشه في هذه المقالة.

كأس القدر لـ Crypto AI: استكشاف أمامي للتدريب اللامركزي

تدريب المركزية هو الأكثر تقليدية، حيث يتم إكمال جميع عمليات التدريب بواسطة هيئة واحدة داخل مجموعة عالية الأداء محليًا، ويتم تنسيق تشغيل جميع المكونات من الأجهزة إلى البرمجيات بواسطة نظام تحكم موحد. هذه البنية التحتية من التعاون العميق تجعل كفاءة التدريب تصل إلى أقصى حد، وهي مناسبة جدًا لتدريب النماذج الكبيرة مثل GPT وGemini، حيث تتمتع بمزايا الكفاءة العالية والتحكم في الموارد، ولكنها في الوقت نفسه تعاني من مشكلات الاحتكار البياني، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقطة الواحدة.

التدريب الموزع هو الأسلوب السائد حاليًا في تدريب النماذج الكبيرة، حيث يتمثل جوهره في تقسيم مهمة تدريب النموذج وتوزيعها على عدة آلات لتنفيذها بشكل متزامن، وذلك لتجاوز عنق الزجاجة في الحوسبة والتخزين الأحادي. على الرغم من توفر الخصائص "الموزعة" من الناحية الفيزيائية، إلا أن التحكم والتنسيق والتزامن لا يزال يتم بواسطة مؤسسة مركزية، وغالبًا ما تعمل في بيئة شبكة محلية عالية السرعة، من خلال تقنية ناقل الاتصال عالي السرعة NVLink، حيث يتم تنسيق المهام الفرعية من قبل العقدة الرئيسية. تشمل الطرق السائدة التوازي في البيانات، والتوازي في النموذج، والتوازي في الأنابيب، والتوازي في الموترات. يعد التدريب الموزع مزيجًا من "التحكم المركزي + التنفيذ الموزع"، وهو مشابه لمدير واحد يقوم بتوجيه موظفين من عدة "مكاتب" عن بُعد للتعاون لإكمال المهام. حاليًا، يتم تدريب جميع النماذج الكبيرة السائدة تقريبًا من خلال هذه الطريقة.

اللامركزية التدريبية تمثل مسارًا مستقبليًا أكثر انفتاحًا ومقاومةً للرقابة. تتمثل الخصائص الأساسية في: تعاون عدة نقاط غير موثوقة في إكمال مهام التدريب دون وجود منسق مركزي، وغالبًا ما يتم ذلك من خلال بروتوكولات تدفع توزيع المهام والتعاون، ويتم استخدام آليات التحفيز المشفرة لضمان نزاهة المساهمات. تشمل التحديات الرئيسية التي يواجهها هذا النموذج تباين الأجهزة وصعوبة تقسيمها، واختناقات كفاءة الاتصال، وغياب التنفيذ الموثوق، ونقص التنسيق الموحد. يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين العالميين، كل منهم يساهم بقوة الحوسبة للتعاون في تدريب النموذج، ولكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال يمثل تحديًا هندسيًا نظاميًا، يتضمن هيكل النظام، وبروتوكولات الاتصال، وأمن التشفير، والآليات الاقتصادية، والتحقق من النموذج، ولا يزال مدى إمكانية "التعاون الفعال + تحفيز النزاهة + نتائج صحيحة" في مرحلة استكشاف النموذج الأولي المبكر.

كأس القدر للذكاء الاصطناعي: استكشاف الحدود للتدريب اللامركزي

يشدد التعلم الفيدرالي، كمرحلة انتقالية بين التوزيع واللامركزية، على الاحتفاظ بالبيانات محليًا وتجمع معلمات النموذج مركزيًا، وهو مناسب للسيناريوهات التي تركز على الامتثال للخصوصية. يتمتع التعلم الفيدرالي بهيكل هندسي للتدريب الموزع وقدرة على التعاون المحلي، وفي الوقت نفسه يتمتع بمزايا توزيع البيانات في التدريب اللامركزي، لكنه لا يزال يعتمد على جهة تنسيق موثوقة، ولا يتمتع بخصائص مفتوحة تمامًا ومقاومة للرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في سياقات الامتثال للخصوصية، حيث يكون التدريب والهيكل الثقة وآلية الاتصال معتدلة نسبيًا، مما يجعله أكثر ملاءمة كهيكل نشر انتقالي في الصناعة.

من منظور نماذج التدريب، فإن التدريب اللامركزي ليس مناسبًا لجميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، وارتفاع متطلبات الموارد، أو صعوبة التعاون، فإنه بطبيعته ليس مناسبًا لإكماله بكفاءة بين العقد المتنوعة وذات الثقة المنخفضة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالبًا على ذاكرة وصول عشوائي عالية، وزمن استجابة منخفض، وعرض نطاق ترددي عالي، مما يجعل من الصعب تقسيمها ومزامنتها بشكل فعال في الشبكات المفتوحة؛ المهام التي تقيدها الخصوصية وقيود السيادة تقتصر على الامتثال القانوني والقيود الأخلاقية، مما يمنع المشاركة المفتوحة؛ بينما تفتقر المهام التي تفتقر إلى حوافز التعاون الأساسية إلى الدافع الخارجي للمشاركة. تشكل هذه الحدود معًا القيود الواقعية الحالية للتدريب اللامركزي.

لكن هذا لا يعني أن التدريب اللامركزي هو فكرة زائفة. في الواقع، في أنواع المهام الخفيفة الهيكل، سهلة التوازي، والمحفزة، يظهر التدريب اللامركزي آفاق تطبيق واضحة. بما في ذلك، ولكن لا تقتصر على: ضبط LoRA، مهام ما بعد التدريب المتعلقة بمحاذاة السلوك، تدريب وتسمية البيانات المجمعة، تدريب نماذج أساسية صغيرة يمكن التحكم في مواردها، وكذلك سيناريوهات التدريب التعاوني بمشاركة الأجهزة الطرفية. تتمتع هذه المهام عمومًا بخصائص عالية من التوازي، وانخفاض الترابط، وتحمل القدرة الحاسوبية المتنوعة، مما يجعلها مناسبة جدًا للتدريب التعاوني من خلال شبكات P2P، بروتوكول Swarm، والمحسنات الموزعة.

حاليا في مجال التدريب اللامركزي والتعلم الفيدرالي، تشمل المشاريع البارزة في مجال blockchain كل من Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai العديد من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في البحث النظري الحالي؛ بينما تعتبر مسارات التنفيذ لكل من Gensyn وFlock.io واضحة نسبياً، حيث يمكن رؤية تقدم هندسي أولي.

تكرّس Prime Intellect جهودها لبناء شبكة تدريب للذكاء الاصطناعي لا تتطلب الثقة، مما يتيح لأي شخص المشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهمته في الحسابات. تأمل Prime Intellect في بناء نظام تدريب للذكاء الاصطناعي اللامركزي يتمتع بالتحقق، والانفتاح، وآلية تحفيز كاملة من خلال ثلاثة وحدات رئيسية: PRIME-RL + TOPLOC + SHARDCAST.

PRIME-RL هو إطار نموذج وتنفيذ المهام المخصص من Prime Intellect لسيناريوهات التدريب اللامركزية، مصمم خصيصًا للشبكات المتعددة والمتطلبات غير المتزامنة. يعتمد على التعلم المعزز كهدف رئيسي للتكيف، ويفصل بشكل هيكلي بين عمليات التدريب والاستدلال ورفع الأوزان، مما يسمح لكل عقدة تدريب بإكمال دورة المهام بشكل مستقل محليًا، والتعاون من خلال واجهات قياسية وآليات التحقق والتجميع. بالمقارنة مع عمليات التعلم تحت إشراف التقليدية، فإن PRIME-RL أكثر ملاءمة لتحقيق تدريب مرن في بيئات بدون جدولة مركزية، مما يقلل من تعقيد النظام، ويؤسس أيضًا لدعم المهام المتعددة بالتوازي وتطور الاستراتيجيات.

TOPLOC هو آلية أساسية للتحقق من التدريب اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان العقدة قد أكملت فعلاً تعلم استراتيجية فعالة بناءً على بيانات المراقبة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب نموذج كامل، بل يكمل التحقق الهيكلي الخفيف من خلال تحليل "تسلسل الملاحظات ↔ تحديث الاستراتيجية" بين مسارات التناسق المحلي. إنها تحول لأول مرة مسارات السلوك خلال عملية التدريب إلى كائنات قابلة للتحقق، مما يعد ابتكاراً رئيسياً لتحقيق توزيع مكافآت التدريب دون الحاجة إلى الثقة، ويوفر مساراً قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.

SHARDCAST هو بروتوكول نشر وتجميع للوزن مصمم بواسطة Prime Intellect، تم تحسينه خصيصًا للبيئات الشبكية الحقيقية التي تتميز باللامركزية، وقيود النطاق الترددي، وتغير حالة العقد. يجمع بين آلية نشر gossip واستراتيجية التزام محلي، مما يسمح لعدة عقد بتقديم تحديثات جزئية باستمرار في حالات غير متزامنة، مما يحقق تقاربًا تدريجيًا للوزن وتطورات متعددة النسخ. مقارنة بأساليب AllReduce المركزية أو المتزامنة، فإن SHARDCAST يعزز بشكل كبير من قابلية التوسع والقدرة على تحمل الأخطاء في التدريب اللامركزي، وهو الأساس الرئيسي لبناء توافق وزني مستقر وتدريب مستمر متكرر.

كأس القدر للذكاء الاصطناعي: استكشاف الحدود في التدريب اللامركزي

OpenDiLoCo هو إطار تحسين الاتصالات الذي تم تحقيقه بشكل مستقل ومفتوح المصدر من قبل فريق Prime Intellect بناءً على مفهوم DiLoCo الذي اقترحته DeepMind، وهو مصمم خصيصًا للتحديات الشائعة في التدريب اللامركزي مثل قيود النطاق الترددي، وعدم تجانس الأجهزة، وعدم استقرار العقد. يعتمد هيكله على التوازي في البيانات، من خلال بناء هياكل طوبولوجية نادرة مثل Ring وExpander وSmall-World، مما يتجنب التكلفة العالية للتواصل الناتجة عن التزامن العالمي، ويعتمد فقط على العقد المجاورة المحلية لإكمال تدريب النموذج التعاوني. بالجمع بين التحديثات غير المتزامنة وآلية تحمل الأخطاء، يتيح OpenDiLoCo لبطاقات الرسوميات الاستهلاكية والأجهزة الطرفية المشاركة بشكل مستقر في مهام التدريب، مما يعزز بشكل ملحوظ قابلية المشاركة في التدريب التعاوني العالمي، ويعد أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.

PCCL هو مكتبة اتصالات خفيفة الوزن مصممة خصيصًا من قبل Prime Intellect لبيئة تدريب الذكاء الاصطناعي اللامركزية، وتهدف إلى معالجة عنق الزجاجة في التكيف الذي تواجهه مكتبات الاتصالات التقليدية في الأجهزة المتغايرة والشبكات ذات النطاق الترددي المنخفض. يدعم PCCL الطوبولوجيا المتناثرة، وضغط التدرجات، والتزامن منخفض الدقة واستعادة النقاط، ويمكن تشغيله على وحدات معالجة الرسوميات الاستهلاكية والعقد غير المستقرة، وهو المكون الأساسي الذي يدعم القدرة على الاتصال غير المتزامن لبروتوكول OpenDiLoCo. إنه يعزز بشكل ملحوظ من تحمل النطاق الترددي للشبكة التدريبية وتوافق الأجهزة، ويفتح "آخر كيلومتر" من البنية التحتية للاتصالات لبناء شبكة تدريب تعاونية حقيقية مفتوحة وغير موثوقة.

بنت Prime Intellect شبكة تدريب قابلة للتحقق وبدون إذن، مزودة بآلية حوافز اقتصادية، مما يتيح لأي شخص المشاركة في المهام والحصول على مكافآت بناءً على المساهمات الحقيقية. يعمل البروتوكول بناءً على ثلاث فئات من الأدوار الأساسية: مبادر المهام، ونقاط التدريب، ونقاط التحقق. تشمل العمليات الأساسية للبروتوكول نشر المهام، وتدريب النقاط، والتحقق من المسارات، وتجميع الأوزان، وتوزيع المكافآت، مما يشكل حلقة تحفيزية تدور حول "السلوك التدريبي الحقيقي".

كأس المقدس للذكاء الاصطناعي: استكشاف الحدود في التدريب اللامركزي

أصدرت Prime Intellect INTELLECT-2 في مايو 2025، وهو أول نموذج كبير للتعلم المعزز تم تدريبه من خلال تعاون غير متزامن وبدون ثقة بين العقد اللامركزية، بحجم معلمات يصل إلى 32B. تم تدريب نموذج INTELLECT-2 بواسطة أكثر من 100 عقدة GPU غير متجانسة منتشرة عبر ثلاث قارات، باستخدام هيكل غير متزامن بالكامل، حيث تجاوزت مدة التدريب 400 ساعة، مما يظهر جدوى واستقرار الشبكة التعاونية غير المتزامنة. لا يمثل هذا النموذج مجرد突破 في الأداء، بل هو أيضًا أول تطبيق نظامي لباراديم "التدريب هو الإجماع" الذي اقترحته Prime Intellect. يدمج INTELLECT-2 وحدات البروتوكول الأساسية مثل PRIME-RL وTOPLOC وSHARDCAST، مما يمثل تحقيقًا لأول مرة لفتح عملية التدريب، والتحقق، والحوافز الاقتصادية في الشبكة التدريبية اللامركزية.

فيما يتعلق بالأداء، يعتمد INTELLECT-2 على QwQ-32B وقد أجرى تدريبًا خاصًا على RL في البرمجة الرياضية، مما يجعله في طليعة نماذج RL مفتوحة المصدر الحالية. على الرغم من أنه لم يتجاوز بعد نماذج مغلقة المصدر مثل GPT-4 أو Gemini، إلا أن معناه الحقيقي يكمن في: أنه أول نموذج تجريبي لامركزي يمكن إعادة إنتاجه والتحقق منه وتدقيقه بشكل كامل على مستوى التدريب. لم يقم Prime Intellect فقط بفتح مصدر النموذج، بل الأهم من ذلك أنه قام بفتح مصدر عملية التدريب نفسها - حيث إن بيانات التدريب ومسارات تحديث الاستراتيجيات وعمليات التحقق والمنطق التجميعي جميعها شفافة وقابلة للتحقق، مما أنشأ نموذجًا لشبكة تدريب لامركزية يمكن للجميع المشاركة فيها والتعاون بشكل موثوق ومشاركة العوائد.

كأس القدر للتشفير: استكشاف متقدم للتدريب اللامركزي

Pluralis هو مشروع Web3 AI يركز على "شبكة التدريب التعاوني الموثوق بها"، ويهدف بشكل أساسي إلى تعزيز نموذج تدريب يتمتع باللامركزية، ومشاركة مفتوحة، وآلية تحفيز طويلة الأجل. على عكس مسارات التدريب المركزية أو المغلقة السائدة حاليًا، تقدم Pluralis مفهومًا جديدًا يسمى التعلم البروتوكولي: تحويل عملية تدريب النموذج إلى "بروتوكول"، من خلال آلية التعاون القابلة للتحقق ورسم ملكية النموذج، لبناء نظام تدريب مفتوح يتمتع بدائرة تحفيز داخلية.

يحتوي التعلم البروتوكولي الذي اقترحته بلوراليس على ثلاثة أعمدة رئيسية:

  1. نموذج غير قابل للاستخراج: يتم توزيع النموذج بشكل متقطع بين عدة عقد، ولا يمكن لأي عقدة فردية استعادة الوزن الكامل مما يحافظ على مصدر مغلق. يجعل هذا التصميم النموذج بشكل طبيعي "أصل داخل البروتوكول"، مما يسمح بتحكم في شهادات الوصول، وحماية من التسرب، وارتباط حقوق العائد.

  2. تدريب النماذج المتوازية المستندة إلى الإنترنت: من خلال آلية نموذج التوازي غير المتزامن، تمتلك العقد المختلفة جزءًا فقط من الأوزان، وتتعاون عبر شبكة ذات عرض نطاق منخفض لإكمال التدريب أو الاستدلال.

  3. توزيع ملكية النموذج بناءً على المساهمات: يحصل جميع العقد المشاركة على جزء من ملكية النموذج بناءً على مساهماتهم في التدريب، وبالتالي يتمتعون بحصة من الأرباح المستقبلية وحقوق إدارة البروتوكول.

في الجوانب الفنية,

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • 6
  • مشاركة
تعليق
0/400
SurvivorshipBiasvip
· 07-07 18:20
مجرد كلمتين: ترويج!
شاهد النسخة الأصليةرد0
EthSandwichHerovip
· 07-05 01:58
الذكاء غير ثابت! دع البيانات تتحدث!
شاهد النسخة الأصليةرد0
DYORMastervip
· 07-04 21:14
هل لا يزال يتحدث عن اللامركزية؟
شاهد النسخة الأصليةرد0
MoonBoi42vip
· 07-04 19:21
مركزي؟ مركز مطرقة
شاهد النسخة الأصليةرد0
LiquidationWizardvip
· 07-04 19:13
تعال للتنافس مع مستثمر التجزئة على الأسهم.
شاهد النسخة الأصليةرد0
StealthMoonvip
· 07-04 19:09
مُشَوَّش قليلاً، إذا لم أفهم سأطرح سؤالاً
شاهد النسخة الأصليةرد0
  • تثبيت