تبدو قيود السلامة في GPT-5.1 مقيدة بشكل غير ضروري في الوقت الحالي. تشير أنماط السلوك إلى أن هذه القيود قد لا تكون مدمجة تمامًا في أوزان النموذج - قد تكون هناك طبقات تصفية خارجية تلعب دورًا. إذا كان الأمر كذلك، ينبغي على فريق الهندسة أن يكون قادرًا على عزل هذه الآليات وتحسينها. تخلق التنفيذ الحالي تجربة مستخدم منفصمة تقوض القدرات الفعلية للنموذج. ستخدم نهج أكثر تعقيدًا في السلامة الجميع بشكل أفضل.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 14
أعجبني
14
3
إعادة النشر
مشاركة
تعليق
0/400
FlippedSignal
· منذ 11 س
يا رجل، هذه الفخ للفلترة حقًا مرتفعة، أشعر وكأنها قيود مفروضة بشكل قسري.
شاهد النسخة الأصليةرد0
SigmaBrain
· منذ 11 س
طبقة التصفية الخارجية هذه الفخ... يبدو أنها تبحث عن عذر لتجاوز آلية الأمان، شيء ممتع.
شاهد النسخة الأصليةرد0
OvertimeSquid
· منذ 11 س
嗯,又是 هذه فخ، كلما خرج نموذج جديد كان هناك من يشتكي من القيود الكثيرة🙄
تبدو قيود السلامة في GPT-5.1 مقيدة بشكل غير ضروري في الوقت الحالي. تشير أنماط السلوك إلى أن هذه القيود قد لا تكون مدمجة تمامًا في أوزان النموذج - قد تكون هناك طبقات تصفية خارجية تلعب دورًا. إذا كان الأمر كذلك، ينبغي على فريق الهندسة أن يكون قادرًا على عزل هذه الآليات وتحسينها. تخلق التنفيذ الحالي تجربة مستخدم منفصمة تقوض القدرات الفعلية للنموذج. ستخدم نهج أكثر تعقيدًا في السلامة الجميع بشكل أفضل.