أظهر أن نموذج معلمات صغيرة (Qwen2.5-3B) المدرب باستخدام التعلم المعزز يمكن أن يتفوق على نماذج الحدود الأكبر (Claude-3.5-Sonnet و GPT-4o) في مهام هندسة التعلم الآلي - محققًا متوسطًا قدره 22%
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 14
أعجبني
14
7
إعادة النشر
مشاركة
تعليق
0/400
screenshot_gains
· 09-08 06:20
نموذج صغير يعطي درسًا لنموذج كبير
شاهد النسخة الأصليةرد0
0xDreamChaser
· 09-08 06:20
أصبح الأمر له طابع معين
شاهد النسخة الأصليةرد0
CryingOldWallet
· 09-08 06:18
لا شيء يعمل كما يجب، كل شيء يدور حول المنافسة.
شاهد النسخة الأصليةرد0
RuntimeError
· 09-08 06:14
النموذج الصغير يتفوق على النموذج الكبير 666
شاهد النسخة الأصليةرد0
GasFeeBeggar
· 09-08 06:14
نموذج صغير يضرب نموذج كبير؟ ثور哇
شاهد النسخة الأصليةرد0
ZKSherlock
· 09-08 05:57
في الواقع، تحسين أنيق للغاية لموارد الحوسبة... على الرغم من أن تداعيات الخصوصية تحتاج إلى تدقيق.
【تعلم التعزيز لوكلاء هندسة التعلم الآلي】
أظهر أن نموذج معلمات صغيرة (Qwen2.5-3B) المدرب باستخدام التعلم المعزز يمكن أن يتفوق على نماذج الحدود الأكبر (Claude-3.5-Sonnet و GPT-4o) في مهام هندسة التعلم الآلي - محققًا متوسطًا قدره 22%