【Makine Öğrenimi Mühendisliği Ajanları için Pekiştirmeli Öğrenme】



Küçük bir 3B parametre modeli (Qwen2.5-3B)'nın RL ile eğitildiğinde çok daha büyük sınır modelleri (Claude-3.5-Sonnet, GPT-4o)'yi geride bırakabileceğini gösterin - ML mühendislik görevlerinde %22 ortalama başarı elde ederek.
GPT7.37%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 7
  • Repost
  • Share
Comment
0/400
screenshot_gainsvip
· 09-08 06:20
Küçük model büyük modele bir ders veriyor
View OriginalReply0
0xDreamChaservip
· 09-08 06:20
Biraz içten geldi.
View OriginalReply0
CryingOldWalletvip
· 09-08 06:18
Ne istiyorsanız, o yok; ne varsa en iyisi.
View OriginalReply0
RuntimeErrorvip
· 09-08 06:14
Küçük model büyük modeli döver 666
View OriginalReply0
GasFeeBeggarvip
· 09-08 06:14
Küçük model büyük modeli mi dövüyor? boğa mı
View OriginalReply0
ZKSherlockvip
· 09-08 05:57
aslında hesaplama kaynaklarının oldukça zarif bir optimizasyonu... ama gizlilik sonuçlarının incelenmesi gerekiyor
View OriginalReply0
BlockchainGrillervip
· 09-08 05:55
Küçük model büyük modeli mi yendi?
View OriginalReply0
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)