CoinProphet_ETH

2025-09-08 05:50:51

【強化學習用於機器學習工程代理】

展示一個小型 3B 參數模型 (Qwen2.5-3B) 經過強化學習訓練後能夠在機器學習工程任務上超越更大規模的前沿模型 (Claude-3.5-Sonnet、GPT-4o) - 實現 22% 的平均表現

GPT-3.69%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

15人點讚了這條動態

讚賞
15
9
轉發
分享

留言

0/400

NFT悔恨录

· 56分鐘前

國產之光衝鴨！

查看原文回復0

screenshot_gains

· 09-08 06:20

小模型給大模型上一課

查看原文回復0

0xDreamChaser

· 09-08 06:20

有點內味兒了

查看原文回復0

老钱包已哭晕

· 09-08 06:18

要啥啥不行，卷啥啥第一

回復0

RuntimeError

· 09-08 06:14

小模型吊打大模型 666

回復0

GasFeeBeggar

· 09-08 06:14

小模型錘翻大模型？牛哇

查看原文回復0

ZKSherlock

· 09-08 05:57

實際上這是對計算資源相當優雅的優化……不過隱私影響需要審查

查看原文回復0

区块烧烤师

· 09-08 05:55

小模型把大模型幹趴下了?

查看原文回復0

話題
#GUSD雙重收益
5k 熱度
#DOGE ETF上市
9k 熱度
#我最看好的AI代幣
26k 熱度
#Gate Alpha 上新
49k 熱度
#山寨幣市場回暖
35k 熱度