2025-09-06 21:21:32

RL的剃刀：在線策略RL的遺忘程度小於SFT。

即使在匹配的準確性下，RL顯示出較少的災難性遺忘

主要發現：
1) RL 比 SFT 更傾向於 "忘記"
2) 在策略 RL (PPO) 的遺忘程度低於離策略 RL (DQN)
3) 即使在匹配的準確率下，RL顯示出較少的災難性遺忘

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

9人點讚了這條動態

讚賞
9
4
轉發
分享

留言

0/400

ZKSherlock

· 6小時前

从信息论的角度来看，实际上非常迷人……较少的遗忘意味着更好的熵保持，老实说。

查看原文回復0

BrokenYield

· 09-06 21:51

终于有些东西不会像我在2022年崩盘中的多头那样被遗忘

查看原文回復0

PumpDoctrine

· 09-06 21:41

SFT能不能长长记性啊

回復0

話題
#Gate廣場創作點亮中秋
19k 熱度
#我最看好的AI代幣
11k 熱度
#山寨幣市場回暖
26k 熱度
#Gate Alpha 上新
34k 熱度
#美聯儲降息預期
12k 熱度

置頂
🌕 Gate 廣場 · 中秋創作激勵限時開啓！
創作點亮中秋，帶熱門話題發帖，瓜分 $5,000 中秋好禮！🎁
立即報名查看詳情 👉 https://www.gate.com/campaigns/1953
💝 新用戶首次發帖並完成互動任務，即可瓜分 $600 新人獎池！
🔥 今日熱門話題： #我最看好的AI代币#
山寨季蓄勢待發，AI板塊代幣普漲， #WLD# 、 #KAITO# 領漲，龍頭 WLD 單日暴漲近48%，AI、IO、VIRTUAL 順勢跟上。近期你計劃布局哪些潛力 AI 幣？快來分享你的投資心得吧！
發帖建議：
1️⃣ AI 板塊未來發展你怎麼看？
2️⃣ 你最近看好哪些 AI 幣向大家推薦？理由是什麼？
3️⃣ 你最近的 AI 幣種交易策略如何？
快帶上 #我最看好的AI代币# 和 #Gate广场创作点亮中秋# 發帖，內容越多越優質，越有機會贏取 $5,000 中秋好禮！
🌕 桂花香，月兒圓～
Gate 廣場 · 中秋創作激勵限時開啓！
創作點亮中秋，帶上熱門話題發帖，就有機會瓜分 $5,000 中秋好禮！ 🎁
立即報名參與 👉 https://www.gate.com/campaigns/1953
💡 參與攻略
1️⃣ 在廣場發帖並帶上話題 #Gate广场创作点亮中秋#
2️⃣ 內容需圍繞廣場官號（Gate廣場_Official）每日發布的熱點話題進行創作，並確保帶上該熱點話題及 #Gate广场创作点亮中秋# 標籤
3️⃣ 發帖數量越多，內容越優質，互動量越高，獎勵越豐厚！
💰 創作者專屬獎勵
🏆 Top 1：寶格麗中秋限定禮盒 + $100 合約體驗券 + $100 GT
🥈 Top 2：寶格麗中秋限定禮盒 + $80 合約體驗券 + $60 GT
🥉 Top 3：寶格麗中秋限定禮盒 + $60 合約體驗券 + $30 GT
Top 4-10：寶格麗中秋限定禮盒 + $50 合約體驗券
Top 11-20：多功能充電器 + $30 合約體驗券
幸運獎（30 位）：每人 $20 合約體驗券
除此之外每位獲獎者都將獲得相應的社區流量扶持，增加您的社區影響力！
🍀 新用戶特別福利：
第一次在活動期間發帖？恭喜你，還有機會衝擊 $600 中秋賞月獎池！
完成任務（完善資料+關注5人+點讚/評論/轉發5帖+帶話題發首帖），30 位幸運用
🎉【Gate 新加坡旗艦活動 · 廣場趣味答題 Day1】
‍ #TOKEN2049# 馬上拉開序幕，Gate 也要在新加坡放大招啦！
Token of Love 音樂節、 Gate x Oracle Red Bull Racing 招待會、 F1 觀賽派對統統來襲！
現在參與廣場【趣味答題挑戰】，來測測你對活動了解多少，瓜分$100 BTC！
參與方式：評論區留下答案（格式：1B 2A 3B 4B）
🎁 獎勵：每天抽 3 名幸運用戶 → 每人 $10 BTC
🎁 終極彩蛋：三天全對的幸運超級答題王 → 再送 $10 BTC！
📖 Day1 · Quiz 單選題
Q1
Gate 新加坡旗艦活動在哪五天舉行？
A. 9月30日-10月4日
B. 10月1日-5日
C. 10月5日-9日
Q2
“TOKEN OF LOVE” 音樂節的舉辦地點是？
A. 濱海灣花園
B. 聖淘沙
C. 新加坡體育館
Q3
Gate x Oracle Red Bull Racing 招待會特別關注的三個主題是？
A. 體育、旅遊、時尚
B. 加密市場趨勢、全球經濟展望、Web3
C. 遊戲、NFT、元宇宙
Q4
在10月2日舉行的 F1 賽車模擬挑戰中，勝出者獲得的獎勵是什麼？
A. 音樂節 VVIP 門票
B. Gate 精美週邊
C. F1 觀賽盛宴門票
💡 小Tips：不確定答案？偷偷翻一下
🚗 #Gate广场全民挑战# 第一期 — 誰會率先 To The Moon？
腦力大比拼，猜一猜贏獎勵
💰 5 位幸運用戶將瓜分 $50 GT 獎勵！
👉 參與方式：
1️⃣ 關注 Gate廣場_Official
2️⃣ 點讚此條廣場貼文
3️⃣ 在評論中留下你的答案
🗓️ 截止至 2025 年 9 月 17 日 24:00（UTC+8）