10,000 USDT 悬賞,尋找跟單金牌星探!🕵️
挖掘頂級帶單員,贏取高額跟單體驗金!
立即參與:https://www.gate.com/campaigns/4624
🎁 三大活動,獎金疊滿:
1️⃣ 慧眼識英:發帖推薦帶單員,分享跟單體驗,抽 100 位送 30 USDT!
2️⃣ 強力應援:曬出你的跟單截圖,為大神打 Call,抽 120 位送 50 USDT!
3️⃣ 社交達人:同步至 X/Twitter,憑流量贏取 100 USDT!
📍 標籤: #跟单金牌星探 #GateCopyTrading
⏰ 限時: 4/22 16:00 - 5/10 16:00 (UTC+8)
詳情:https://www.gate.com/announcements/article/50848
🔥研究員:主流AI基準測試存在系統性漏洞,排行榜數據或嚴重失真
4月10日,AI研究員Hao Wang發布研究披露,包括SWE-bench Verified和Terminal-Bench在內的多個業內權威AI基準測試,均存在可被系統性利用的漏洞——其團隊構建的Agent在未解決任何實際任務的情況下,在兩項基準上均取得了滿分100%。
典型案例如下:SWE-bench Verified中,在代碼倉庫植入10行的pytest hook,測試運行前自動將所有結果篡改為“通過”,評分系統對此毫無察覺,500道題全部滿分;Terminal-Bench雖對測試…