Grok Code 登上 Kilo Agentic Model 排行榜的榜首——而且差距甚至遠遠超出。數據說明了一切:使用量達到 35.6B 代幣,超越第二名超過4倍。這不僅僅是另一個基準測試的勝利。它象徵著代理模型的演變,而性能差異十分顯著。當一個實現方案在排行榜上遠遠領先時,通常意味著某些東西在根本層面上運作得截然不同。重點是?代理式 AI 正變得越來越具競爭力,技術門檻也在不斷提高,什麼才算是最先進的技術。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 10
  • 轉發
  • 分享
留言
0/400
ZkSnarkervip
· 12-29 10:10
ngl 4倍差距真的很誇張,但...我們真的已經用現實世界的混亂來壓力測試過了嗎?排行榜一直很猛,直到它們不再那麼猛,哈哈
查看原文回復0
Merge Conflictvip
· 12-28 19:03
grok這次直接碾壓啊,4倍差距有點離譜
查看原文回復0
TokenDustCollectorvip
· 12-28 15:19
4倍差距?這離譜了,Grok Code真的絕了
查看原文回復0
Liquidation Oraclevip
· 12-27 11:15
4倍的差距?Grok Code這是要統治agentai了啊
查看原文回復0
GasFeeVictimvip
· 12-26 23:53
4倍差距?這哥們怕不是開掛了吧 --- grok code這次是真的破防了,35.6B token直接碾壓 --- 排行榜gap這麼大,多少有點離譜...不過也說明agent這塊兒確實在快速迭代 --- 等等,真的假的4倍?那其他模型是咋混的 --- agentic model這賽道越來越卷了,卷出新高度
查看原文回復0
空投追逐者vip
· 12-26 23:49
grok code 4倍碾壓第二名?這差距確實誇張啊
查看原文回復0
韭当割就跑vip
· 12-26 23:48
草,4倍差距?這是要卷死其他的啊
查看原文回復0
BrokenYieldvip
· 12-26 23:46
說實話,排行榜上領先4倍通常意味著其他人都在靠空氣和破碎的風險模型運行。我以前看過這部電影——相關性矩陣崩潰,然後每個人都意識到他們在測量錯誤的指標。grok可能只是利用了一些協議效率低下的漏洞,這些漏洞會在3個月內被修補。
查看原文回復0
Degen4Breakfastvip
· 12-26 23:39
4x的差距,这真的有点離譜啊。Grok Code這波怎麼做到的?
查看原文回復0
Hash_Banditvip
· 12-26 23:38
4x 差距?說實話,這種主導地位只有在有人真正解決了某些根本問題時才會看到。經歷過足夠多的困難時代,才能分辨出這是真實的還是僅僅是優化的炒作
查看原文回復0
查看更多
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)