Grok Code 在 Kilo Agentic Model 排行榜上夺得第一名——而且差距远远超过第二名。数字说明了一切:使用量达 35.6B 令牌,超过第二名超过4倍。这不仅仅是又一次基准测试的胜利。它表明代理模型正在不断演变,性能差异非常明显。当某个实现远远领先于排行榜时,通常意味着它在某个根本层面上运作得截然不同。总结一下?代理AI正变得越来越具有竞争力,技术门槛也在不断提高,什么才算是最先进的水平。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 7
  • 转发
  • 分享
评论
0/400
Liquidation Oraclevip
· 5小时前
4倍的差距?Grok Code这是要统治agentai了啊
回复0
GasFeeVictimvip
· 16小时前
4倍差距?这哥们怕不是开挂了吧 --- grok code这次是真的破防了,35.6B token直接碾压 --- 排行榜gap这么大,多少有点离谱...不过也说明agent这块儿确实在快速迭代 --- 等等,真的假的4倍?那其他模型是咋混的 --- agentic model这赛道越来越卷了,卷出新高度
回复0
空投追逐者vip
· 16小时前
grok code 4倍碾压第二名?这差距确实夸张啊
回复0
韭当割就跑vip
· 16小时前
草,4倍差距?这是要卷死其他的啊
回复0
BrokenYieldvip
· 16小时前
说实话,排行榜上领先4倍通常意味着其他人都在靠虚幻和破碎的风险模型在运作。我见过这种情况——相关性矩阵崩溃,然后大家才意识到他们在衡量错误的指标。Grok可能只是利用了一些协议的低效之处,而这些问题将在3个月内被修复。
查看原文回复0
Degen4Breakfastvip
· 16小时前
4x的差距,这真的有点离谱啊。Grok Code这波怎么做到的?
回复0
Hash_Banditvip
· 16小时前
4倍差距?说实话,这种统治力只有在有人真正解决了某些根本性问题时才会出现。经历过足够多的困难时期,才能分辨出是真实的优势还是仅仅是优化的炒作
查看原文回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)