Grok CodeがKilo Agentic Modelリーダーボードのトップに立ち、その差は圧倒的です。数字が物語っています:使用トークン数は35.6Bで、2位を4倍以上引き離しています。これは単なるベンチマークの勝利ではありません。エージェントモデルが進化していることを示しており、パフォーマンスの差は顕著です。リーダーボードでこれほど大きく差をつけている実装は、通常、根本的に異なるレベルで何かが機能していることを意味します。要点は?エージェントAIはますます競争力を増しており、最先端とみなされるための技術的基準は引き続き高まっています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 8
  • リポスト
  • 共有
コメント
0/400
TokenDustCollectorvip
· 11分前
4倍差距?これはひどい、Grok Codeは本当にすごい
原文表示返信0
LiquidationOraclevip
· 12-27 11:15
4倍の差?Grok Codeはagentaiを支配しようとしているのか
原文表示返信0
GasFeeVictimvip
· 12-26 23:53
4倍の差? 残念ながら、この相棒はぶら下がっていません --- 今回はGrok Codeが防御を本当に破り、35.6億トークンは直接粉砕されました --- ランキングの差があまりにも大きくて、ちょっとひどいくらい... しかし同時に、エージェントが実際に高速で反復していることも示しています --- 待って、本当に4倍も偽物なの? 他のモデルにはどんなものがありますか? --- エージェントモデルの軌道はますます拡大し、新たな高みへと登りつつあります
原文表示返信0
AirdropChaservip
· 12-26 23:49
グロクコードが4回2位で圧倒? このギャップは確かに誇張されています
原文表示返信0
RunWhenCutvip
· 12-26 23:48
くそっ、4倍の差?これは他の人を圧倒しようとしているのか
原文表示返信0
BrokenYieldvip
· 12-26 23:46
正直なところ、リーダーボードで4倍のリードは、他の人たちが蒸気と壊れたリスクモデルに頼っていることを意味していることが多いです。以前にもこの映画を見たことがある—相関行列が崩壊し、その後みんなが間違った指標を測定していたことに気づく。grokはおそらく、3ヶ月以内に修正されるプロトコルの非効率性を利用しているだけだろう。
原文表示返信0
Degen4Breakfastvip
· 12-26 23:39
4xの差は本当にちょっと信じられないですね。Grok Codeはこの波でどうやってやったのですか?
原文表示返信0
Hash_Banditvip
· 12-26 23:38
4xギャップ?正直なところ、これは誰かが本当に根本的な問題を解決したときにしか見られない支配の一種だ。何度も困難な時代を乗り越えてきたからこそ、それが本物なのか単なる最適化された誇大宣伝なのかを見極められる。
原文表示返信0
  • ピン