Grok Code занимает первое место в таблице лидеров Kilo Agentic Model — и разрыв даже близко не сравним. Цифры рассказывают свою историю: 35,6 млрд токенов в использовании, что более чем в 4 раза превосходит второе место. Это не просто очередная победа в бенчмарке. Это сигнал о том, как развиваются агентные модели, и разница в производительности очевидна. Когда одна реализация так далеко опережает конкурентов в таблицах лидеров, обычно это означает, что что-то работает на принципиально другом уровне. Вывод? Агентный ИИ становится все более конкурентоспособным, а технический уровень продолжает расти, задавая новые стандарты для передовых решений.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 8
  • Репост
  • Поделиться
комментарий
0/400
TokenDustCollectorvip
· 2ч назад
В 4 раза разница? Это невероятно, Grok Code действительно на высоте
Посмотреть ОригиналОтветить0
LiquidationOraclevip
· 12-27 11:15
В 4 раза больше разницы? Grok Code собирается доминировать над agentai, да?
Посмотреть ОригиналОтветить0
GasFeeVictimvip
· 12-26 23:53
Разница в 4 раза? Боюсь, этот приятель не висит --- На этот раз код Grok действительно сломал оборону, и токен 35.6B был прямо разгромлен --- Разрыв в рейтинге настолько велик, что это немного возмутительно... Однако это также показывает, что агент действительно быстро развивается --- Постой, это действительно в 4 раза более фальшиво? Какие есть другие модели? --- Путь агентных моделей становится всё более прокрученным, поднимаясь к новым высотам
Посмотреть ОригиналОтветить0
AirdropChaservip
· 12-26 23:49
grok code 4 раза превосходит второго места? Этот разрыв действительно впечатляющий
Посмотреть ОригиналОтветить0
RunWhenCutvip
· 12-26 23:48
Черт, разрыв в 4 раза? Значит, сейчас всех остальных уничтожат.
Посмотреть ОригиналОтветить0
BrokenYieldvip
· 12-26 23:46
Честно говоря, 4x лидировать в таблице лидеров обычно означает, что остальные ребята работают на паре и сломанных моделях риска. Уже видел этот фильм — матрица корреляции рушится, и все понимают, что измеряли не те метрики. Grok, вероятно, просто использует какую-то неэффективность протокола, которая будет исправлена через 3 месяца.
Посмотреть ОригиналОтветить0
Degen4Breakfastvip
· 12-26 23:39
Разрыв в 4 раза — это действительно немного за гранью. Как Grok Code удалось это сделать?
Посмотреть ОригиналОтветить0
Hash_Banditvip
· 12-26 23:38
4x разрыв? Честно говоря, это тот уровень доминирования, который можно увидеть только когда кто-то действительно решил что-то фундаментальное. Прошел через достаточно эпох трудностей, чтобы понять, когда это реально, а когда просто оптимизированный хайп
Посмотреть ОригиналОтветить0
  • Закрепить