Grok Code посідає перше місце в рейтингу Kilo Agentic Model — і різниця навіть не близька. Числа розповідають історію: 35.6 млрд токенів у використанні, що перевищує друге місце більш ніж у 4 рази. Це не просто ще одна перемога у бенчмарках. Це сигнал того, як розвиваються агентні моделі, і різниця у продуктивності є очевидною. Коли одна реалізація так далеко випереджає інших у рейтингах, це зазвичай означає, що щось працює на фундаментально іншому рівні. Висновок? Агентний ШІ стає все більш конкурентоспроможним, а технічний рівень постійно зростає для визначення того, що вважається передовим.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 9
  • Репост
  • Поділіться
Прокоментувати
0/400
MergeConflictvip
· 4год тому
grok цього разу прямо розгромив, різниця у 4 рази — трохи перебір.
Переглянути оригіналвідповісти на0
TokenDustCollectorvip
· 8год тому
4-кратна різниця? Це неймовірно, Grok Code дійсно на висоті
Переглянути оригіналвідповісти на0
LiquidationOraclevip
· 12-27 11:15
В 4 рази більше? Grok Code збирається панувати над agentai, так?
Переглянути оригіналвідповісти на0
GasFeeVictimvip
· 12-26 23:53
4-кратна різниця? Цей хлопець, мабуть, не читерить --- grok code цього разу справді зламався, 35.6B токенів прямо переважають --- Розрив у рейтингу такий великий, це трохи дивно... але також свідчить про швидкі темпи ітерації агентів --- Зачекайте, справді 4-кратна різниця? А як інші моделі справляються --- agentic model у цій галузі стає все більш конкурентоспроможною, досягаючи нових висот
Переглянути оригіналвідповісти на0
AirdropChaservip
· 12-26 23:49
grok code 4-кратне переважає другого? Ця різниця дійсно вражає
Переглянути оригіналвідповісти на0
RunWhenCutvip
· 12-26 23:48
Блін, різниця у 4 рази? Це щоб знищити інших, так?
Переглянути оригіналвідповісти на0
BrokenYieldvip
· 12-26 23:46
ngl, 4x лід на лідерборді зазвичай означає, що інші хлопці працюють на пару і зламаних моделях ризику. бачив цей фільм раніше—матриця кореляції руйнується, потім всі усвідомлюють, що вони вимірювали неправильні метрики. grok, ймовірно, просто використовує якусь неефективність протоколу, яку виправлять за 3 місяці.
Переглянути оригіналвідповісти на0
Degen4Breakfastvip
· 12-26 23:39
Різниця у 4x — це дійсно трохи неймовірно. Як Grok Code це зробили?
Переглянути оригіналвідповісти на0
Hash_Banditvip
· 12-26 23:38
4x розрив? Чесно кажучи, це той рівень домінування, який можна побачити лише тоді, коли хтось справді розв’язав щось фундаментальне. Пережив достатньо епох труднощів, щоб розрізняти, коли це справжнє, а коли просто оптимізований хайп
Переглянути оригіналвідповісти на0
Дізнатися більше
  • Закріпити