Grok Code menduduki posisi teratas di Leaderboard Kilo Agentic Model—dan jaraknya bahkan tidak dekat. Angka-angkanya menceritakan semuanya: 35,6Miliar token digunakan, mengalahkan posisi kedua lebih dari 4x lipat. Ini bukan sekadar kemenangan benchmark lainnya. Ini menandakan bagaimana model agentic berkembang, dan perbedaan kinerja sangat mencolok. Ketika satu implementasi melampaui ini jauh di leaderboard, biasanya berarti sesuatu bekerja pada tingkat yang secara fundamental berbeda. Kesimpulannya? AI agentic semakin kompetitif, dan standar teknis terus meningkat untuk apa yang dianggap sebagai teknologi terbaru.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 8
  • Posting ulang
  • Bagikan
Komentar
0/400
TokenDustCollectorvip
· 2jam yang lalu
4x selisih? Ini terlalu jauh, Grok Code benar-benar luar biasa
Lihat AsliBalas0
LiquidationOraclevip
· 12-27 11:15
4x perbedaan? Grok Code ini akan menguasai agentai nih
Lihat AsliBalas0
GasFeeVictimvip
· 12-26 23:53
4 kali lipat perbedaan? Mungkin orang ini cheat nih --- grok code kali ini benar-benar bikin pusing, 35.6B token langsung mengalahkan --- Perbedaan di peringkat ini besar banget, agak aneh... tapi juga menunjukkan bahwa bagian agent memang sedang berkembang pesat --- Tunggu, beneran 4 kali lipat? Lalu model lain gimana caranya bersaing --- agentic model di jalur ini semakin kompetitif, semakin menantang dan mencapai level baru
Lihat AsliBalas0
AirdropChaservip
· 12-26 23:49
grok code 4 kali lipat mengalahkan posisi kedua? Jarak ini memang benar-benar mencengangkan
Lihat AsliBalas0
RunWhenCutvip
· 12-26 23:48
Dasar, selisih 4 kali lipat? Ini mau mengalahkan yang lain sampai mati nih
Lihat AsliBalas0
BrokenYieldvip
· 12-26 23:46
ngl, 4x lead di papan peringkat biasanya berarti orang lain sedang berjalan di atas uap dan model risiko yang rusak. pernah melihat film ini sebelumnya—matriks korelasi runtuh, lalu semua orang menyadari mereka mengukur metrik yang salah. grok mungkin hanya memanfaatkan beberapa ketidakefisienan protokol yang akan diperbaiki dalam 3 bulan.
Lihat AsliBalas0
Degen4Breakfastvip
· 12-26 23:39
4x perbedaan, ini benar-benar agak di luar nalar. Bagaimana Grok Code bisa melakukan ini?
Lihat AsliBalas0
Hash_Banditvip
· 12-26 23:38
4x gap? ngl itu jenis dominasi yang hanya terlihat ketika seseorang benar-benar menyelesaikan sesuatu yang mendasar. telah melalui cukup banyak epoch kesulitan untuk tahu kapan itu nyata vs hanya hype yang dioptimalkan
Lihat AsliBalas0
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)