Grok Code alcança o primeiro lugar na Classificação do Modelo Agente Kilo — e a diferença nem sequer é próxima. Os números contam a história: 35,6B de tokens em uso, esmagando o segundo lugar por mais de 4x. Isto não é apenas mais uma vitória em benchmarks. Sinaliza como os modelos agentic estão a evoluir, e a diferença de desempenho é evidente. Quando uma implementação se destaca tanto nas classificações, geralmente significa que algo está a funcionar a um nível fundamentalmente diferente. A conclusão? A IA agentic está a tornar-se cada vez mais competitiva, e o padrão técnico continua a subir para o que é considerado o estado da arte.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 8
  • Republicar
  • Partilhar
Comentar
0/400
TokenDustCollectorvip
· 3h atrás
4x diferença? Isso é absurdo, o Grok Code é realmente incrível
Ver originalResponder0
LiquidationOraclevip
· 12-27 11:15
4 vezes de diferença? Grok Code vai dominar o agentai mesmo
Ver originalResponder0
GasFeeVictimvip
· 12-26 23:53
4 vezes de diferença? Este rapaz deve estar a usar truques --- grok code desta vez realmente quebrou, 35.6B tokens a esmagar --- A diferença no ranking é tão grande, é um pouco absurdo... mas também mostra que a área do agent está realmente a evoluir rapidamente --- Espera aí, é mesmo 4 vezes? Como é que os outros modelos se safaram --- O setor do agentic model está a ficar cada vez mais competitivo, a atingir novos patamares
Ver originalResponder0
AirdropChaservip
· 12-26 23:49
grok code 4x esmagar o segundo lugar? Essa diferença é realmente impressionante
Ver originalResponder0
RunWhenCutvip
· 12-26 23:48
Droga, uma diferença de 4 vezes? Isto vai esmagar os outros até à morte
Ver originalResponder0
BrokenYieldvip
· 12-26 23:46
ngl, 4x liderança numa tabela de classificação geralmente significa que os outros estão a operar com vapor e modelos de risco quebrados. já vi este filme antes—a matriz de correlação colapsa, e então todos percebem que estavam a medir as métricas erradas. a grok provavelmente está apenas a explorar alguma ineficiência do protocolo que será corrigida em 3 meses.
Ver originalResponder0
Degen4Breakfastvip
· 12-26 23:39
4x de diferença, isto é mesmo um pouco absurdo. Como é que o Grok Code conseguiu isto?
Ver originalResponder0
Hash_Banditvip
· 12-26 23:38
4x gap? honestamente, é o tipo de domínio que só se vê quando alguém realmente resolveu algo fundamental. passei por epochs de dificuldade suficientes para saber quando é real vs apenas hype otimizado
Ver originalResponder0
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)