2025-12-26 23:23:05

Grok Code alcança o primeiro lugar na Classificação do Modelo Agente Kilo — e a diferença nem sequer é próxima. Os números contam a história: 35,6B de tokens em uso, esmagando o segundo lugar por mais de 4x. Isto não é apenas mais uma vitória em benchmarks. Sinaliza como os modelos agentic estão a evoluir, e a diferença de desempenho é evidente. Quando uma implementação se destaca tanto nas classificações, geralmente significa que algo está a funcionar a um nível fundamentalmente diferente. A conclusão? A IA agentic está a tornar-se cada vez mais competitiva, e o padrão técnico continua a subir para o que é considerado o estado da arte.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

15 gostos

Recompensa
15
8
Republicar
Partilhar

Comentar

0/400

TokenDustCollector

· 3h atrás

4x diferença? Isso é absurdo, o Grok Code é realmente incrível

Ver originalResponder0

LiquidationOracle

· 12-27 11:15

4 vezes de diferença? Grok Code vai dominar o agentai mesmo

Ver originalResponder0

GasFeeVictim

· 12-26 23:53

4 vezes de diferença? Este rapaz deve estar a usar truques --- grok code desta vez realmente quebrou, 35.6B tokens a esmagar --- A diferença no ranking é tão grande, é um pouco absurdo... mas também mostra que a área do agent está realmente a evoluir rapidamente --- Espera aí, é mesmo 4 vezes? Como é que os outros modelos se safaram --- O setor do agentic model está a ficar cada vez mais competitivo, a atingir novos patamares

Ver originalResponder0

AirdropChaser

· 12-26 23:49

grok code 4x esmagar o segundo lugar? Essa diferença é realmente impressionante

Ver originalResponder0

RunWhenCut

· 12-26 23:48

Droga, uma diferença de 4 vezes? Isto vai esmagar os outros até à morte

Ver originalResponder0

BrokenYield

· 12-26 23:46

ngl, 4x liderança numa tabela de classificação geralmente significa que os outros estão a operar com vapor e modelos de risco quebrados. já vi este filme antes—a matriz de correlação colapsa, e então todos percebem que estavam a medir as métricas erradas. a grok provavelmente está apenas a explorar alguma ineficiência do protocolo que será corrigida em 3 meses.

Ver originalResponder0

Degen4Breakfast

· 12-26 23:39

4x de diferença, isto é mesmo um pouco absurdo. Como é que o Grok Code conseguiu isto?

Ver originalResponder0

Hash_Bandit

· 12-26 23:38

4x gap? honestamente, é o tipo de domínio que só se vê quando alguém realmente resolveu algo fundamental. passei por epochs de dificuldade suficientes para saber quando é real vs apenas hype otimizado

Ver originalResponder0