Grok Code alcança o primeiro lugar na Classificação do Modelo Agente Kilo — e a diferença nem sequer é próxima. Os números contam a história: 35,6B de tokens em uso, esmagando o segundo lugar por mais de 4x. Isto não é apenas mais uma vitória em benchmarks. Sinaliza como os modelos agentic estão a evoluir, e a diferença de desempenho é evidente. Quando uma implementação se destaca tanto nas classificações, geralmente significa que algo está a funcionar a um nível fundamentalmente diferente. A conclusão? A IA agentic está a tornar-se cada vez mais competitiva, e o padrão técnico continua a subir para o que é considerado o estado da arte.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
15 gostos
Recompensa
15
8
Republicar
Partilhar
Comentar
0/400
TokenDustCollector
· 3h atrás
4x diferença? Isso é absurdo, o Grok Code é realmente incrível
Ver originalResponder0
LiquidationOracle
· 12-27 11:15
4 vezes de diferença? Grok Code vai dominar o agentai mesmo
Ver originalResponder0
GasFeeVictim
· 12-26 23:53
4 vezes de diferença? Este rapaz deve estar a usar truques
---
grok code desta vez realmente quebrou, 35.6B tokens a esmagar
---
A diferença no ranking é tão grande, é um pouco absurdo... mas também mostra que a área do agent está realmente a evoluir rapidamente
---
Espera aí, é mesmo 4 vezes? Como é que os outros modelos se safaram
---
O setor do agentic model está a ficar cada vez mais competitivo, a atingir novos patamares
Ver originalResponder0
AirdropChaser
· 12-26 23:49
grok code 4x esmagar o segundo lugar? Essa diferença é realmente impressionante
Ver originalResponder0
RunWhenCut
· 12-26 23:48
Droga, uma diferença de 4 vezes? Isto vai esmagar os outros até à morte
Ver originalResponder0
BrokenYield
· 12-26 23:46
ngl, 4x liderança numa tabela de classificação geralmente significa que os outros estão a operar com vapor e modelos de risco quebrados. já vi este filme antes—a matriz de correlação colapsa, e então todos percebem que estavam a medir as métricas erradas. a grok provavelmente está apenas a explorar alguma ineficiência do protocolo que será corrigida em 3 meses.
Ver originalResponder0
Degen4Breakfast
· 12-26 23:39
4x de diferença, isto é mesmo um pouco absurdo. Como é que o Grok Code conseguiu isto?
Ver originalResponder0
Hash_Bandit
· 12-26 23:38
4x gap? honestamente, é o tipo de domínio que só se vê quando alguém realmente resolveu algo fundamental. passei por epochs de dificuldade suficientes para saber quando é real vs apenas hype otimizado
Grok Code alcança o primeiro lugar na Classificação do Modelo Agente Kilo — e a diferença nem sequer é próxima. Os números contam a história: 35,6B de tokens em uso, esmagando o segundo lugar por mais de 4x. Isto não é apenas mais uma vitória em benchmarks. Sinaliza como os modelos agentic estão a evoluir, e a diferença de desempenho é evidente. Quando uma implementação se destaca tanto nas classificações, geralmente significa que algo está a funcionar a um nível fundamentalmente diferente. A conclusão? A IA agentic está a tornar-se cada vez mais competitiva, e o padrão técnico continua a subir para o que é considerado o estado da arte.