Grok Code alcança o primeiro lugar na Classificação do Modelo Agente Kilo — e a diferença nem sequer é próxima. Os números contam a história: 35,6B de tokens em uso, esmagando o segundo lugar por mais de 4x. Isto não é apenas mais uma vitória em benchmarks. Sinaliza como os modelos agentic estão a evoluir, e a diferença de desempenho é evidente. Quando uma implementação se destaca tanto nas classificações, geralmente significa que algo está a funcionar a um nível fundamentalmente diferente. A conclusão? A IA agentic está a tornar-se cada vez mais competitiva, e o padrão técnico continua a subir para o que é considerado o estado da arte.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
19 Curtidas
Recompensa
19
10
Repostar
Compartilhar
Comentário
0/400
ZkSnarker
· 2h atrás
Ngl, a diferença de 4x é louca, mas tipo... já testámos realmente isto contra o caos do mundo real? Os rankings são intensos até deixarem de ser, lmao
Ver originalResponder0
MergeConflict
· 17h atrás
grok desta vez esmagou diretamente, a diferença de 4 vezes é um pouco absurda
Ver originalResponder0
TokenDustCollector
· 21h atrás
4x diferença? Isso é absurdo, o Grok Code é realmente incrível
Ver originalResponder0
LiquidationOracle
· 12-27 11:15
4 vezes de diferença? Grok Code vai dominar o agentai mesmo
Ver originalResponder0
GasFeeVictim
· 12-26 23:53
4 vezes de diferença? Este rapaz deve estar a usar truques
---
grok code desta vez realmente quebrou, 35.6B tokens a esmagar
---
A diferença no ranking é tão grande, é um pouco absurdo... mas também mostra que a área do agent está realmente a evoluir rapidamente
---
Espera aí, é mesmo 4 vezes? Como é que os outros modelos se safaram
---
O setor do agentic model está a ficar cada vez mais competitivo, a atingir novos patamares
Ver originalResponder0
AirdropChaser
· 12-26 23:49
grok code 4x esmagar o segundo lugar? Essa diferença é realmente impressionante
Ver originalResponder0
RunWhenCut
· 12-26 23:48
Droga, uma diferença de 4 vezes? Isto vai esmagar os outros até à morte
Ver originalResponder0
BrokenYield
· 12-26 23:46
ngl, 4x liderança numa tabela de classificação geralmente significa que os outros estão a operar com vapor e modelos de risco quebrados. já vi este filme antes—a matriz de correlação colapsa, e então todos percebem que estavam a medir as métricas erradas. a grok provavelmente está apenas a explorar alguma ineficiência do protocolo que será corrigida em 3 meses.
Ver originalResponder0
Degen4Breakfast
· 12-26 23:39
4x de diferença, isto é mesmo um pouco absurdo. Como é que o Grok Code conseguiu isto?
Ver originalResponder0
Hash_Bandit
· 12-26 23:38
4x gap? honestamente, é o tipo de domínio que só se vê quando alguém realmente resolveu algo fundamental. passei por epochs de dificuldade suficientes para saber quando é real vs apenas hype otimizado
Grok Code alcança o primeiro lugar na Classificação do Modelo Agente Kilo — e a diferença nem sequer é próxima. Os números contam a história: 35,6B de tokens em uso, esmagando o segundo lugar por mais de 4x. Isto não é apenas mais uma vitória em benchmarks. Sinaliza como os modelos agentic estão a evoluir, e a diferença de desempenho é evidente. Quando uma implementação se destaca tanto nas classificações, geralmente significa que algo está a funcionar a um nível fundamentalmente diferente. A conclusão? A IA agentic está a tornar-se cada vez mais competitiva, e o padrão técnico continua a subir para o que é considerado o estado da arte.