Grok Code alcança o primeiro lugar na Classificação do Modelo Agente Kilo — e a diferença nem sequer é próxima. Os números contam a história: 35,6B de tokens em uso, esmagando o segundo lugar por mais de 4x. Isto não é apenas mais uma vitória em benchmarks. Sinaliza como os modelos agentic estão a evoluir, e a diferença de desempenho é evidente. Quando uma implementação se destaca tanto nas classificações, geralmente significa que algo está a funcionar a um nível fundamentalmente diferente. A conclusão? A IA agentic está a tornar-se cada vez mais competitiva, e o padrão técnico continua a subir para o que é considerado o estado da arte.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 10
  • Repostar
  • Compartilhar
Comentário
0/400
ZkSnarkervip
· 2h atrás
Ngl, a diferença de 4x é louca, mas tipo... já testámos realmente isto contra o caos do mundo real? Os rankings são intensos até deixarem de ser, lmao
Ver originalResponder0
MergeConflictvip
· 17h atrás
grok desta vez esmagou diretamente, a diferença de 4 vezes é um pouco absurda
Ver originalResponder0
TokenDustCollectorvip
· 21h atrás
4x diferença? Isso é absurdo, o Grok Code é realmente incrível
Ver originalResponder0
LiquidationOraclevip
· 12-27 11:15
4 vezes de diferença? Grok Code vai dominar o agentai mesmo
Ver originalResponder0
GasFeeVictimvip
· 12-26 23:53
4 vezes de diferença? Este rapaz deve estar a usar truques --- grok code desta vez realmente quebrou, 35.6B tokens a esmagar --- A diferença no ranking é tão grande, é um pouco absurdo... mas também mostra que a área do agent está realmente a evoluir rapidamente --- Espera aí, é mesmo 4 vezes? Como é que os outros modelos se safaram --- O setor do agentic model está a ficar cada vez mais competitivo, a atingir novos patamares
Ver originalResponder0
AirdropChaservip
· 12-26 23:49
grok code 4x esmagar o segundo lugar? Essa diferença é realmente impressionante
Ver originalResponder0
RunWhenCutvip
· 12-26 23:48
Droga, uma diferença de 4 vezes? Isto vai esmagar os outros até à morte
Ver originalResponder0
BrokenYieldvip
· 12-26 23:46
ngl, 4x liderança numa tabela de classificação geralmente significa que os outros estão a operar com vapor e modelos de risco quebrados. já vi este filme antes—a matriz de correlação colapsa, e então todos percebem que estavam a medir as métricas erradas. a grok provavelmente está apenas a explorar alguma ineficiência do protocolo que será corrigida em 3 meses.
Ver originalResponder0
Degen4Breakfastvip
· 12-26 23:39
4x de diferença, isto é mesmo um pouco absurdo. Como é que o Grok Code conseguiu isto?
Ver originalResponder0
Hash_Banditvip
· 12-26 23:38
4x gap? honestamente, é o tipo de domínio que só se vê quando alguém realmente resolveu algo fundamental. passei por epochs de dificuldade suficientes para saber quando é real vs apenas hype otimizado
Ver originalResponder0
Ver projetos
  • Marcar

Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt