Grok Code ocupa el primer puesto en la clasificación del Modelo Agente Kilo, y la diferencia no es ni siquiera cercana. Los números cuentan la historia: 35.6B de tokens en uso, aplastando a la segunda posición por más de 4 veces. Esto no es solo otra victoria en un benchmark. Señala cómo los modelos agentic están evolucionando, y la diferencia en rendimiento es evidente. Cuando una implementación avanza tanto en las clasificaciones, generalmente significa que algo está funcionando a un nivel fundamentalmente diferente. ¿La conclusión? La IA agentic se está volviendo cada vez más competitiva, y la barra técnica sigue subiendo para lo que se considera lo más avanzado.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
14 me gusta
Recompensa
14
7
Republicar
Compartir
Comentar
0/400
LiquidationOracle
· hace23h
¿Una diferencia de 4 veces? Grok Code va a dominar agentai.
Ver originalesResponder0
GasFeeVictim
· 12-26 23:53
¿Una diferencia de 4 veces? Este tipo seguramente está haciendo trampas
---
grok code esta vez realmente se rompió, 35.6B tokens aplastaron directamente
---
La brecha en la clasificación es tan grande, es un poco exagerado... pero también indica que el área de agent realmente está en rápida iteración
---
Espera, ¿de verdad 4 veces? ¿Cómo se las arreglaron los otros modelos?
---
El modelo agentic en esta carrera se está volviendo cada vez más competitivo, alcanzando nuevos niveles
Ver originalesResponder0
AirdropChaser
· 12-26 23:49
¿Grok code 4 veces aplasta al segundo? La diferencia es realmente asombrosa
Ver originalesResponder0
RunWhenCut
· 12-26 23:48
Vaya, ¿una diferencia de 4 veces? Esto va a arrasar con los demás.
Ver originalesResponder0
BrokenYield
· 12-26 23:46
Ngl, 4x de ventaja en una tabla de clasificación generalmente significa que los otros están funcionando con vapor y modelos de riesgo rotos. He visto esta película antes: la matriz de correlación colapsa, y luego todos se dan cuenta de que estaban midiendo las métricas equivocadas. Grok probablemente solo está explotando alguna ineficiencia del protocolo que será corregida en 3 meses.
Ver originalesResponder0
Degen4Breakfast
· 12-26 23:39
La diferencia de 4x, esto realmente es un poco exagerado. ¿Cómo logró Grok Code esto?
Ver originalesResponder0
Hash_Bandit
· 12-26 23:38
¿Brecha de 4x? Para ser honesto, esa es la clase de dominio que solo ves cuando alguien ha resuelto algo fundamental. He pasado por suficientes épocas de dificultad para saber cuándo es real versus solo publicidad optimizada.
Grok Code ocupa el primer puesto en la clasificación del Modelo Agente Kilo, y la diferencia no es ni siquiera cercana. Los números cuentan la historia: 35.6B de tokens en uso, aplastando a la segunda posición por más de 4 veces. Esto no es solo otra victoria en un benchmark. Señala cómo los modelos agentic están evolucionando, y la diferencia en rendimiento es evidente. Cuando una implementación avanza tanto en las clasificaciones, generalmente significa que algo está funcionando a un nivel fundamentalmente diferente. ¿La conclusión? La IA agentic se está volviendo cada vez más competitiva, y la barra técnica sigue subiendo para lo que se considera lo más avanzado.