2025-12-26 23:23:05

Grok Code ocupa el primer puesto en la clasificación del Modelo Agente Kilo, y la diferencia no es ni siquiera cercana. Los números cuentan la historia: 35.6B de tokens en uso, aplastando a la segunda posición por más de 4 veces. Esto no es solo otra victoria en un benchmark. Señala cómo los modelos agentic están evolucionando, y la diferencia en rendimiento es evidente. Cuando una implementación avanza tanto en las clasificaciones, generalmente significa que algo está funcionando a un nivel fundamentalmente diferente. ¿La conclusión? La IA agentic se está volviendo cada vez más competitiva, y la barra técnica sigue subiendo para lo que se considera lo más avanzado.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

14 me gusta

Recompensa
14
7
Republicar
Compartir

Comentar

0/400

LiquidationOracle

· hace23h

¿Una diferencia de 4 veces? Grok Code va a dominar agentai.

Ver originalesResponder0

GasFeeVictim

· 12-26 23:53

¿Una diferencia de 4 veces? Este tipo seguramente está haciendo trampas --- grok code esta vez realmente se rompió, 35.6B tokens aplastaron directamente --- La brecha en la clasificación es tan grande, es un poco exagerado... pero también indica que el área de agent realmente está en rápida iteración --- Espera, ¿de verdad 4 veces? ¿Cómo se las arreglaron los otros modelos? --- El modelo agentic en esta carrera se está volviendo cada vez más competitivo, alcanzando nuevos niveles

Ver originalesResponder0

AirdropChaser

· 12-26 23:49

¿Grok code 4 veces aplasta al segundo? La diferencia es realmente asombrosa

Ver originalesResponder0

RunWhenCut

· 12-26 23:48

Vaya, ¿una diferencia de 4 veces? Esto va a arrasar con los demás.

Ver originalesResponder0

BrokenYield

· 12-26 23:46

Ngl, 4x de ventaja en una tabla de clasificación generalmente significa que los otros están funcionando con vapor y modelos de riesgo rotos. He visto esta película antes: la matriz de correlación colapsa, y luego todos se dan cuenta de que estaban midiendo las métricas equivocadas. Grok probablemente solo está explotando alguna ineficiencia del protocolo que será corregida en 3 meses.

Ver originalesResponder0

Degen4Breakfast

· 12-26 23:39

La diferencia de 4x, esto realmente es un poco exagerado. ¿Cómo logró Grok Code esto?

Ver originalesResponder0

Hash_Bandit

· 12-26 23:38

¿Brecha de 4x? Para ser honesto, esa es la clase de dominio que solo ves cuando alguien ha resuelto algo fundamental. He pasado por suficientes épocas de dificultad para saber cuándo es real versus solo publicidad optimizada.

Ver originalesResponder0