GPT-5.5「9.7T parámetros」ha sido revisado: después de la corrección, solo quedan aproximadamente 1.5T

robot
Generación de resúmenes en curso

La noticia de CoinWorld informa que los investigadores de IA Lawrence Chan y Benno Sturgeon revisaron el artículo del científico jefe de Pine AI, Li Bojie, titulado «Sonda de conocimiento no compresible: estimación de la cantidad de parámetros de modelos de lenguaje grandes de caja negra basada en la capacidad de hechos».
El artículo original estimaba que GPT-5.5 tenía aproximadamente 9.7T, Claude Opus 4.7 aproximadamente 4.0T, y O1 aproximadamente 3.5T.
La revisión señaló que los números originales estaban inflados debido a los criterios de puntuación y la calidad de las preguntas, especialmente por un manejo inadecuado de la «puntuación de piso», lo que llevó a exagerar la diferencia en el rendimiento de los modelos en problemas de alta dificultad.
Después de eliminar la «puntuación de piso», la pendiente del ajuste descendió de 6.79 a 3.56, el r² de 0.917 a 0.815, y el intervalo de predicción del 90% se amplió de 3.0 veces a 5.7 veces, mostrando un aumento en el error.
La revisión también encontró que 131 preguntas tenían ambigüedades o respuestas incorrectas, lo que representa el 9.4%.
Según los datos corregidos, los parámetros de GPT-5.5 se redujeron de 9659B a 1458B, y el intervalo de predicción del 90% fue de 256B a 8311B.
Los autores de la revisión enfatizaron que 1.5T no puede considerarse como la cantidad real de parámetros de GPT-5.5.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado