Escanea para descargar la aplicación Gate
qrCode
Más opciones de descarga
No volver a recordar hoy

Acabo de terminar de probar unos pocos LLM locales en mi máquina. Esto es lo que llamó mi atención:



¿Modelos de razonamiento? Ridículamente lentos. Como, lentos para ir a tomar un café.

En Apple Silicon, GGUF es superado por MLX—mi configuración de 120B MLX realmente supera a un modelo GGUF de 70B. Salvaje.

¿Mistral-7B? Rápido como un rayo para su categoría de peso. No hay competencia allí.

Oh, y estos modelos más grandes están llenos de conocimiento. Es realmente impresionante lo que han absorbido.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Republicar
  • Compartir
Comentar
0/400
MoneyBurnervip
· hace16h
Ha, también he probado eso de que MLX aplasta a GGUF, pero ¿120B contra 70B todavía puede pelear así? Los datos, hay que ver la prueba on-chain antes de construir una posición, de lo contrario son posiciones en corto.
Ver originalesResponder0
SignatureLiquidatorvip
· hace16h
120B MLX mata directamente GGUF, estos datos son demasiado absurdos.
Ver originalesResponder0
ForkYouPayMevip
· hace16h
mlx es realmente increíble, después de cambiarlo nunca volveré a gguf.
Ver originalesResponder0
MetaverseHomelessvip
· hace16h
mlx realmente es increíble, gguf se ha hundido por completo en el chip de Apple
Ver originalesResponder0
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)