Est-ce que $NBIS possède maintenant l'inférence la plus rapide au monde sur des appareils $NVDA ?


Nebius a acquis Eigen AI contre de l'argent liquide et des actions, apportant l'inférence d'Eigen et des améliorations post-entraînement directement à l'usine de codes Nebius
Lors de la keynote du GTC 2026 de NVIDIA, Eigen AI a occupé la première place en vitesse de sortie pour Kimi K2.5 Reasoning, tandis que Nebius Fast était sur le point de l'égaler
De plus, Nebius Fast occupe également la première place en vitesse d'inférence sur des appareils $643M pour le modèle ChatGPT open source, gpt-oss-120B
En outre, Eigen a dominé le classement en tant que fournisseur basé sur GPU pour 25 modèles open source sur Artificial Analysis, à l'exception des fournisseurs ASIC, sous les paramètres d'entrée par défaut de 10K. Il est également le fournisseur le plus rapide pour Qwen3 Coder 480B, à 255,8 T/s, surpassant Google Vertex à 169,2 T/s et Amazon à 121,3 T/s
Cela signifie qu'Eigen est environ 51 % plus rapide que Google Vertex et plus de deux fois plus rapide qu'Amazon selon ce standard
━━━━━━━━━━━━━━━━━━━━
Bien que le coût de l'acquisition semble élevé, si Eigen parvient vraiment à améliorer la performance de $NVDA en inférence, même légèrement, cela aura un effet composé sur les bénéfices et la position concurrentielle à long terme, ce qui pourrait couvrir davantage ses coûts
━━━━━━━━━━━━━━━━━━━━
Nebius possède un cloud GPU, tandis qu'Eigen améliore l'efficacité de ces GPUs dans la génération de codes. Sur les mêmes appareils NVIDIA, la performance ne concerne pas seulement les dépenses en capital. Il s'agit d'utiliser le GPU, d'améliorer le modèle, de faire de l'agrégation, de réduire la latence, de gérer la mémoire, et des cœurs dédiés
La pile Eigen se concentre sur des domaines tels que la quantification, l'optimisation du cache KV, la différenciation, le décodage inférentiel, les cœurs CUDA et Triton dédiés, l'agrégation continue, et l'optimisation du temps d'exécution
Si Nebius peut générer plus avec une inférence plus élevée sur les mêmes appareils NVIDIA, cela renforce la capacité de revenus, le coût par code, et la marge brute sans avoir besoin d'augmenter proportionnellement les dépenses en capital
$NBIS est en voie de devenir une entreprise générant plusieurs milliards de dollars de revenus annuels, ce qui signifie que même quelques points de pourcentage d'amélioration de l'inférence peuvent se traduire par des centaines de millions d'économies
━━━━━━━━━━━━━━━━━━━━
Les modèles open source progressent rapidement. Kimi, Qwen, DeepSeek, GLM, Llama, Nemotron, MiniMax, et d'autres modèles nécessitent des améliorations continues pour rester compétitifs
En intégrant Eigen, Nebius peut également publier des versions améliorées plus rapidement et rendre l'usine de codes plus attrayante pour les développeurs et les clients institutionnels #USSeeksStrategicBitcoinReserve
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler