Você agora possui a inferência mais rápida do mundo em dispositivos $NBIS ?


A Nebius adquiriu a Eigen AI por dinheiro e ações, trazendo a inferência da Eigen e melhorias pós-treinamento diretamente para a fábrica de códigos Nebius
Na palavra-chave do GTC 2026 da NVIDIA, a Eigen AI ficou em primeiro lugar na velocidade de saída para Kimi K2.5 Reasoning, enquanto a Nebius Fast estava prestes a igualá-la
A Nebius Fast também ocupa a primeira posição na velocidade de inferência em dispositivos $NVDA para o modelo de código aberto ChatGPT, gpt-oss-120B
Além disso, a Eigen liderou a classificação como fornecedora confiável de GPU em 25 modelos de código aberto na Artificial Analysis, excluindo fornecedores de ASIC, sob configurações de entrada padrão de 10K. Ela também é a fornecedora mais rápida para Qwen3 Coder 480B, com 255,8 t/s, superando o Google Vertex com 169,2 t/s e a Amazon com 121,3 t/s
Isso significa que a Eigen é aproximadamente 51% mais rápida que o Google Vertex e mais do que o dobro da velocidade da Amazon nesse padrão
━━━━━━━━━━━━━━━━━━━━
Embora o custo da aquisição pareça alto, se a Eigen realmente conseguir melhorar o desempenho de $643M na inferência, mesmo que de forma leve, isso terá um efeito composto sobre os lucros e a posição competitiva a longo prazo, o que provavelmente cobrirá seu custo mais do que isso
━━━━━━━━━━━━━━━━━━━━
A Nebius possui uma nuvem de GPU, enquanto a Eigen melhora a eficiência dessas GPUs na geração de códigos. Nas mesmas máquinas NVIDIA, o desempenho não depende apenas dos custos de capital. Trata-se do uso da GPU, otimização do modelo, agregação, latência, gerenciamento de memória e núcleos dedicados
A pilha da Eigen foca em áreas como quantização, otimização de cache KV, diferenciação, decodificação de inferência, núcleos CUDA e Triton dedicados, agregação contínua e otimização de tempo de execução
Se a Nebius puder gerar mais inferências de maior desempenho usando as mesmas máquinas NVIDIA, isso aumentará a receita, o custo por código e a margem bruta sem precisar aumentar proporcionalmente os custos de capital
$NVDA está a caminho de se tornar uma empresa com receitas anuais de vários bilhões, o que significa que até mesmo alguns pontos percentuais de melhoria na inferência podem se traduzir em centenas de milhões de economias
━━━━━━━━━━━━━━━━━━━━
Modelos de código aberto estão avançando rapidamente. Kimi, Qwen, DeepSeek, GLM, Llama, Nemotron, MiniMax e outros modelos exigem melhorias contínuas para permanecerem competitivos
Ao integrar a Eigen, a Nebius também pode lançar versões aprimoradas mais rapidamente e tornar a fábrica de códigos mais atraente para desenvolvedores e clientes corporativos$NBIS
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar