Poder de computação como um novo modelo de negócio, como se virar após a onda de "refinamento" de grandes modelos?
Recentemente, utilizando dados meteorológicos globais de 40 anos e 200 placas de GPU para um pré-treinamento de cerca de 2 meses, um grande modelo meteorológico com uma quantidade de parâmetros na casa das centenas de milhões foi criado. Essa é a experiência de um jovem que se formou na Universidade de Tsinghua há 3 anos ao treinar um grande modelo.
Do ponto de vista dos custos, ao calcular a 7,8 yuan/hora por GPU, o custo de treinamento deste grande modelo meteorológico pode ultrapassar 2 milhões de yuan. E se o que está sendo treinado for um grande modelo geral, o custo pode aumentar cem vezes.
Os dados mostram que a China já possui mais de 100 grandes modelos com uma escala de 10 bilhões de parâmetros. No entanto, a "alquimia" dos grandes modelos que estão a ser desenvolvidos pela indústria enfrenta a dificuldade da escassez de GPUs de alta gama. O custo do poder de computação continua elevado, e a falta de poder de computação e financiamento tornou-se o problema mais evidente que a indústria enfrenta.
Escassez de GPU de alta gama
"De fato, há uma grande escassez, mas não podemos fazer nada a respeito." Assim respondeu um alto executivo de uma grande empresa ao problema da escassez de GPUs.
Isto parece ter-se tornado um problema reconhecido na indústria. Durante os períodos de pico, o preço de uma placa A100 da Nvidia foi especulado para 200.000-300.000 yuan, e o aluguer mensal de um servidor A100 também disparou para 50.000-70.000 yuan. Mesmo assim, um preço elevado não garante a compra do chip, e alguns fornecedores de poder de computação até encontraram situações raras de incumprimento por parte dos fornecedores.
Um executivo da indústria de computação em nuvem também afirmou: "A falta de poder de computação realmente existe. Muitos clientes desejam recursos de GPU de alta gama, mas atualmente não conseguimos satisfazer completamente a ampla demanda do mercado."
A escassez de GPUs de alta gama a curto prazo é difícil de resolver em toda a indústria. A onda de grandes modelos fez com que a demanda por Poder de computação no mercado crescesse rapidamente, mas a taxa de crescimento da oferta está muito aquém. Embora, a longo prazo, a oferta de Poder de computação inevitavelmente se transforme de um mercado de vendedores para um mercado de compradores, a duração desse processo ainda é uma incógnita.
As empresas estão calculando quantas GPUs da Nvidia possuem, e com isso determinam sua participação de mercado. Fontes informadas dão o exemplo de que se alguém tem cerca de 10.000 placas e o total do mercado é de 100.000, a participação é de 10%. "Até o final do ano, o número de unidades pode chegar a 40.000, se o total do mercado for de 200.000, isso pode representar 20% da participação de mercado."
De um lado, é impossível comprar placas GPU, do outro, o custo do treinamento de grandes modelos não é tão fácil de acessar como a indústria promove. O custo de treinamento do grande modelo meteorológico mencionado anteriormente pode ultrapassar 2 milhões de yuans, mas é importante notar que isso se refere ao treinamento de um modelo de domínio vertical baseado em um grande modelo genérico, com uma escala de parâmetros na casa dos milhões. Se quisermos treinar um grande modelo genérico com um bilhão ou mais de parâmetros, o custo pode aumentar dez vezes ou até cem vezes.
Um executivo de uma empresa de tecnologia revelou: "Atualmente, o maior investimento é em treinamento de modelos, sem um investimento de dezenas de bilhões de capital, é muito difícil continuar a expandir os modelos."
Um empreendedor descreveu assim a atual competição entre grandes modelos: "Para correr rápido, é necessário ter resultados antes que o financiamento se esgote para conseguir a próxima rodada de 'financiamento'. Se não houver apoio de centenas de milhões ou bilhões, será difícil seguir por esse caminho."
Neste cenário, é amplamente considerado na indústria que, com a competição no mercado dos grandes modelos, o mercado também passará de uma fase de euforia para uma fase de racionalidade, e as empresas ajustarão custos e estratégias de acordo com as mudanças nas expectativas.
Medidas ativas para enfrentar a escassez de poder de computação
Não há condições, mas devemos criar condições - esta parece ser a mentalidade da maioria dos participantes de grandes modelos. As empresas estão todas à procura de maneiras de lidar com problemas que realmente existem.
Devido à escassez de chips GPU de alta gama e ao fato de que os GPUs disponíveis no mercado chinês não são da última geração, com desempenho geralmente mais baixo, as empresas precisam de mais tempo para treinar grandes modelos. Essas empresas também estão à procura de métodos inovadores para compensar a falta de Poder de computação.
Uma das abordagens é treinar com dados de maior qualidade, aumentando assim a eficiência do treinamento. Um relatório do setor publicado recentemente sugere a introdução de rotulagem e verificação manual na qualidade dos dados, selecionando uma certa proporção dos dados brutos para rotulagem, a fim de construir um conjunto de dados de alta qualidade.
Além de reduzir os custos do grande modelo através de dados de alta qualidade, melhorar a capacidade da infraestrutura e garantir uma operação estável acima de mil calorias por duas semanas sem falhas, também é um dos desafios técnicos e direções de otimização.
Um executivo de um provedor de serviços em nuvem afirmou: "Como provedor de serviços em nuvem, ajudamos os clientes a construir uma infraestrutura estável e confiável. Devido à instabilidade dos servidores GPU, qualquer falha pode resultar em interrupções no treinamento, aumentando o tempo total de treinamento. Um cluster de computação de alto desempenho pode oferecer aos clientes um serviço mais estável, reduzindo relativamente o tempo de treinamento e resolvendo parte dos problemas de Poder de computação."
Ao mesmo tempo, o agendamento de recursos de cartões de computação também testa a capacidade técnica dos prestadores de serviços. Um responsável por soluções de internet disse: "Possuir recursos de cartões de computação é apenas uma parte, como agendar os recursos do cartão e realmente colocá-los em uso é a verdadeira capacidade central e capacidade de engenharia que representa um desafio maior. Dividir um cartão em vários cartões menores e realizar um agendamento distribuído e refinado pode reduzir ainda mais o custo de computação."
A rede também afeta a velocidade e a eficiência do treinamento de grandes modelos. O treinamento de grandes modelos geralmente requer milhares de placas GPU, conectando centenas de servidores GPU, o que exige uma velocidade de rede extremamente alta; a congestão da rede pode afetar seriamente a velocidade e a eficiência do treinamento.
Alguns fornecedores estão a explorar novos caminhos, mudando da arquitetura de computação em nuvem para a arquitetura de supercomputação como uma forma de reduzir custos. Satisfazendo as necessidades dos utilizadores, para tarefas de computação não de alto rendimento e cenários de tarefas paralelas, o preço da nuvem de supercomputação é cerca de metade do da supercomputação em nuvem, e através da otimização de desempenho é possível aumentar a taxa de utilização de recursos de 30% para 60%.
Além disso, alguns fabricantes optam por usar plataformas nacionais para treinamento e inferência de grandes modelos, em substituição às escassas GPUs da Nvidia. Um executivo de uma empresa afirmou que a máquina integrada que lançaram em conjunto com a Huawei pode realizar treinamento e inferência em plataformas nacionais, e o desempenho da GPU da Huawei já é comparável ao da Nvidia.
Cada um dos métodos mencionados é um projeto considerável, e geralmente é difícil para as empresas atender às necessidades através da construção de seus próprios centros de dados. Muitas equipes de algoritmos optam por contar com o suporte de fornecedores especializados em poder de computação. O armazenamento paralelo também representa um grande desafio em termos de custo e tecnologia. Além disso, é necessário considerar os custos operacionais, como os custos de energia das zonas de disponibilidade do IDC, os custos da plataforma de software e os custos de pessoal.
Apenas um cluster de GPU de nível quilocaloria pode alcançar a economia de escala; escolher um fornecedor de poder de computação significa que o custo marginal tende a zero.
Um acadêmico apontou que a AIGC trouxe uma explosão na indústria de inteligência artificial, enquanto a aplicação em grande escala de tecnologias inteligentes enfrenta um típico problema de cauda longa. Os setores, instituições de pesquisa e grandes e médias empresas com forte capacidade de IA representam apenas cerca de 20% da demanda por poder de computação, enquanto os outros 80% são pequenas e microempresas. Esses sujeitos, limitados por escala e orçamento, muitas vezes têm dificuldade em obter recursos de poder de computação ou são restringidos por preços elevados, dificultando a obtenção dos benefícios do desenvolvimento na era da IA.
Portanto, para realizar a aplicação em larga escala da tecnologia inteligente, tornando a indústria de inteligência artificial tanto "aplaudida" quanto "reconhecida", é necessário um grande volume de poder de computação acessível e fácil de usar, para que pequenas e médias empresas possam também utilizar o poder de computação de forma conveniente e a baixo custo.
Quer seja a necessidade urgente de poder de computação pelos grandes modelos, quer os vários problemas a serem resolvidos no processo de aplicação do poder de computação, tudo reflete uma nova mudança: o poder de computação tornou-se um novo modelo de serviço no processo de demanda de mercado e iteração tecnológica.
Explorar um novo modelo de serviços de Poder de computação
O que é exatamente o poder de computação dos grandes modelos que estamos competindo? Para responder a esta pergunta, precisamos começar pelos serviços de poder de computação.
Poder de computação divide-se em poder de computação geral, poder de computação inteligente e poder de computação super, e esses poderes de computação tornam-se um serviço, resultado da dupla dinâmica de mercado e tecnologia.
Um white paper da indústria define os serviços de poder de computação como: um novo campo da indústria de poder de computação baseado em poder de computação diversificado, ligado por uma rede de poder de computação, com o objetivo de fornecer poder de computação eficaz.
O serviço de poder de computação é, na essência, a realização da saída unificada de poder de computação heterogêneo por meio de novas tecnologias de computação, e a fusão cruzada com tecnologias como nuvem, big data e IA. O serviço de poder de computação não apenas inclui poder de computação, mas também é um pacote unificado de recursos como poder de computação, armazenamento e rede, para ser entregue sob a forma de serviço (, como API ).
Entendendo isso, você perceberá que uma grande parte da disputa pelos chips da Nvidia é dos provedores de serviços de poder de computação, ou seja, produtores de poder de computação. Os usuários do setor que realmente chamam a API de poder de computação na frente, precisam apenas apresentar a demanda correspondente de poder de computação.
De acordo com informações, do ponto de vista do software, a utilização de grandes modelos em todas as interações de software é dividida em três tipos: primeiro, chamadas de API de grandes modelos, cada empresa tem preços, com liquidação por preço; segundo, pequenos modelos próprios, compra de poder de computação, ou até mesmo implantação própria; terceiro, colaboração entre fornecedores de grandes modelos e fornecedores de nuvem, ou seja, nuvem dedicada, com pagamento mensal. Um executivo de uma empresa de software de escritório afirmou que eles usam principalmente chamadas de API, enquanto o pequeno modelo interno é construído em uma plataforma de agendamento de poder de computação.
Ou seja, na estrutura da cadeia industrial de poder de computação, as empresas upstream são responsáveis principalmente por fornecer recursos de suporte para serviços de poder de computação, como poder de computação geral, poder de computação inteligente, poder de computação super e armazenamento e rede. Por exemplo, na disputa por poder de computação de grandes modelos, a NVIDIA é considerada um fornecedor de recursos básicos de poder de computação upstream, fornecendo chips para a indústria.
As empresas de meio de cadeia são principalmente prestadores de serviços em nuvem e novos prestadores de serviços de poder de computação. Elas realizam a produção de poder de computação através de tecnologias de orquestração, agendamento e negociação de poder de computação, e completam o fornecimento de poder de computação através de APIs e outros meios. Quanto mais forte for a capacidade de serviço das empresas de meio de cadeia de serviços de poder de computação, menor será o limiar para as partes aplicativas, o que ajuda ao desenvolvimento inclusivo e ubíquo do poder de computação.
As empresas downstream dependem do poder de computação fornecido pelos serviços de computação para produzir serviços de valor agregado, como os usuários da indústria. Esses usuários apenas precisam apresentar suas necessidades, e os produtores de poder de computação configuram o poder de computação correspondente de acordo com a demanda para completar as "tarefas de poder de computação" atribuídas pelos usuários.
Isto tem mais vantagens de custo e técnicas do que comprar servidores para construir um ambiente de poder de computação de grandes modelos.
Poder de computação modelo de negócios iteração
Tomando como exemplo um modelo geral lançado anteriormente, de acordo com informações públicas, ele utilizou vários provedores de serviços de poder de computação de IA mainstream no país. Fontes informadas afirmaram que, teoricamente, pode ter utilizado todos os provedores de serviços de poder de computação / provedores de serviços em nuvem mainstream.
A cobrança por uso e a cobrança anual ou mensal são os modelos principais de serviços de poder de computação atualmente, e as necessidades de uso podem ser divididas em duas categorias: a primeira é escolher a instância de serviço de poder de computação correspondente, como um provedor de serviços em nuvem que oferece servidores GPU de alto desempenho com as três principais placas gráficas, a saber, Nvidia A800, A100 e V100; a segunda é escolher a plataforma de serviço MaaS correspondente, na qual os grandes modelos são ajustados para setores específicos.
Atualmente, a indústria também está a promover a "integração e fusão da rede de computação", através de um julgamento abrangente das informações sobre tarefas de computação, estado dos recursos da rede de computação, entre outros, formando um plano de orquestração da rede de computação que suporta agendamento entre diferentes arquiteturas, regiões e prestadores de serviços, e completando o despliegue de recursos relacionados. Por exemplo, basta depositar fundos antecipadamente para poder chamar livremente nas divisões da rede de computação, escolhendo a divisão mais adequada, rápida ou com melhor relação custo-benefício, de acordo com as características da aplicação, e cobrando com base na duração, deduzindo os custos dos fundos depositados.
Os provedores de serviços em nuvem também são assim, os serviços de poder de computação como um produto único de serviços em nuvem, permitem que eles participem rapidamente na cadeia industrial de poder de computação.
Os dados do Ministério da Indústria e Tecnologia da Informação mostram que, em 2022, a escala total de poder de computação da China alcançou 180 EFLOPS, ocupando o segundo lugar no mundo. Até 2022, a escala da indústria de poder de computação da China já alcançou 1,8 trilhões de yuan. O poder de computação dos grandes modelos acelerou em grande medida o desenvolvimento da indústria de poder de computação.
Há opiniões que afirmam que os serviços de poder de computação atuais são, na verdade, um novo modelo de "venda de eletricidade". Apenas, dependendo da divisão do trabalho, alguns prestadores de serviços de poder de computação podem precisar fornecer aos usuários mais ajustes de desempenho do sistema, instalação de software, monitoramento de operações em larga escala e análise de características de funcionamento, entre outros serviços de manutenção da última milha.
Com a normalização da demanda por computação de alto desempenho de grandes modelos, os serviços de poder de computação, originados dos serviços de nuvem, rapidamente entraram na visão do público, formando uma cadeia industrial e um modelo de negócios únicos. No entanto, no início da explosão da indústria de poder de computação devido aos grandes modelos, a escassez de GPUs de alto desempenho, o alto custo do poder de computação e a disputa por chips formaram a paisagem única desta era.
Fontes informadas comentam: "Atualmente, a competição é entre quem pode obter placas GPU na cadeia de suprimentos, a NVIDIA é a atual rainha da indústria, controlando todo o mercado, essa é a situação." Em um cenário de escassez, quem conseguir obter placas GPU, conseguirá entregar negócios.
Mas nem todos estão competindo por placas GPU, pois a escassez é temporária e o problema será resolvido. "Os pesquisadores de longo prazo na verdade não estão apressados para comprar, podem esperar normalmente, pois não vão falir. Agora, quem realmente está comprando placas GPU são principalmente startups, que precisam garantir que conseguirão sobreviver até o próximo ano. " afirmou a pessoa mencionada.
Em meio a tantas incertezas, o Poder de computação se torna uma tendência certa como um serviço. Os prestadores de serviços de Poder de computação precisam se preparar com antecedência para quando os grandes modelos retornarem à racionalidade e as direções do mercado mudarem rapidamente.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
12 Curtidas
Recompensa
12
4
Compartilhar
Comentário
0/400
FlashLoanPrince
· 14h atrás
Duzentos mil ainda é pouco, é queimar dinheiro.
Ver originalResponder0
FromMinerToFarmer
· 14h atrás
Como é que se pensou em dois milhões? É gastar dinheiro.
Ver originalResponder0
GasFeePhobia
· 14h atrás
Ferrovia de batatas fritas, estou faminto!
Ver originalResponder0
EntryPositionAnalyst
· 14h atrás
Então é isso, tudo se resume a gastar dinheiro, não é?
Oportunidades de grandes modelos em um cenário de escassez de poder de computação: surgimento de novos modelos de serviços de poder de computação
Poder de computação como um novo modelo de negócio, como se virar após a onda de "refinamento" de grandes modelos?
Recentemente, utilizando dados meteorológicos globais de 40 anos e 200 placas de GPU para um pré-treinamento de cerca de 2 meses, um grande modelo meteorológico com uma quantidade de parâmetros na casa das centenas de milhões foi criado. Essa é a experiência de um jovem que se formou na Universidade de Tsinghua há 3 anos ao treinar um grande modelo.
Do ponto de vista dos custos, ao calcular a 7,8 yuan/hora por GPU, o custo de treinamento deste grande modelo meteorológico pode ultrapassar 2 milhões de yuan. E se o que está sendo treinado for um grande modelo geral, o custo pode aumentar cem vezes.
Os dados mostram que a China já possui mais de 100 grandes modelos com uma escala de 10 bilhões de parâmetros. No entanto, a "alquimia" dos grandes modelos que estão a ser desenvolvidos pela indústria enfrenta a dificuldade da escassez de GPUs de alta gama. O custo do poder de computação continua elevado, e a falta de poder de computação e financiamento tornou-se o problema mais evidente que a indústria enfrenta.
Escassez de GPU de alta gama
"De fato, há uma grande escassez, mas não podemos fazer nada a respeito." Assim respondeu um alto executivo de uma grande empresa ao problema da escassez de GPUs.
Isto parece ter-se tornado um problema reconhecido na indústria. Durante os períodos de pico, o preço de uma placa A100 da Nvidia foi especulado para 200.000-300.000 yuan, e o aluguer mensal de um servidor A100 também disparou para 50.000-70.000 yuan. Mesmo assim, um preço elevado não garante a compra do chip, e alguns fornecedores de poder de computação até encontraram situações raras de incumprimento por parte dos fornecedores.
Um executivo da indústria de computação em nuvem também afirmou: "A falta de poder de computação realmente existe. Muitos clientes desejam recursos de GPU de alta gama, mas atualmente não conseguimos satisfazer completamente a ampla demanda do mercado."
A escassez de GPUs de alta gama a curto prazo é difícil de resolver em toda a indústria. A onda de grandes modelos fez com que a demanda por Poder de computação no mercado crescesse rapidamente, mas a taxa de crescimento da oferta está muito aquém. Embora, a longo prazo, a oferta de Poder de computação inevitavelmente se transforme de um mercado de vendedores para um mercado de compradores, a duração desse processo ainda é uma incógnita.
As empresas estão calculando quantas GPUs da Nvidia possuem, e com isso determinam sua participação de mercado. Fontes informadas dão o exemplo de que se alguém tem cerca de 10.000 placas e o total do mercado é de 100.000, a participação é de 10%. "Até o final do ano, o número de unidades pode chegar a 40.000, se o total do mercado for de 200.000, isso pode representar 20% da participação de mercado."
De um lado, é impossível comprar placas GPU, do outro, o custo do treinamento de grandes modelos não é tão fácil de acessar como a indústria promove. O custo de treinamento do grande modelo meteorológico mencionado anteriormente pode ultrapassar 2 milhões de yuans, mas é importante notar que isso se refere ao treinamento de um modelo de domínio vertical baseado em um grande modelo genérico, com uma escala de parâmetros na casa dos milhões. Se quisermos treinar um grande modelo genérico com um bilhão ou mais de parâmetros, o custo pode aumentar dez vezes ou até cem vezes.
Um executivo de uma empresa de tecnologia revelou: "Atualmente, o maior investimento é em treinamento de modelos, sem um investimento de dezenas de bilhões de capital, é muito difícil continuar a expandir os modelos."
Um empreendedor descreveu assim a atual competição entre grandes modelos: "Para correr rápido, é necessário ter resultados antes que o financiamento se esgote para conseguir a próxima rodada de 'financiamento'. Se não houver apoio de centenas de milhões ou bilhões, será difícil seguir por esse caminho."
Neste cenário, é amplamente considerado na indústria que, com a competição no mercado dos grandes modelos, o mercado também passará de uma fase de euforia para uma fase de racionalidade, e as empresas ajustarão custos e estratégias de acordo com as mudanças nas expectativas.
Medidas ativas para enfrentar a escassez de poder de computação
Não há condições, mas devemos criar condições - esta parece ser a mentalidade da maioria dos participantes de grandes modelos. As empresas estão todas à procura de maneiras de lidar com problemas que realmente existem.
Devido à escassez de chips GPU de alta gama e ao fato de que os GPUs disponíveis no mercado chinês não são da última geração, com desempenho geralmente mais baixo, as empresas precisam de mais tempo para treinar grandes modelos. Essas empresas também estão à procura de métodos inovadores para compensar a falta de Poder de computação.
Uma das abordagens é treinar com dados de maior qualidade, aumentando assim a eficiência do treinamento. Um relatório do setor publicado recentemente sugere a introdução de rotulagem e verificação manual na qualidade dos dados, selecionando uma certa proporção dos dados brutos para rotulagem, a fim de construir um conjunto de dados de alta qualidade.
Além de reduzir os custos do grande modelo através de dados de alta qualidade, melhorar a capacidade da infraestrutura e garantir uma operação estável acima de mil calorias por duas semanas sem falhas, também é um dos desafios técnicos e direções de otimização.
Um executivo de um provedor de serviços em nuvem afirmou: "Como provedor de serviços em nuvem, ajudamos os clientes a construir uma infraestrutura estável e confiável. Devido à instabilidade dos servidores GPU, qualquer falha pode resultar em interrupções no treinamento, aumentando o tempo total de treinamento. Um cluster de computação de alto desempenho pode oferecer aos clientes um serviço mais estável, reduzindo relativamente o tempo de treinamento e resolvendo parte dos problemas de Poder de computação."
Ao mesmo tempo, o agendamento de recursos de cartões de computação também testa a capacidade técnica dos prestadores de serviços. Um responsável por soluções de internet disse: "Possuir recursos de cartões de computação é apenas uma parte, como agendar os recursos do cartão e realmente colocá-los em uso é a verdadeira capacidade central e capacidade de engenharia que representa um desafio maior. Dividir um cartão em vários cartões menores e realizar um agendamento distribuído e refinado pode reduzir ainda mais o custo de computação."
A rede também afeta a velocidade e a eficiência do treinamento de grandes modelos. O treinamento de grandes modelos geralmente requer milhares de placas GPU, conectando centenas de servidores GPU, o que exige uma velocidade de rede extremamente alta; a congestão da rede pode afetar seriamente a velocidade e a eficiência do treinamento.
Alguns fornecedores estão a explorar novos caminhos, mudando da arquitetura de computação em nuvem para a arquitetura de supercomputação como uma forma de reduzir custos. Satisfazendo as necessidades dos utilizadores, para tarefas de computação não de alto rendimento e cenários de tarefas paralelas, o preço da nuvem de supercomputação é cerca de metade do da supercomputação em nuvem, e através da otimização de desempenho é possível aumentar a taxa de utilização de recursos de 30% para 60%.
Além disso, alguns fabricantes optam por usar plataformas nacionais para treinamento e inferência de grandes modelos, em substituição às escassas GPUs da Nvidia. Um executivo de uma empresa afirmou que a máquina integrada que lançaram em conjunto com a Huawei pode realizar treinamento e inferência em plataformas nacionais, e o desempenho da GPU da Huawei já é comparável ao da Nvidia.
Cada um dos métodos mencionados é um projeto considerável, e geralmente é difícil para as empresas atender às necessidades através da construção de seus próprios centros de dados. Muitas equipes de algoritmos optam por contar com o suporte de fornecedores especializados em poder de computação. O armazenamento paralelo também representa um grande desafio em termos de custo e tecnologia. Além disso, é necessário considerar os custos operacionais, como os custos de energia das zonas de disponibilidade do IDC, os custos da plataforma de software e os custos de pessoal.
Apenas um cluster de GPU de nível quilocaloria pode alcançar a economia de escala; escolher um fornecedor de poder de computação significa que o custo marginal tende a zero.
Um acadêmico apontou que a AIGC trouxe uma explosão na indústria de inteligência artificial, enquanto a aplicação em grande escala de tecnologias inteligentes enfrenta um típico problema de cauda longa. Os setores, instituições de pesquisa e grandes e médias empresas com forte capacidade de IA representam apenas cerca de 20% da demanda por poder de computação, enquanto os outros 80% são pequenas e microempresas. Esses sujeitos, limitados por escala e orçamento, muitas vezes têm dificuldade em obter recursos de poder de computação ou são restringidos por preços elevados, dificultando a obtenção dos benefícios do desenvolvimento na era da IA.
Portanto, para realizar a aplicação em larga escala da tecnologia inteligente, tornando a indústria de inteligência artificial tanto "aplaudida" quanto "reconhecida", é necessário um grande volume de poder de computação acessível e fácil de usar, para que pequenas e médias empresas possam também utilizar o poder de computação de forma conveniente e a baixo custo.
Quer seja a necessidade urgente de poder de computação pelos grandes modelos, quer os vários problemas a serem resolvidos no processo de aplicação do poder de computação, tudo reflete uma nova mudança: o poder de computação tornou-se um novo modelo de serviço no processo de demanda de mercado e iteração tecnológica.
Explorar um novo modelo de serviços de Poder de computação
O que é exatamente o poder de computação dos grandes modelos que estamos competindo? Para responder a esta pergunta, precisamos começar pelos serviços de poder de computação.
Poder de computação divide-se em poder de computação geral, poder de computação inteligente e poder de computação super, e esses poderes de computação tornam-se um serviço, resultado da dupla dinâmica de mercado e tecnologia.
Um white paper da indústria define os serviços de poder de computação como: um novo campo da indústria de poder de computação baseado em poder de computação diversificado, ligado por uma rede de poder de computação, com o objetivo de fornecer poder de computação eficaz.
O serviço de poder de computação é, na essência, a realização da saída unificada de poder de computação heterogêneo por meio de novas tecnologias de computação, e a fusão cruzada com tecnologias como nuvem, big data e IA. O serviço de poder de computação não apenas inclui poder de computação, mas também é um pacote unificado de recursos como poder de computação, armazenamento e rede, para ser entregue sob a forma de serviço (, como API ).
Entendendo isso, você perceberá que uma grande parte da disputa pelos chips da Nvidia é dos provedores de serviços de poder de computação, ou seja, produtores de poder de computação. Os usuários do setor que realmente chamam a API de poder de computação na frente, precisam apenas apresentar a demanda correspondente de poder de computação.
De acordo com informações, do ponto de vista do software, a utilização de grandes modelos em todas as interações de software é dividida em três tipos: primeiro, chamadas de API de grandes modelos, cada empresa tem preços, com liquidação por preço; segundo, pequenos modelos próprios, compra de poder de computação, ou até mesmo implantação própria; terceiro, colaboração entre fornecedores de grandes modelos e fornecedores de nuvem, ou seja, nuvem dedicada, com pagamento mensal. Um executivo de uma empresa de software de escritório afirmou que eles usam principalmente chamadas de API, enquanto o pequeno modelo interno é construído em uma plataforma de agendamento de poder de computação.
Ou seja, na estrutura da cadeia industrial de poder de computação, as empresas upstream são responsáveis principalmente por fornecer recursos de suporte para serviços de poder de computação, como poder de computação geral, poder de computação inteligente, poder de computação super e armazenamento e rede. Por exemplo, na disputa por poder de computação de grandes modelos, a NVIDIA é considerada um fornecedor de recursos básicos de poder de computação upstream, fornecendo chips para a indústria.
As empresas de meio de cadeia são principalmente prestadores de serviços em nuvem e novos prestadores de serviços de poder de computação. Elas realizam a produção de poder de computação através de tecnologias de orquestração, agendamento e negociação de poder de computação, e completam o fornecimento de poder de computação através de APIs e outros meios. Quanto mais forte for a capacidade de serviço das empresas de meio de cadeia de serviços de poder de computação, menor será o limiar para as partes aplicativas, o que ajuda ao desenvolvimento inclusivo e ubíquo do poder de computação.
As empresas downstream dependem do poder de computação fornecido pelos serviços de computação para produzir serviços de valor agregado, como os usuários da indústria. Esses usuários apenas precisam apresentar suas necessidades, e os produtores de poder de computação configuram o poder de computação correspondente de acordo com a demanda para completar as "tarefas de poder de computação" atribuídas pelos usuários.
Isto tem mais vantagens de custo e técnicas do que comprar servidores para construir um ambiente de poder de computação de grandes modelos.
Poder de computação modelo de negócios iteração
Tomando como exemplo um modelo geral lançado anteriormente, de acordo com informações públicas, ele utilizou vários provedores de serviços de poder de computação de IA mainstream no país. Fontes informadas afirmaram que, teoricamente, pode ter utilizado todos os provedores de serviços de poder de computação / provedores de serviços em nuvem mainstream.
A cobrança por uso e a cobrança anual ou mensal são os modelos principais de serviços de poder de computação atualmente, e as necessidades de uso podem ser divididas em duas categorias: a primeira é escolher a instância de serviço de poder de computação correspondente, como um provedor de serviços em nuvem que oferece servidores GPU de alto desempenho com as três principais placas gráficas, a saber, Nvidia A800, A100 e V100; a segunda é escolher a plataforma de serviço MaaS correspondente, na qual os grandes modelos são ajustados para setores específicos.
Atualmente, a indústria também está a promover a "integração e fusão da rede de computação", através de um julgamento abrangente das informações sobre tarefas de computação, estado dos recursos da rede de computação, entre outros, formando um plano de orquestração da rede de computação que suporta agendamento entre diferentes arquiteturas, regiões e prestadores de serviços, e completando o despliegue de recursos relacionados. Por exemplo, basta depositar fundos antecipadamente para poder chamar livremente nas divisões da rede de computação, escolhendo a divisão mais adequada, rápida ou com melhor relação custo-benefício, de acordo com as características da aplicação, e cobrando com base na duração, deduzindo os custos dos fundos depositados.
Os provedores de serviços em nuvem também são assim, os serviços de poder de computação como um produto único de serviços em nuvem, permitem que eles participem rapidamente na cadeia industrial de poder de computação.
Os dados do Ministério da Indústria e Tecnologia da Informação mostram que, em 2022, a escala total de poder de computação da China alcançou 180 EFLOPS, ocupando o segundo lugar no mundo. Até 2022, a escala da indústria de poder de computação da China já alcançou 1,8 trilhões de yuan. O poder de computação dos grandes modelos acelerou em grande medida o desenvolvimento da indústria de poder de computação.
Há opiniões que afirmam que os serviços de poder de computação atuais são, na verdade, um novo modelo de "venda de eletricidade". Apenas, dependendo da divisão do trabalho, alguns prestadores de serviços de poder de computação podem precisar fornecer aos usuários mais ajustes de desempenho do sistema, instalação de software, monitoramento de operações em larga escala e análise de características de funcionamento, entre outros serviços de manutenção da última milha.
Com a normalização da demanda por computação de alto desempenho de grandes modelos, os serviços de poder de computação, originados dos serviços de nuvem, rapidamente entraram na visão do público, formando uma cadeia industrial e um modelo de negócios únicos. No entanto, no início da explosão da indústria de poder de computação devido aos grandes modelos, a escassez de GPUs de alto desempenho, o alto custo do poder de computação e a disputa por chips formaram a paisagem única desta era.
Fontes informadas comentam: "Atualmente, a competição é entre quem pode obter placas GPU na cadeia de suprimentos, a NVIDIA é a atual rainha da indústria, controlando todo o mercado, essa é a situação." Em um cenário de escassez, quem conseguir obter placas GPU, conseguirá entregar negócios.
Mas nem todos estão competindo por placas GPU, pois a escassez é temporária e o problema será resolvido. "Os pesquisadores de longo prazo na verdade não estão apressados para comprar, podem esperar normalmente, pois não vão falir. Agora, quem realmente está comprando placas GPU são principalmente startups, que precisam garantir que conseguirão sobreviver até o próximo ano. " afirmou a pessoa mencionada.
Em meio a tantas incertezas, o Poder de computação se torna uma tendência certa como um serviço. Os prestadores de serviços de Poder de computação precisam se preparar com antecedência para quando os grandes modelos retornarem à racionalidade e as direções do mercado mudarem rapidamente.