Este não é mais um texto entusiasta de VC cor-de-rosa sobre “IA + Web3”. Somos otimistas em relação à fusão de ambas as tecnologias, mas o texto abaixo é um apelo à ação. Caso contrário, o otimismo não será justificado.
Porquê? Porque o desenvolvimento e execução dos melhores modelos de IA requerem despesas de capital significativas no hardware mais avançado e muitas vezes difícil de obter, bem como investigação e desenvolvimento muito específicos do domínio. Atribuir incentivos cripto para obter em crowdsourcing esses modelos, como a maioria dos projetos de IA Web3 estão a fazer, não é suficiente para superar as dezenas de milhares de milhões de dólares investidos por grandes corporações que controlam o desenvolvimento de IA com firmeza. Dadas as restrições de hardware, este pode ser o primeiro grande paradigma de software que engenheiros inteligentes e criativos fora das organizações incumbentes não têm recursos para perturbar.
O software está "comendo o mundo" cada vez mais rápido, logo fadado a decolar exponencialmente com a aceleração da IA. E todo esse "bolo", com a situação atual, vai para os incumbentes de tecnologia - enquanto os usuários finais, incluindo governos e grandes empresas, e muito menos consumidores, tornam-se ainda mais dependentes de seu poder.
Tudo isso não poderia ter acontecido em um momento mais inadequado - com 90% dos participantes da web descentralizada ocupados perseguindo a galinha dos ovos de ouro dos ganhos fáceis de moeda fiduciária impulsionados por narrativas. Sim, os desenvolvedores estão seguindo os investidores em nossa indústria e não o contrário. Varia desde a admissão aberta até motivações mais sutis e subconscientes, mas as narrativas e os mercados formados em torno delas impulsionam muitas tomadas de decisão no Web3. Os participantes estão muito envolvidos em uma bolha reflexiva clássica para perceber o mundo exterior, exceto as narrativas que ajudam a avançar ainda mais esse ciclo. E a IA é obviamente a maior, pois também está passando por um boom próprio.
Falamos com dezenas de equipas na interseção AI x Crypto e podemos confirmar que muitas delas são muito capazes, orientadas por missões e construtores apaixonados. Mas tal é a natureza humana que quando confrontados com tentações tendemos a sucumbir a elas e depois racionalizar essas escolhas pós-facto.
O caminho fácil para a liquidez tem sido uma maldição histórica da indústria de criptomoedas - responsável por retardar seu desenvolvimento e adoção útil em anos neste momento. Isso desvia até os discípulos de criptomoedas mais fiéis para "bombear o token". A racionalização é que, com mais capital à mão na forma de tokens, esses construtores podem ter melhores chances.
A relativa falta de sofisticação tanto do capital institucional quanto do capital de varejo cria oportunidades para os construtores fazerem reivindicações desconectadas da realidade, enquanto ainda se beneficiam de valorações como se essas reivindicações já tivessem se concretizado. O resultado desses processos é um risco moral realmente enraizado e destruição de capital, com muito poucas dessas estratégias funcionando a longo prazo. A necessidade é a mãe de todas as invenções e quando ela se vai, também se vão as invenções.
Não poderia ter acontecido em pior altura. Enquanto todos os empreendedores tecnológicos mais inteligentes, atores estatais e empresas, grandes e pequenas, estão a correr para garantir a sua parte dos benefícios provenientes da revolução da IA, os fundadores e investidores de criptomoedas estão a optar por um “rápido 10x”. Em vez de uma vida inteira de 1000 x, que é o verdadeiro custo de oportunidade aqui, na nossa opinião.
Dado os incentivos acima mencionados, a taxonomia do projeto de IA Web3 na verdade se resume a:
Basicamente, pensamos que os construtores sabem exatamente o que é necessário para acompanhar a concorrência da Web2 e os setores onde é realmente possível competir e onde é mais um sonho impossível, mas que mesmo assim é possível para VCs e público pouco sofisticado.
O objetivo é poder competir aqui e agora. Caso contrário, a velocidade do desenvolvimento da IA pode deixar a Web3 para trás, enquanto o mundo pula para a distópica Web4 da IA corporativa no Ocidente indo contra a IA estatal da China. Aqueles que não conseguem ser competitivos o suficiente e dependem da tecnologia distribuída para recuperar o atraso em um horizonte de tempo mais longo são otimistas demais para serem levados a sério.
Obviamente, isto é uma generalização muito grosseira e até o grupo Gate contém pelo menos algumas equipas sérias (e talvez mais de apenas sonhadores delirantes). Mas este texto é um apelo às armas, por isso não pretendemos ser objetivos, mas sim apelar ao sentido de urgência do leitor[1].
Legítimo:
Semi-legítimo:
O que nenhum dos dois campos acima aborda é o treino e a inferência para grandes modelos em ambientes descentralizados. Neste momento, não há forma de treinar um modelo fundamental num tempo razoável sem depender de clusters de hardware fortemente conectados. O 'tempo razoável' dado o nível de competição é o fator chave.
Alguns pesquisa promissorasobre o tema saiu recentemente e, teoricamente, abordagens como Fluxo de Dados Diferencialpode ser expandido para redes de computação distribuída para aumentar sua capacidade no futuro (à medida que as capacidades de rede alcançam os requisitos de fluxo de dados). Mas o treinamento de modelos competitivos ainda requer comunicação entre clusters localizados, em vez de dispositivos distribuídos únicos, e computação de ponta (as GPUs de varejo estão se tornando cada vez mais não competitivas).
A investigação sobre a localização (uma das duas formas de descentralização) da inferência, reduzindo o tamanho do modelo, também foiprogredindo recentemente, mas não existem protocolos existentes no Web3 que o aproveitem.
Os problemas com treino e inferência descentralizados logicamente levam-nos ao último dos três campos e de longe o mais importante e, portanto, tão emocionalmente desencadeante para nós ;-)
Falsificadores:
Precisamos de um conjunto de modelos fundamentais competitivos e verdadeiramente descentralizados e eles requerem treino e inferência descentralizados para funcionar. Perder a IA pode anular completamente quaisquer conquistas que os “computadores mundiais descentralizados” tenham feito desde o surgimento do Ethereum. Se os computadores se tornarem IA e a IA for centralizada, não haverá nenhum computador mundial para falar, a não ser alguma versão distópica disso.
A formação e inferência são o coração da inovação em IA. Quando o resto do mundo da IA está a mover-se em direção a arquiteturas mais estreitamente ligadas, a Web3 precisa de uma solução ortogonal para competir, porque competir de frente está a tornar-se cada vez menos viável muito rapidamente.
É tudo sobre computação. Quanto mais você aplicar tanto no treinamento quanto na inferência, melhores serão os resultados. Sim, existem ajustes e otimizações aqui e ali e a própria computação não é homogênea - agora há uma grande variedade de novas abordagens para superar os gargalos da arquitetura tradicional de Von Neumann para unidades de processamento - mas ainda assim tudo se resume a quantas multiplicações de matriz você pode fazer em relação ao tamanho de um bloco de memória e quão rápido.
É por isso que estamos testemunhando uma construção tão forte no front de centros de dados pelos chamados "Hyperscalers", que estão todos procurando criar uma pilha completa com uma potência de modelo de IA no topo e hardware que o alimenta por baixo: OpenAI (modelos) + Microsoft (computação), Anthropic (modelos) + AWS (computação), Google (ambos) e Meta (cada vez mais ambos, através do aumento da construção do próprio data center). Há mais nuances, dinâmicas de interação e partes envolvidas, mas vamos deixar de fora. O quadro geral é que os Hyperscalers estão investindo bilhões de dólares, como nunca antes, na construção de centros de dados e estão criando sinergias entre suas ofertas de computação e IA, esperando gerar enormes lucros à medida que a IA se prolifera pela economia global.
Vamos apenas olhar para o nível de implementação esperado apenas este ano das 4 empresas:
E foi isto que já foi gasto em hardware de IA da NVIDIA em 2023:
Jensen Huang, CEO da NVIDIA, tem estado a propor um total de $1tn a ser investido na aceleração da IA nos próximos anos. Uma previsão que fez recentemente dobradopara $2tn, alegadamente motivada pelo interesse que testemunhou por parte dos intervenientes soberanos. Os analistas da Altimeter esperam que os gastos relacionados com IA em datacenters ultrapassem os $160bn e os $200bn a nível global em '24 e '25, respetivamente.
Agora, comparar esses números com o que o Web3 tem a oferecer aos operadores independentes de centros de dados para incentivá-los a expandir o CapEx no hardware de IA mais recente:
Mesmo que peguemos esta estimativa muito aproximada dividida por 3 (anos) e comparemos o valor em dólares disso com o dinheiro gasto apenas pelos Hyperscalers em 2024, fica claro que colocar incentivos de token em um monte de projetos de "rede de GPU descentralizada" não é suficiente.
Também é necessário haver bilhões de dólares em demanda de investidores para absorver esses tokens, já que os operadores de tais redes vendem uma grande parte das moedas mineradas para cobrir os custos significativos de Cap- e OpEX. E alguns bilhões a mais para impulsionar esses tokens e incentivar o crescimento na expansão para superar os Hyperscalers.
No entanto, alguém com conhecimento íntimo de como a maioria dos servidores Web3 são atualmente executados pode esperar que uma grande parte da 'Infraestrutura Física Descentralizada' seja efetivamente executada nos mesmos serviços de nuvem dos Hiperescalers. E, é claro, o aumento na demanda por hardware especializado em GPU e outras IA está impulsionando mais oferta, o que eventualmente deve tornar o aluguel ou compra de nuvem muito mais barato. Pelo menos essa é a expectativa.
Mas também considere isto: neste momento, a NVIDIA precisa de priorizar os clientes para as suas GPUs de última geração. É tambémcomeçando a competircom os maiores fornecedores de nuvem em seu próprio terreno - oferecendo serviços de plataforma de IA a clientes empresariais já presos a esses Hyperscalers. Isso eventualmente incentiva a construir seus próprios data centers ao longo do tempo (essencialmente reduzindo as margens de lucro gordo que estão desfrutando agora, portanto, menos provável) ou limitar significativamente suas vendas de hardware de IA apenas a seus provedores de nuvem parceiros.
Além disso, os concorrentes da NVIDIA que estão a desenvolver hardware adicional especializado em IA estão a usar maioritariamente os mesmos chips que a NVIDIA,produzido pela TSMC.Então, essencialmente, todas as empresas de hardware de IA estão atualmentecompetindo pela capacidade da TSMC.Também a TSMC precisa de priorizar certos clientes em detrimento de outros. A Samsung e potencialmente a Intel (que está a tentar regressar à fabricação de chips de última geração para a sua própria hardware em breve) podem conseguir absorver procura adicional, mas a TSMC está a produzir a maioria dos chips relacionados com a IA no momento e a escalonar e calibrar a fabricação de chips de ponta (3 e 2 nanómetros) leva anos.
Além disso, toda a fabricação de chips de ponta no momento é feita junto ao Estreito de Taiwan pela TSMC em Taiwan e pela Samsung na Coreia do Sul, onde existe o risco de um conflito militar se materializar antes das instalações atualmente construídas nos EUA para compensar isso (e também não se espera que produzam os chips da próxima geração por mais alguns anos) poderem ser lançadas.
E, finalmente, a China, que está essencialmente isolada do hardware de IA de última geração devido às restrições impostas à NVIDIA e à TSMC pelos EUA, está competindo por qualquer computação que permaneça disponível, assim como as redes Web3 DePIn. Ao contrário da Web3, as empresas chinesas realmente têm seus próprios modelos competitivos, especialmente os LLMs de, por exemplo, Baidu e Alibaba, que exigem muitos dos dispositivos da geração anterior para funcionar.
Portanto, existe um risco não material devido a um dos motivos acima mencionados ou à confluência de fatores, os Hyperscalers simplesmente limitarem o acesso ao seu hardware de IA a terceiros, à medida que a guerra de dominação de IA se intensifica e passa a ter prioridade sobre o negócio de nuvem. Basicamente, é um cenário em que eles ocupam toda a capacidade de nuvem relacionada à IA para seu próprio uso e não a oferecem mais a mais ninguém, enquanto também consomem todo o hardware mais recente. Isso acontece e o restante do fornecimento de computação é ainda mais demandado por outros grandes players, incluindo soberanos. Tudo isso enquanto as GPUs de nível de consumidor deixadas lá fora estão se tornando cada vez menos competitivas.
Obviamente, este é um cenário extremo, mas o prémio é demasiado grande para os grandes jogadores recuarem no caso de os estrangulamentos de hardware permanecerem. Isto deixa os operadores descentralizados como os centros de dados de nível 2 e os proprietários de hardware de nível de retalho, que compõem a maioria dos fornecedores de DePin da Web3, de fora da competição.
Enquanto os fundadores de criptomoedas estão a dormir ao volante, os pesos pesados da IA estão a observar de perto as criptomoedas.Pressões do governoe a concorrência pode levá-los a adotar criptomoedas para evitar serem fechados ou fortemente regulamentados.
Fundador da Stability AI recentemente renunciara fim de começar a “descentralizar” a sua empresa é uma das primeiras pistas públicas nesse sentido. Ele anteriormente não havia feito segredo dos seus planos de lançar um token em aparições públicas, mas apenas após a conclusão bem-sucedida do IPO da empresa - o que meio que revela os verdadeiros motivos por trás do movimento esperado.
Na mesma linha, embora Sam Altman não esteja envolvido operacionalmente no projeto de criptomoedas que co-fundou, o Worldcoin, o seu token certamente negoceia como um procurador da OpenAI. Se existecaminho para conectar o projeto de dinheiro gratuito da internet com o projeto de P&D de IA só o tempo dirá, mas a equipe da Worldcoin parece também reconhecerque o mercado está testando esta hipótese.
Faz muito sentido para nós que os gigantes da IA possam explorar diferentes caminhos para a descentralização. O problema que vemos aqui novamente é que o Web3 não produziu soluções significativas. Os "tokens de governança" são, em grande parte, um meme, enquanto apenas aqueles que evitam explicitamente laços diretos entre detentores de ativos e o desenvolvimento e operações de sua rede - $BTC e $ETH - são os verdadeiramente descentralizados no momento.
Os mesmos (des)incentivos que retardam o desenvolvimento tecnológico também afetam o desenvolvimento de diferentes designs para governar redes cripto. As equipes de startups apenas colocam um "token de governança" em cima de seu produto na esperança de descobri-lo à medida que ganham impulso, enquanto eventualmente apenas se entrincheiram no "teatro de governança" em torno da alocação de recursos.
A corrida da IA está a decorrer e todos estão muito sérios em relação a isso. Não conseguimos identificar uma falha no pensamento dos grandes incumbentes de tecnologia quando se trata de escalar os seus cálculos a taxas sem precedentes - mais cálculos significam uma IA melhor, uma IA melhor significa redução de custos, adição de novas receitas e expansão da quota de mercado. Isto significa para nós que a bolha está justificada, mas todos os falsos serão ainda eliminados nos inevitáveis ajustes futuros.
IA corporativa centralizada de grandes empresas está dominando o setor e as startups legítimas acham difícil acompanhar. O espaço Web3 chegou tarde à festa, mas também está entrando na corrida. O mercado está recompensando projetos de IA de criptomoeda de forma muito rica em comparação com as startups Web2 no espaço, o que desvia o interesse dos fundadores de lançar o produto para impulsionar o token em um momento crítico, quando a janela de oportunidade para recuperar o atraso está se fechando rapidamente. Até agora, não houve nenhuma inovação ortogonal aqui que contorne a expansão do cálculo em grande escala para competir.
Há um movimento de código aberto credível agora em torno de modelos voltados para o consumidor, que foi originalmente impulsionado com apenas alguns players centralizados optando por competir com rivais maiores de código fechado por participação de mercado (por exemplo, Meta, Stability AI). Mas agora a comunidade está se atualizando e pressionando as principais empresas de IA. Essas pressões continuarão a afetar o desenvolvimento de código fechado de produtos de IA, mas não de forma significativa até que o código aberto esteja do lado da recuperação. Esta é outra grande oportunidade para o espaço Web3, mas apenas se resolver para treinamento e inferência de modelos descentralizados.
Assim, embora à primeira vista as aberturas "clássicas" para disruptores estejam presentes, a realidade não poderia ser mais favorável a eles. A IA está predominantemente ligada ao cálculo e não há nada que possa ser alterado sobre isso sem uma inovação revolucionária nos próximos 3-5 anos, que é um período crucial para determinar quem controla e orienta o desenvolvimento da IA.
O próprio mercado de computação, embora a demanda esteja impulsionando os esforços do lado da oferta, também não pode "deixar cem flores florescerem" com a concorrência entre fabricantes limitada por fatores estruturais como fabricação de chips e economias de escala.
Continuamos otimistas em relação à engenhosidade humana e temos a certeza de que há pessoas inteligentes e nobres suficientes para tentar resolver o problema da IA de uma forma que favoreça o mundo livre em vez do controlo corporativo ou governamental de cima para baixo. Mas as probabilidades são muito reduzidas e é uma questão de sorte, no máximo, mas os fundadores da Web3 estão demasiado ocupados a lançar a moeda para obter impacto financeiro em vez de impacto no mundo real.
Se estiver a construir algo interessante para ajudar a aumentar as chances do Web3 e não estiver apenas a surfar a onda de entusiasmo, contacte-nos.
Este não é mais um texto entusiasta de VC cor-de-rosa sobre “IA + Web3”. Somos otimistas em relação à fusão de ambas as tecnologias, mas o texto abaixo é um apelo à ação. Caso contrário, o otimismo não será justificado.
Porquê? Porque o desenvolvimento e execução dos melhores modelos de IA requerem despesas de capital significativas no hardware mais avançado e muitas vezes difícil de obter, bem como investigação e desenvolvimento muito específicos do domínio. Atribuir incentivos cripto para obter em crowdsourcing esses modelos, como a maioria dos projetos de IA Web3 estão a fazer, não é suficiente para superar as dezenas de milhares de milhões de dólares investidos por grandes corporações que controlam o desenvolvimento de IA com firmeza. Dadas as restrições de hardware, este pode ser o primeiro grande paradigma de software que engenheiros inteligentes e criativos fora das organizações incumbentes não têm recursos para perturbar.
O software está "comendo o mundo" cada vez mais rápido, logo fadado a decolar exponencialmente com a aceleração da IA. E todo esse "bolo", com a situação atual, vai para os incumbentes de tecnologia - enquanto os usuários finais, incluindo governos e grandes empresas, e muito menos consumidores, tornam-se ainda mais dependentes de seu poder.
Tudo isso não poderia ter acontecido em um momento mais inadequado - com 90% dos participantes da web descentralizada ocupados perseguindo a galinha dos ovos de ouro dos ganhos fáceis de moeda fiduciária impulsionados por narrativas. Sim, os desenvolvedores estão seguindo os investidores em nossa indústria e não o contrário. Varia desde a admissão aberta até motivações mais sutis e subconscientes, mas as narrativas e os mercados formados em torno delas impulsionam muitas tomadas de decisão no Web3. Os participantes estão muito envolvidos em uma bolha reflexiva clássica para perceber o mundo exterior, exceto as narrativas que ajudam a avançar ainda mais esse ciclo. E a IA é obviamente a maior, pois também está passando por um boom próprio.
Falamos com dezenas de equipas na interseção AI x Crypto e podemos confirmar que muitas delas são muito capazes, orientadas por missões e construtores apaixonados. Mas tal é a natureza humana que quando confrontados com tentações tendemos a sucumbir a elas e depois racionalizar essas escolhas pós-facto.
O caminho fácil para a liquidez tem sido uma maldição histórica da indústria de criptomoedas - responsável por retardar seu desenvolvimento e adoção útil em anos neste momento. Isso desvia até os discípulos de criptomoedas mais fiéis para "bombear o token". A racionalização é que, com mais capital à mão na forma de tokens, esses construtores podem ter melhores chances.
A relativa falta de sofisticação tanto do capital institucional quanto do capital de varejo cria oportunidades para os construtores fazerem reivindicações desconectadas da realidade, enquanto ainda se beneficiam de valorações como se essas reivindicações já tivessem se concretizado. O resultado desses processos é um risco moral realmente enraizado e destruição de capital, com muito poucas dessas estratégias funcionando a longo prazo. A necessidade é a mãe de todas as invenções e quando ela se vai, também se vão as invenções.
Não poderia ter acontecido em pior altura. Enquanto todos os empreendedores tecnológicos mais inteligentes, atores estatais e empresas, grandes e pequenas, estão a correr para garantir a sua parte dos benefícios provenientes da revolução da IA, os fundadores e investidores de criptomoedas estão a optar por um “rápido 10x”. Em vez de uma vida inteira de 1000 x, que é o verdadeiro custo de oportunidade aqui, na nossa opinião.
Dado os incentivos acima mencionados, a taxonomia do projeto de IA Web3 na verdade se resume a:
Basicamente, pensamos que os construtores sabem exatamente o que é necessário para acompanhar a concorrência da Web2 e os setores onde é realmente possível competir e onde é mais um sonho impossível, mas que mesmo assim é possível para VCs e público pouco sofisticado.
O objetivo é poder competir aqui e agora. Caso contrário, a velocidade do desenvolvimento da IA pode deixar a Web3 para trás, enquanto o mundo pula para a distópica Web4 da IA corporativa no Ocidente indo contra a IA estatal da China. Aqueles que não conseguem ser competitivos o suficiente e dependem da tecnologia distribuída para recuperar o atraso em um horizonte de tempo mais longo são otimistas demais para serem levados a sério.
Obviamente, isto é uma generalização muito grosseira e até o grupo Gate contém pelo menos algumas equipas sérias (e talvez mais de apenas sonhadores delirantes). Mas este texto é um apelo às armas, por isso não pretendemos ser objetivos, mas sim apelar ao sentido de urgência do leitor[1].
Legítimo:
Semi-legítimo:
O que nenhum dos dois campos acima aborda é o treino e a inferência para grandes modelos em ambientes descentralizados. Neste momento, não há forma de treinar um modelo fundamental num tempo razoável sem depender de clusters de hardware fortemente conectados. O 'tempo razoável' dado o nível de competição é o fator chave.
Alguns pesquisa promissorasobre o tema saiu recentemente e, teoricamente, abordagens como Fluxo de Dados Diferencialpode ser expandido para redes de computação distribuída para aumentar sua capacidade no futuro (à medida que as capacidades de rede alcançam os requisitos de fluxo de dados). Mas o treinamento de modelos competitivos ainda requer comunicação entre clusters localizados, em vez de dispositivos distribuídos únicos, e computação de ponta (as GPUs de varejo estão se tornando cada vez mais não competitivas).
A investigação sobre a localização (uma das duas formas de descentralização) da inferência, reduzindo o tamanho do modelo, também foiprogredindo recentemente, mas não existem protocolos existentes no Web3 que o aproveitem.
Os problemas com treino e inferência descentralizados logicamente levam-nos ao último dos três campos e de longe o mais importante e, portanto, tão emocionalmente desencadeante para nós ;-)
Falsificadores:
Precisamos de um conjunto de modelos fundamentais competitivos e verdadeiramente descentralizados e eles requerem treino e inferência descentralizados para funcionar. Perder a IA pode anular completamente quaisquer conquistas que os “computadores mundiais descentralizados” tenham feito desde o surgimento do Ethereum. Se os computadores se tornarem IA e a IA for centralizada, não haverá nenhum computador mundial para falar, a não ser alguma versão distópica disso.
A formação e inferência são o coração da inovação em IA. Quando o resto do mundo da IA está a mover-se em direção a arquiteturas mais estreitamente ligadas, a Web3 precisa de uma solução ortogonal para competir, porque competir de frente está a tornar-se cada vez menos viável muito rapidamente.
É tudo sobre computação. Quanto mais você aplicar tanto no treinamento quanto na inferência, melhores serão os resultados. Sim, existem ajustes e otimizações aqui e ali e a própria computação não é homogênea - agora há uma grande variedade de novas abordagens para superar os gargalos da arquitetura tradicional de Von Neumann para unidades de processamento - mas ainda assim tudo se resume a quantas multiplicações de matriz você pode fazer em relação ao tamanho de um bloco de memória e quão rápido.
É por isso que estamos testemunhando uma construção tão forte no front de centros de dados pelos chamados "Hyperscalers", que estão todos procurando criar uma pilha completa com uma potência de modelo de IA no topo e hardware que o alimenta por baixo: OpenAI (modelos) + Microsoft (computação), Anthropic (modelos) + AWS (computação), Google (ambos) e Meta (cada vez mais ambos, através do aumento da construção do próprio data center). Há mais nuances, dinâmicas de interação e partes envolvidas, mas vamos deixar de fora. O quadro geral é que os Hyperscalers estão investindo bilhões de dólares, como nunca antes, na construção de centros de dados e estão criando sinergias entre suas ofertas de computação e IA, esperando gerar enormes lucros à medida que a IA se prolifera pela economia global.
Vamos apenas olhar para o nível de implementação esperado apenas este ano das 4 empresas:
E foi isto que já foi gasto em hardware de IA da NVIDIA em 2023:
Jensen Huang, CEO da NVIDIA, tem estado a propor um total de $1tn a ser investido na aceleração da IA nos próximos anos. Uma previsão que fez recentemente dobradopara $2tn, alegadamente motivada pelo interesse que testemunhou por parte dos intervenientes soberanos. Os analistas da Altimeter esperam que os gastos relacionados com IA em datacenters ultrapassem os $160bn e os $200bn a nível global em '24 e '25, respetivamente.
Agora, comparar esses números com o que o Web3 tem a oferecer aos operadores independentes de centros de dados para incentivá-los a expandir o CapEx no hardware de IA mais recente:
Mesmo que peguemos esta estimativa muito aproximada dividida por 3 (anos) e comparemos o valor em dólares disso com o dinheiro gasto apenas pelos Hyperscalers em 2024, fica claro que colocar incentivos de token em um monte de projetos de "rede de GPU descentralizada" não é suficiente.
Também é necessário haver bilhões de dólares em demanda de investidores para absorver esses tokens, já que os operadores de tais redes vendem uma grande parte das moedas mineradas para cobrir os custos significativos de Cap- e OpEX. E alguns bilhões a mais para impulsionar esses tokens e incentivar o crescimento na expansão para superar os Hyperscalers.
No entanto, alguém com conhecimento íntimo de como a maioria dos servidores Web3 são atualmente executados pode esperar que uma grande parte da 'Infraestrutura Física Descentralizada' seja efetivamente executada nos mesmos serviços de nuvem dos Hiperescalers. E, é claro, o aumento na demanda por hardware especializado em GPU e outras IA está impulsionando mais oferta, o que eventualmente deve tornar o aluguel ou compra de nuvem muito mais barato. Pelo menos essa é a expectativa.
Mas também considere isto: neste momento, a NVIDIA precisa de priorizar os clientes para as suas GPUs de última geração. É tambémcomeçando a competircom os maiores fornecedores de nuvem em seu próprio terreno - oferecendo serviços de plataforma de IA a clientes empresariais já presos a esses Hyperscalers. Isso eventualmente incentiva a construir seus próprios data centers ao longo do tempo (essencialmente reduzindo as margens de lucro gordo que estão desfrutando agora, portanto, menos provável) ou limitar significativamente suas vendas de hardware de IA apenas a seus provedores de nuvem parceiros.
Além disso, os concorrentes da NVIDIA que estão a desenvolver hardware adicional especializado em IA estão a usar maioritariamente os mesmos chips que a NVIDIA,produzido pela TSMC.Então, essencialmente, todas as empresas de hardware de IA estão atualmentecompetindo pela capacidade da TSMC.Também a TSMC precisa de priorizar certos clientes em detrimento de outros. A Samsung e potencialmente a Intel (que está a tentar regressar à fabricação de chips de última geração para a sua própria hardware em breve) podem conseguir absorver procura adicional, mas a TSMC está a produzir a maioria dos chips relacionados com a IA no momento e a escalonar e calibrar a fabricação de chips de ponta (3 e 2 nanómetros) leva anos.
Além disso, toda a fabricação de chips de ponta no momento é feita junto ao Estreito de Taiwan pela TSMC em Taiwan e pela Samsung na Coreia do Sul, onde existe o risco de um conflito militar se materializar antes das instalações atualmente construídas nos EUA para compensar isso (e também não se espera que produzam os chips da próxima geração por mais alguns anos) poderem ser lançadas.
E, finalmente, a China, que está essencialmente isolada do hardware de IA de última geração devido às restrições impostas à NVIDIA e à TSMC pelos EUA, está competindo por qualquer computação que permaneça disponível, assim como as redes Web3 DePIn. Ao contrário da Web3, as empresas chinesas realmente têm seus próprios modelos competitivos, especialmente os LLMs de, por exemplo, Baidu e Alibaba, que exigem muitos dos dispositivos da geração anterior para funcionar.
Portanto, existe um risco não material devido a um dos motivos acima mencionados ou à confluência de fatores, os Hyperscalers simplesmente limitarem o acesso ao seu hardware de IA a terceiros, à medida que a guerra de dominação de IA se intensifica e passa a ter prioridade sobre o negócio de nuvem. Basicamente, é um cenário em que eles ocupam toda a capacidade de nuvem relacionada à IA para seu próprio uso e não a oferecem mais a mais ninguém, enquanto também consomem todo o hardware mais recente. Isso acontece e o restante do fornecimento de computação é ainda mais demandado por outros grandes players, incluindo soberanos. Tudo isso enquanto as GPUs de nível de consumidor deixadas lá fora estão se tornando cada vez menos competitivas.
Obviamente, este é um cenário extremo, mas o prémio é demasiado grande para os grandes jogadores recuarem no caso de os estrangulamentos de hardware permanecerem. Isto deixa os operadores descentralizados como os centros de dados de nível 2 e os proprietários de hardware de nível de retalho, que compõem a maioria dos fornecedores de DePin da Web3, de fora da competição.
Enquanto os fundadores de criptomoedas estão a dormir ao volante, os pesos pesados da IA estão a observar de perto as criptomoedas.Pressões do governoe a concorrência pode levá-los a adotar criptomoedas para evitar serem fechados ou fortemente regulamentados.
Fundador da Stability AI recentemente renunciara fim de começar a “descentralizar” a sua empresa é uma das primeiras pistas públicas nesse sentido. Ele anteriormente não havia feito segredo dos seus planos de lançar um token em aparições públicas, mas apenas após a conclusão bem-sucedida do IPO da empresa - o que meio que revela os verdadeiros motivos por trás do movimento esperado.
Na mesma linha, embora Sam Altman não esteja envolvido operacionalmente no projeto de criptomoedas que co-fundou, o Worldcoin, o seu token certamente negoceia como um procurador da OpenAI. Se existecaminho para conectar o projeto de dinheiro gratuito da internet com o projeto de P&D de IA só o tempo dirá, mas a equipe da Worldcoin parece também reconhecerque o mercado está testando esta hipótese.
Faz muito sentido para nós que os gigantes da IA possam explorar diferentes caminhos para a descentralização. O problema que vemos aqui novamente é que o Web3 não produziu soluções significativas. Os "tokens de governança" são, em grande parte, um meme, enquanto apenas aqueles que evitam explicitamente laços diretos entre detentores de ativos e o desenvolvimento e operações de sua rede - $BTC e $ETH - são os verdadeiramente descentralizados no momento.
Os mesmos (des)incentivos que retardam o desenvolvimento tecnológico também afetam o desenvolvimento de diferentes designs para governar redes cripto. As equipes de startups apenas colocam um "token de governança" em cima de seu produto na esperança de descobri-lo à medida que ganham impulso, enquanto eventualmente apenas se entrincheiram no "teatro de governança" em torno da alocação de recursos.
A corrida da IA está a decorrer e todos estão muito sérios em relação a isso. Não conseguimos identificar uma falha no pensamento dos grandes incumbentes de tecnologia quando se trata de escalar os seus cálculos a taxas sem precedentes - mais cálculos significam uma IA melhor, uma IA melhor significa redução de custos, adição de novas receitas e expansão da quota de mercado. Isto significa para nós que a bolha está justificada, mas todos os falsos serão ainda eliminados nos inevitáveis ajustes futuros.
IA corporativa centralizada de grandes empresas está dominando o setor e as startups legítimas acham difícil acompanhar. O espaço Web3 chegou tarde à festa, mas também está entrando na corrida. O mercado está recompensando projetos de IA de criptomoeda de forma muito rica em comparação com as startups Web2 no espaço, o que desvia o interesse dos fundadores de lançar o produto para impulsionar o token em um momento crítico, quando a janela de oportunidade para recuperar o atraso está se fechando rapidamente. Até agora, não houve nenhuma inovação ortogonal aqui que contorne a expansão do cálculo em grande escala para competir.
Há um movimento de código aberto credível agora em torno de modelos voltados para o consumidor, que foi originalmente impulsionado com apenas alguns players centralizados optando por competir com rivais maiores de código fechado por participação de mercado (por exemplo, Meta, Stability AI). Mas agora a comunidade está se atualizando e pressionando as principais empresas de IA. Essas pressões continuarão a afetar o desenvolvimento de código fechado de produtos de IA, mas não de forma significativa até que o código aberto esteja do lado da recuperação. Esta é outra grande oportunidade para o espaço Web3, mas apenas se resolver para treinamento e inferência de modelos descentralizados.
Assim, embora à primeira vista as aberturas "clássicas" para disruptores estejam presentes, a realidade não poderia ser mais favorável a eles. A IA está predominantemente ligada ao cálculo e não há nada que possa ser alterado sobre isso sem uma inovação revolucionária nos próximos 3-5 anos, que é um período crucial para determinar quem controla e orienta o desenvolvimento da IA.
O próprio mercado de computação, embora a demanda esteja impulsionando os esforços do lado da oferta, também não pode "deixar cem flores florescerem" com a concorrência entre fabricantes limitada por fatores estruturais como fabricação de chips e economias de escala.
Continuamos otimistas em relação à engenhosidade humana e temos a certeza de que há pessoas inteligentes e nobres suficientes para tentar resolver o problema da IA de uma forma que favoreça o mundo livre em vez do controlo corporativo ou governamental de cima para baixo. Mas as probabilidades são muito reduzidas e é uma questão de sorte, no máximo, mas os fundadores da Web3 estão demasiado ocupados a lançar a moeda para obter impacto financeiro em vez de impacto no mundo real.
Se estiver a construir algo interessante para ajudar a aumentar as chances do Web3 e não estiver apenas a surfar a onda de entusiasmo, contacte-nos.