Virando a Moeda de IA

Principiante5/6/2024, 12:41:32 PM
O artigo explora o potencial e os desafios de combinar IA com Web3. O autor aponta que, apesar do sentimento otimista em relação a "IA + Web3," existem barreiras significativas de investimento em hardware e pesquisa na realidade, levando as grandes empresas de tecnologia a dominar o campo da IA. Os projetos Web3 utilizam crowdsourcing incentivado por meio de criptografia, tornando difícil competir com o financiamento substancial investido por essas empresas.

TLDR

Este não é mais um texto entusiasta de VC cor-de-rosa sobre “IA + Web3”. Somos otimistas em relação à fusão de ambas as tecnologias, mas o texto abaixo é um apelo à ação. Caso contrário, o otimismo não será justificado.

Porquê? Porque o desenvolvimento e execução dos melhores modelos de IA requerem despesas de capital significativas no hardware mais avançado e muitas vezes difícil de obter, bem como investigação e desenvolvimento muito específicos do domínio. Atribuir incentivos cripto para obter em crowdsourcing esses modelos, como a maioria dos projetos de IA Web3 estão a fazer, não é suficiente para superar as dezenas de milhares de milhões de dólares investidos por grandes corporações que controlam o desenvolvimento de IA com firmeza. Dadas as restrições de hardware, este pode ser o primeiro grande paradigma de software que engenheiros inteligentes e criativos fora das organizações incumbentes não têm recursos para perturbar.

O software está "comendo o mundo" cada vez mais rápido, logo fadado a decolar exponencialmente com a aceleração da IA. E todo esse "bolo", com a situação atual, vai para os incumbentes de tecnologia - enquanto os usuários finais, incluindo governos e grandes empresas, e muito menos consumidores, tornam-se ainda mais dependentes de seu poder.

Desalinhamento de Incentivos

Tudo isso não poderia ter acontecido em um momento mais inadequado - com 90% dos participantes da web descentralizada ocupados perseguindo a galinha dos ovos de ouro dos ganhos fáceis de moeda fiduciária impulsionados por narrativas. Sim, os desenvolvedores estão seguindo os investidores em nossa indústria e não o contrário. Varia desde a admissão aberta até motivações mais sutis e subconscientes, mas as narrativas e os mercados formados em torno delas impulsionam muitas tomadas de decisão no Web3. Os participantes estão muito envolvidos em uma bolha reflexiva clássica para perceber o mundo exterior, exceto as narrativas que ajudam a avançar ainda mais esse ciclo. E a IA é obviamente a maior, pois também está passando por um boom próprio.

Falamos com dezenas de equipas na interseção AI x Crypto e podemos confirmar que muitas delas são muito capazes, orientadas por missões e construtores apaixonados. Mas tal é a natureza humana que quando confrontados com tentações tendemos a sucumbir a elas e depois racionalizar essas escolhas pós-facto.

O caminho fácil para a liquidez tem sido uma maldição histórica da indústria de criptomoedas - responsável por retardar seu desenvolvimento e adoção útil em anos neste momento. Isso desvia até os discípulos de criptomoedas mais fiéis para "bombear o token". A racionalização é que, com mais capital à mão na forma de tokens, esses construtores podem ter melhores chances.

A relativa falta de sofisticação tanto do capital institucional quanto do capital de varejo cria oportunidades para os construtores fazerem reivindicações desconectadas da realidade, enquanto ainda se beneficiam de valorações como se essas reivindicações já tivessem se concretizado. O resultado desses processos é um risco moral realmente enraizado e destruição de capital, com muito poucas dessas estratégias funcionando a longo prazo. A necessidade é a mãe de todas as invenções e quando ela se vai, também se vão as invenções.

Não poderia ter acontecido em pior altura. Enquanto todos os empreendedores tecnológicos mais inteligentes, atores estatais e empresas, grandes e pequenas, estão a correr para garantir a sua parte dos benefícios provenientes da revolução da IA, os fundadores e investidores de criptomoedas estão a optar por um “rápido 10x”. Em vez de uma vida inteira de 1000 x, que é o verdadeiro custo de oportunidade aqui, na nossa opinião.

Um Resumo Grosseiro da Paisagem de IA Web3

Dado os incentivos acima mencionados, a taxonomia do projeto de IA Web3 na verdade se resume a:

  • Legítimo (também subdividido entre realistas e idealistas)
  • Semi-legítimo e,
  • Falsificadores

Basicamente, pensamos que os construtores sabem exatamente o que é necessário para acompanhar a concorrência da Web2 e os setores onde é realmente possível competir e onde é mais um sonho impossível, mas que mesmo assim é possível para VCs e público pouco sofisticado.

O objetivo é poder competir aqui e agora. Caso contrário, a velocidade do desenvolvimento da IA pode deixar a Web3 para trás, enquanto o mundo pula para a distópica Web4 da IA corporativa no Ocidente indo contra a IA estatal da China. Aqueles que não conseguem ser competitivos o suficiente e dependem da tecnologia distribuída para recuperar o atraso em um horizonte de tempo mais longo são otimistas demais para serem levados a sério.

Obviamente, isto é uma generalização muito grosseira e até o grupo Gate contém pelo menos algumas equipas sérias (e talvez mais de apenas sonhadores delirantes). Mas este texto é um apelo às armas, por isso não pretendemos ser objetivos, mas sim apelar ao sentido de urgência do leitor[1].

Legítimo:

  • Middleware para 'trazer IA para a cadeia'. Os fundadores por trás de tais soluções, que não são muitos, entendem que o treino descentralizado ou inferência de modelos que os utilizadores realmente querem (o estado da arte) é inviável, se não impossível, no momento. Portanto, encontrar uma forma de conectar os melhores modelos centralizados com o ambiente on-chain para que este beneficie da automação sofisticada é um primeiro passo suficientemente bom para eles. Os enclaves de hardware de TEEs (“air-gapped” processadores) que podem hospedar pontos de acesso API, oráculos de dois lados (para indexar dados on e off-chain bidirecionalmente) e fornecer ambientes de computação off-chain verificáveis para os agentes, parecem ser a melhor solução no momento. Existem também arquiteturas de co-processador que usam provas de conhecimento zero (ZKPs) para registrar mudanças de estado (em vez de verificar o cálculo completo) que também consideramos viáveis a médio prazo.
    A abordagem mais idealista para o mesmo problema tenta verificar a inferência off-chain para trazê-la ao mesmo nível da computação on-chain em termos de pressupostos de confiança. O objetivo disso deve ser permitir que a IA execute tarefas on- e off-chain como em um único ambiente de execução coerente, em nossa opinião. No entanto, a maioria dos defensores da verificabilidade da inferência fala sobre 'confiar nos pesos do modelo' e outros objetivos complicados do mesmo tipo que se tornam relevantes em anos, se é que algum dia. Recentemente, os fundadores desse grupo começaram a explorar abordagens alternativas para inferir verificabilidade, mas originalmente era tudo baseado em ZKP. Embora muitas equipes inteligentes estejam trabalhando no ZKML, como ficou conhecido, eles estão assumindo um risco muito grande ao antecipar que as otimizações de criptografia superam a complexidade e os requisitos de computação dos modelos de IA. Consideramo-los, portanto, inaptos para a concorrência, pelo menos por enquanto. No entanto, @ModulusLabsAlgum progresso recente é interessante e não deve ser ignorado.

Semi-legítimo:

  • Aplicativos de consumo que usam invólucros em torno de modelos de código fechado e aberto (por exemplo, Stable Diffusion ou Midjourney para geração de imagens). Algumas dessas equipes são as primeiras a entrar no mercado e têm tração de usuários reais. Portanto, não é justo chamá-los genericamente de falsos, mas apenas um punhado está pensando profundamente em como evoluir seus modelos subjacentes de maneira descentralizada e inovar no design de incentivos. Existem algumas abordagens interessantes de governança/propriedade no componente de token aqui e ali. No entanto, a maioria dos projetos desta categoria apenas coloca um token em torno de um invólucro centralizado, por exemplo, a API da OpenAI, para obter um prêmio de valuation ou liquidez mais rápida para a equipe.

O que nenhum dos dois campos acima aborda é o treino e a inferência para grandes modelos em ambientes descentralizados. Neste momento, não há forma de treinar um modelo fundamental num tempo razoável sem depender de clusters de hardware fortemente conectados. O 'tempo razoável' dado o nível de competição é o fator chave.

Alguns pesquisa promissorasobre o tema saiu recentemente e, teoricamente, abordagens como Fluxo de Dados Diferencialpode ser expandido para redes de computação distribuída para aumentar sua capacidade no futuro (à medida que as capacidades de rede alcançam os requisitos de fluxo de dados). Mas o treinamento de modelos competitivos ainda requer comunicação entre clusters localizados, em vez de dispositivos distribuídos únicos, e computação de ponta (as GPUs de varejo estão se tornando cada vez mais não competitivas).

A investigação sobre a localização (uma das duas formas de descentralização) da inferência, reduzindo o tamanho do modelo, também foiprogredindo recentemente, mas não existem protocolos existentes no Web3 que o aproveitem.

Os problemas com treino e inferência descentralizados logicamente levam-nos ao último dos três campos e de longe o mais importante e, portanto, tão emocionalmente desencadeante para nós ;-)

Falsificadores:

  • Aplicações de infraestrutura principalmente no espaço de servidor descentralizado, oferecendo hardware básico ou também ambientes de treinamento / hospedagem de modelos descentralizados. Há também projetos de infraestrutura de software que estão empurrando protocolos para, por exemplo, aprendizagem federada (treinamento de modelo descentralizado) ou aqueles que combinam os componentes de software e hardware em uma única plataforma onde se pode essencialmente treinar e implantar seu modelo descentralizado de ponta a ponta. A maioria deles não tem a sofisticação necessária para realmente resolver os problemas declarados e o pensamento ingênuo de "incentivo simbólico + vento de cauda do mercado" prevalece aqui. Nenhuma das soluções que vimos tanto no mercado público quanto no privado se aproxima de uma concorrência significativa aqui e agora. Alguns podem evoluir para ofertas viáveis (mas de nicho), mas precisamos de algo novo e competitivo aqui e agora. E isso só pode acontecer por meio de um design inovador que resolva os gargalos de computação distribuídos. No treinamento não só a velocidade, mas também a verificabilidade do trabalho realizado e a coordenação das cargas de trabalho de treinamento é um grande problema, o que aumenta o gargalo de largura de banda.

Precisamos de um conjunto de modelos fundamentais competitivos e verdadeiramente descentralizados e eles requerem treino e inferência descentralizados para funcionar. Perder a IA pode anular completamente quaisquer conquistas que os “computadores mundiais descentralizados” tenham feito desde o surgimento do Ethereum. Se os computadores se tornarem IA e a IA for centralizada, não haverá nenhum computador mundial para falar, a não ser alguma versão distópica disso.

A formação e inferência são o coração da inovação em IA. Quando o resto do mundo da IA está a mover-se em direção a arquiteturas mais estreitamente ligadas, a Web3 precisa de uma solução ortogonal para competir, porque competir de frente está a tornar-se cada vez menos viável muito rapidamente.

Tamanho do Problema

É tudo sobre computação. Quanto mais você aplicar tanto no treinamento quanto na inferência, melhores serão os resultados. Sim, existem ajustes e otimizações aqui e ali e a própria computação não é homogênea - agora há uma grande variedade de novas abordagens para superar os gargalos da arquitetura tradicional de Von Neumann para unidades de processamento - mas ainda assim tudo se resume a quantas multiplicações de matriz você pode fazer em relação ao tamanho de um bloco de memória e quão rápido.

É por isso que estamos testemunhando uma construção tão forte no front de centros de dados pelos chamados "Hyperscalers", que estão todos procurando criar uma pilha completa com uma potência de modelo de IA no topo e hardware que o alimenta por baixo: OpenAI (modelos) + Microsoft (computação), Anthropic (modelos) + AWS (computação), Google (ambos) e Meta (cada vez mais ambos, através do aumento da construção do próprio data center). Há mais nuances, dinâmicas de interação e partes envolvidas, mas vamos deixar de fora. O quadro geral é que os Hyperscalers estão investindo bilhões de dólares, como nunca antes, na construção de centros de dados e estão criando sinergias entre suas ofertas de computação e IA, esperando gerar enormes lucros à medida que a IA se prolifera pela economia global.

Vamos apenas olhar para o nível de implementação esperado apenas este ano das 4 empresas:

  • Meta antecipa $30-37bndespesas de capital em 2024, que provavelmente serão fortemente inclinadas para os centros de dados.
  • Microsoft gastou cerca de $11.5 biliões em 2023em CapEx e é amplamente rumorado que investirá mais $40-50bn em ‘24-‘25! Isto pode ser parcialmente inferido pelos enormes investimentos em data center anunciados em apenas alguns países: $3.2bno Reino Unido, $3.5bn na Austrália, $2.1bnem Espanha, €3.2bnna Alemanha,$1bnno estado norte-americano da Geórgia e$10bnem Wisconsin, respetivamente. E esses são apenas alguns dos investimentos regionais da sua rede de 300 centros de dados espalhados por mais de 60 regiões. Também existemconversasde um supercomputador para a OpenAI que pode custar à Microsoft mais $100bn!
  • Liderança da Amazonespera seu CapEx crescerá significativamente em 2024, de US$ 48 bilhões gastos em 2023, impulsionado principalmente pela expansão da construção da infraestrutura da AWS para IA.
  • Google gastou $11bnpara expandir seus servidores e data centers apenas no quarto trimestre de 2023. Eles admitem que esses investimentos foram feitos para atender à demanda esperada de IA e estão antecipando que a taxa e o tamanho total de seus gastos com infraestrutura aumentem significativamente em 2024 devido à IA.

E foi isto que já foi gasto em hardware de IA da NVIDIA em 2023:

Jensen Huang, CEO da NVIDIA, tem estado a propor um total de $1tn a ser investido na aceleração da IA nos próximos anos. Uma previsão que fez recentemente dobradopara $2tn, alegadamente motivada pelo interesse que testemunhou por parte dos intervenientes soberanos. Os analistas da Altimeter esperam que os gastos relacionados com IA em datacenters ultrapassem os $160bn e os $200bn a nível global em '24 e '25, respetivamente.

Agora, comparar esses números com o que o Web3 tem a oferecer aos operadores independentes de centros de dados para incentivá-los a expandir o CapEx no hardware de IA mais recente:

  • A capitalização de mercado total de todos os projetos de Infraestrutura Física Descentralizada (DePIn) está atualmente em cerca de US$ 40 bilhões em tokens relativamente ilíquidos e predominantemente especulativos. Essencialmente, as capitalizações de mercado dessas redes são iguais à estimativa limite superior do CapEx total de seus contribuidores, dado que eles incentivam essa construção com os tokens. No entanto, o mcap atual quase não adianta, uma vez que já foi emitido.
  • Portanto, vamos assumir que há mais $80bn (2x o valor existente) de capitalizações de tokens DePIn privados e públicos a entrar no mercado como incentivos nos próximos 3-5 anos e assumir que isto está a ser direcionado 100% para casos de uso de IA.

Mesmo que peguemos esta estimativa muito aproximada dividida por 3 (anos) e comparemos o valor em dólares disso com o dinheiro gasto apenas pelos Hyperscalers em 2024, fica claro que colocar incentivos de token em um monte de projetos de "rede de GPU descentralizada" não é suficiente.

Também é necessário haver bilhões de dólares em demanda de investidores para absorver esses tokens, já que os operadores de tais redes vendem uma grande parte das moedas mineradas para cobrir os custos significativos de Cap- e OpEX. E alguns bilhões a mais para impulsionar esses tokens e incentivar o crescimento na expansão para superar os Hyperscalers.

No entanto, alguém com conhecimento íntimo de como a maioria dos servidores Web3 são atualmente executados pode esperar que uma grande parte da 'Infraestrutura Física Descentralizada' seja efetivamente executada nos mesmos serviços de nuvem dos Hiperescalers. E, é claro, o aumento na demanda por hardware especializado em GPU e outras IA está impulsionando mais oferta, o que eventualmente deve tornar o aluguel ou compra de nuvem muito mais barato. Pelo menos essa é a expectativa.

Mas também considere isto: neste momento, a NVIDIA precisa de priorizar os clientes para as suas GPUs de última geração. É tambémcomeçando a competircom os maiores fornecedores de nuvem em seu próprio terreno - oferecendo serviços de plataforma de IA a clientes empresariais já presos a esses Hyperscalers. Isso eventualmente incentiva a construir seus próprios data centers ao longo do tempo (essencialmente reduzindo as margens de lucro gordo que estão desfrutando agora, portanto, menos provável) ou limitar significativamente suas vendas de hardware de IA apenas a seus provedores de nuvem parceiros.

Além disso, os concorrentes da NVIDIA que estão a desenvolver hardware adicional especializado em IA estão a usar maioritariamente os mesmos chips que a NVIDIA,produzido pela TSMC.Então, essencialmente, todas as empresas de hardware de IA estão atualmentecompetindo pela capacidade da TSMC.Também a TSMC precisa de priorizar certos clientes em detrimento de outros. A Samsung e potencialmente a Intel (que está a tentar regressar à fabricação de chips de última geração para a sua própria hardware em breve) podem conseguir absorver procura adicional, mas a TSMC está a produzir a maioria dos chips relacionados com a IA no momento e a escalonar e calibrar a fabricação de chips de ponta (3 e 2 nanómetros) leva anos.

Além disso, toda a fabricação de chips de ponta no momento é feita junto ao Estreito de Taiwan pela TSMC em Taiwan e pela Samsung na Coreia do Sul, onde existe o risco de um conflito militar se materializar antes das instalações atualmente construídas nos EUA para compensar isso (e também não se espera que produzam os chips da próxima geração por mais alguns anos) poderem ser lançadas.

E, finalmente, a China, que está essencialmente isolada do hardware de IA de última geração devido às restrições impostas à NVIDIA e à TSMC pelos EUA, está competindo por qualquer computação que permaneça disponível, assim como as redes Web3 DePIn. Ao contrário da Web3, as empresas chinesas realmente têm seus próprios modelos competitivos, especialmente os LLMs de, por exemplo, Baidu e Alibaba, que exigem muitos dos dispositivos da geração anterior para funcionar.

Portanto, existe um risco não material devido a um dos motivos acima mencionados ou à confluência de fatores, os Hyperscalers simplesmente limitarem o acesso ao seu hardware de IA a terceiros, à medida que a guerra de dominação de IA se intensifica e passa a ter prioridade sobre o negócio de nuvem. Basicamente, é um cenário em que eles ocupam toda a capacidade de nuvem relacionada à IA para seu próprio uso e não a oferecem mais a mais ninguém, enquanto também consomem todo o hardware mais recente. Isso acontece e o restante do fornecimento de computação é ainda mais demandado por outros grandes players, incluindo soberanos. Tudo isso enquanto as GPUs de nível de consumidor deixadas lá fora estão se tornando cada vez menos competitivas.

Obviamente, este é um cenário extremo, mas o prémio é demasiado grande para os grandes jogadores recuarem no caso de os estrangulamentos de hardware permanecerem. Isto deixa os operadores descentralizados como os centros de dados de nível 2 e os proprietários de hardware de nível de retalho, que compõem a maioria dos fornecedores de DePin da Web3, de fora da competição.

O Outro Lado da Moeda

Enquanto os fundadores de criptomoedas estão a dormir ao volante, os pesos pesados da IA estão a observar de perto as criptomoedas.Pressões do governoe a concorrência pode levá-los a adotar criptomoedas para evitar serem fechados ou fortemente regulamentados.

Fundador da Stability AI recentemente renunciara fim de começar a “descentralizar” a sua empresa é uma das primeiras pistas públicas nesse sentido. Ele anteriormente não havia feito segredo dos seus planos de lançar um token em aparições públicas, mas apenas após a conclusão bem-sucedida do IPO da empresa - o que meio que revela os verdadeiros motivos por trás do movimento esperado.

Na mesma linha, embora Sam Altman não esteja envolvido operacionalmente no projeto de criptomoedas que co-fundou, o Worldcoin, o seu token certamente negoceia como um procurador da OpenAI. Se existecaminho para conectar o projeto de dinheiro gratuito da internet com o projeto de P&D de IA só o tempo dirá, mas a equipe da Worldcoin parece também reconhecerque o mercado está testando esta hipótese.

Faz muito sentido para nós que os gigantes da IA possam explorar diferentes caminhos para a descentralização. O problema que vemos aqui novamente é que o Web3 não produziu soluções significativas. Os "tokens de governança" são, em grande parte, um meme, enquanto apenas aqueles que evitam explicitamente laços diretos entre detentores de ativos e o desenvolvimento e operações de sua rede - $BTC e $ETH - são os verdadeiramente descentralizados no momento.

Os mesmos (des)incentivos que retardam o desenvolvimento tecnológico também afetam o desenvolvimento de diferentes designs para governar redes cripto. As equipes de startups apenas colocam um "token de governança" em cima de seu produto na esperança de descobri-lo à medida que ganham impulso, enquanto eventualmente apenas se entrincheiram no "teatro de governança" em torno da alocação de recursos.

Conclusão

A corrida da IA está a decorrer e todos estão muito sérios em relação a isso. Não conseguimos identificar uma falha no pensamento dos grandes incumbentes de tecnologia quando se trata de escalar os seus cálculos a taxas sem precedentes - mais cálculos significam uma IA melhor, uma IA melhor significa redução de custos, adição de novas receitas e expansão da quota de mercado. Isto significa para nós que a bolha está justificada, mas todos os falsos serão ainda eliminados nos inevitáveis ajustes futuros.

IA corporativa centralizada de grandes empresas está dominando o setor e as startups legítimas acham difícil acompanhar. O espaço Web3 chegou tarde à festa, mas também está entrando na corrida. O mercado está recompensando projetos de IA de criptomoeda de forma muito rica em comparação com as startups Web2 no espaço, o que desvia o interesse dos fundadores de lançar o produto para impulsionar o token em um momento crítico, quando a janela de oportunidade para recuperar o atraso está se fechando rapidamente. Até agora, não houve nenhuma inovação ortogonal aqui que contorne a expansão do cálculo em grande escala para competir.

Há um movimento de código aberto credível agora em torno de modelos voltados para o consumidor, que foi originalmente impulsionado com apenas alguns players centralizados optando por competir com rivais maiores de código fechado por participação de mercado (por exemplo, Meta, Stability AI). Mas agora a comunidade está se atualizando e pressionando as principais empresas de IA. Essas pressões continuarão a afetar o desenvolvimento de código fechado de produtos de IA, mas não de forma significativa até que o código aberto esteja do lado da recuperação. Esta é outra grande oportunidade para o espaço Web3, mas apenas se resolver para treinamento e inferência de modelos descentralizados.

Assim, embora à primeira vista as aberturas "clássicas" para disruptores estejam presentes, a realidade não poderia ser mais favorável a eles. A IA está predominantemente ligada ao cálculo e não há nada que possa ser alterado sobre isso sem uma inovação revolucionária nos próximos 3-5 anos, que é um período crucial para determinar quem controla e orienta o desenvolvimento da IA.

O próprio mercado de computação, embora a demanda esteja impulsionando os esforços do lado da oferta, também não pode "deixar cem flores florescerem" com a concorrência entre fabricantes limitada por fatores estruturais como fabricação de chips e economias de escala.

Continuamos otimistas em relação à engenhosidade humana e temos a certeza de que há pessoas inteligentes e nobres suficientes para tentar resolver o problema da IA de uma forma que favoreça o mundo livre em vez do controlo corporativo ou governamental de cima para baixo. Mas as probabilidades são muito reduzidas e é uma questão de sorte, no máximo, mas os fundadores da Web3 estão demasiado ocupados a lançar a moeda para obter impacto financeiro em vez de impacto no mundo real.

Se estiver a construir algo interessante para ajudar a aumentar as chances do Web3 e não estiver apenas a surfar a onda de entusiasmo, contacte-nos.

Aviso legal:

  1. Este artigo foi reproduzido a partir de [gagra.vc], Todos os direitos de autor pertencem ao autor original [gagra.vc]. Se houver objeções a esta reimpressão, por favor entre em contato com o Gate Learn equipe, e eles vão lidar com isso prontamente.
  2. Responsabilidade de Isenção: As perspetivas e opiniões expressas neste artigo são unicamente as do autor e não constituem qualquer conselho de investimento.
  3. As traduções do artigo para outras línguas são feitas pela equipa Gate Learn. Salvo indicação em contrário, é proibida a cópia, distribuição ou plágio dos artigos traduzidos.

Virando a Moeda de IA

Principiante5/6/2024, 12:41:32 PM
O artigo explora o potencial e os desafios de combinar IA com Web3. O autor aponta que, apesar do sentimento otimista em relação a "IA + Web3," existem barreiras significativas de investimento em hardware e pesquisa na realidade, levando as grandes empresas de tecnologia a dominar o campo da IA. Os projetos Web3 utilizam crowdsourcing incentivado por meio de criptografia, tornando difícil competir com o financiamento substancial investido por essas empresas.

TLDR

Este não é mais um texto entusiasta de VC cor-de-rosa sobre “IA + Web3”. Somos otimistas em relação à fusão de ambas as tecnologias, mas o texto abaixo é um apelo à ação. Caso contrário, o otimismo não será justificado.

Porquê? Porque o desenvolvimento e execução dos melhores modelos de IA requerem despesas de capital significativas no hardware mais avançado e muitas vezes difícil de obter, bem como investigação e desenvolvimento muito específicos do domínio. Atribuir incentivos cripto para obter em crowdsourcing esses modelos, como a maioria dos projetos de IA Web3 estão a fazer, não é suficiente para superar as dezenas de milhares de milhões de dólares investidos por grandes corporações que controlam o desenvolvimento de IA com firmeza. Dadas as restrições de hardware, este pode ser o primeiro grande paradigma de software que engenheiros inteligentes e criativos fora das organizações incumbentes não têm recursos para perturbar.

O software está "comendo o mundo" cada vez mais rápido, logo fadado a decolar exponencialmente com a aceleração da IA. E todo esse "bolo", com a situação atual, vai para os incumbentes de tecnologia - enquanto os usuários finais, incluindo governos e grandes empresas, e muito menos consumidores, tornam-se ainda mais dependentes de seu poder.

Desalinhamento de Incentivos

Tudo isso não poderia ter acontecido em um momento mais inadequado - com 90% dos participantes da web descentralizada ocupados perseguindo a galinha dos ovos de ouro dos ganhos fáceis de moeda fiduciária impulsionados por narrativas. Sim, os desenvolvedores estão seguindo os investidores em nossa indústria e não o contrário. Varia desde a admissão aberta até motivações mais sutis e subconscientes, mas as narrativas e os mercados formados em torno delas impulsionam muitas tomadas de decisão no Web3. Os participantes estão muito envolvidos em uma bolha reflexiva clássica para perceber o mundo exterior, exceto as narrativas que ajudam a avançar ainda mais esse ciclo. E a IA é obviamente a maior, pois também está passando por um boom próprio.

Falamos com dezenas de equipas na interseção AI x Crypto e podemos confirmar que muitas delas são muito capazes, orientadas por missões e construtores apaixonados. Mas tal é a natureza humana que quando confrontados com tentações tendemos a sucumbir a elas e depois racionalizar essas escolhas pós-facto.

O caminho fácil para a liquidez tem sido uma maldição histórica da indústria de criptomoedas - responsável por retardar seu desenvolvimento e adoção útil em anos neste momento. Isso desvia até os discípulos de criptomoedas mais fiéis para "bombear o token". A racionalização é que, com mais capital à mão na forma de tokens, esses construtores podem ter melhores chances.

A relativa falta de sofisticação tanto do capital institucional quanto do capital de varejo cria oportunidades para os construtores fazerem reivindicações desconectadas da realidade, enquanto ainda se beneficiam de valorações como se essas reivindicações já tivessem se concretizado. O resultado desses processos é um risco moral realmente enraizado e destruição de capital, com muito poucas dessas estratégias funcionando a longo prazo. A necessidade é a mãe de todas as invenções e quando ela se vai, também se vão as invenções.

Não poderia ter acontecido em pior altura. Enquanto todos os empreendedores tecnológicos mais inteligentes, atores estatais e empresas, grandes e pequenas, estão a correr para garantir a sua parte dos benefícios provenientes da revolução da IA, os fundadores e investidores de criptomoedas estão a optar por um “rápido 10x”. Em vez de uma vida inteira de 1000 x, que é o verdadeiro custo de oportunidade aqui, na nossa opinião.

Um Resumo Grosseiro da Paisagem de IA Web3

Dado os incentivos acima mencionados, a taxonomia do projeto de IA Web3 na verdade se resume a:

  • Legítimo (também subdividido entre realistas e idealistas)
  • Semi-legítimo e,
  • Falsificadores

Basicamente, pensamos que os construtores sabem exatamente o que é necessário para acompanhar a concorrência da Web2 e os setores onde é realmente possível competir e onde é mais um sonho impossível, mas que mesmo assim é possível para VCs e público pouco sofisticado.

O objetivo é poder competir aqui e agora. Caso contrário, a velocidade do desenvolvimento da IA pode deixar a Web3 para trás, enquanto o mundo pula para a distópica Web4 da IA corporativa no Ocidente indo contra a IA estatal da China. Aqueles que não conseguem ser competitivos o suficiente e dependem da tecnologia distribuída para recuperar o atraso em um horizonte de tempo mais longo são otimistas demais para serem levados a sério.

Obviamente, isto é uma generalização muito grosseira e até o grupo Gate contém pelo menos algumas equipas sérias (e talvez mais de apenas sonhadores delirantes). Mas este texto é um apelo às armas, por isso não pretendemos ser objetivos, mas sim apelar ao sentido de urgência do leitor[1].

Legítimo:

  • Middleware para 'trazer IA para a cadeia'. Os fundadores por trás de tais soluções, que não são muitos, entendem que o treino descentralizado ou inferência de modelos que os utilizadores realmente querem (o estado da arte) é inviável, se não impossível, no momento. Portanto, encontrar uma forma de conectar os melhores modelos centralizados com o ambiente on-chain para que este beneficie da automação sofisticada é um primeiro passo suficientemente bom para eles. Os enclaves de hardware de TEEs (“air-gapped” processadores) que podem hospedar pontos de acesso API, oráculos de dois lados (para indexar dados on e off-chain bidirecionalmente) e fornecer ambientes de computação off-chain verificáveis para os agentes, parecem ser a melhor solução no momento. Existem também arquiteturas de co-processador que usam provas de conhecimento zero (ZKPs) para registrar mudanças de estado (em vez de verificar o cálculo completo) que também consideramos viáveis a médio prazo.
    A abordagem mais idealista para o mesmo problema tenta verificar a inferência off-chain para trazê-la ao mesmo nível da computação on-chain em termos de pressupostos de confiança. O objetivo disso deve ser permitir que a IA execute tarefas on- e off-chain como em um único ambiente de execução coerente, em nossa opinião. No entanto, a maioria dos defensores da verificabilidade da inferência fala sobre 'confiar nos pesos do modelo' e outros objetivos complicados do mesmo tipo que se tornam relevantes em anos, se é que algum dia. Recentemente, os fundadores desse grupo começaram a explorar abordagens alternativas para inferir verificabilidade, mas originalmente era tudo baseado em ZKP. Embora muitas equipes inteligentes estejam trabalhando no ZKML, como ficou conhecido, eles estão assumindo um risco muito grande ao antecipar que as otimizações de criptografia superam a complexidade e os requisitos de computação dos modelos de IA. Consideramo-los, portanto, inaptos para a concorrência, pelo menos por enquanto. No entanto, @ModulusLabsAlgum progresso recente é interessante e não deve ser ignorado.

Semi-legítimo:

  • Aplicativos de consumo que usam invólucros em torno de modelos de código fechado e aberto (por exemplo, Stable Diffusion ou Midjourney para geração de imagens). Algumas dessas equipes são as primeiras a entrar no mercado e têm tração de usuários reais. Portanto, não é justo chamá-los genericamente de falsos, mas apenas um punhado está pensando profundamente em como evoluir seus modelos subjacentes de maneira descentralizada e inovar no design de incentivos. Existem algumas abordagens interessantes de governança/propriedade no componente de token aqui e ali. No entanto, a maioria dos projetos desta categoria apenas coloca um token em torno de um invólucro centralizado, por exemplo, a API da OpenAI, para obter um prêmio de valuation ou liquidez mais rápida para a equipe.

O que nenhum dos dois campos acima aborda é o treino e a inferência para grandes modelos em ambientes descentralizados. Neste momento, não há forma de treinar um modelo fundamental num tempo razoável sem depender de clusters de hardware fortemente conectados. O 'tempo razoável' dado o nível de competição é o fator chave.

Alguns pesquisa promissorasobre o tema saiu recentemente e, teoricamente, abordagens como Fluxo de Dados Diferencialpode ser expandido para redes de computação distribuída para aumentar sua capacidade no futuro (à medida que as capacidades de rede alcançam os requisitos de fluxo de dados). Mas o treinamento de modelos competitivos ainda requer comunicação entre clusters localizados, em vez de dispositivos distribuídos únicos, e computação de ponta (as GPUs de varejo estão se tornando cada vez mais não competitivas).

A investigação sobre a localização (uma das duas formas de descentralização) da inferência, reduzindo o tamanho do modelo, também foiprogredindo recentemente, mas não existem protocolos existentes no Web3 que o aproveitem.

Os problemas com treino e inferência descentralizados logicamente levam-nos ao último dos três campos e de longe o mais importante e, portanto, tão emocionalmente desencadeante para nós ;-)

Falsificadores:

  • Aplicações de infraestrutura principalmente no espaço de servidor descentralizado, oferecendo hardware básico ou também ambientes de treinamento / hospedagem de modelos descentralizados. Há também projetos de infraestrutura de software que estão empurrando protocolos para, por exemplo, aprendizagem federada (treinamento de modelo descentralizado) ou aqueles que combinam os componentes de software e hardware em uma única plataforma onde se pode essencialmente treinar e implantar seu modelo descentralizado de ponta a ponta. A maioria deles não tem a sofisticação necessária para realmente resolver os problemas declarados e o pensamento ingênuo de "incentivo simbólico + vento de cauda do mercado" prevalece aqui. Nenhuma das soluções que vimos tanto no mercado público quanto no privado se aproxima de uma concorrência significativa aqui e agora. Alguns podem evoluir para ofertas viáveis (mas de nicho), mas precisamos de algo novo e competitivo aqui e agora. E isso só pode acontecer por meio de um design inovador que resolva os gargalos de computação distribuídos. No treinamento não só a velocidade, mas também a verificabilidade do trabalho realizado e a coordenação das cargas de trabalho de treinamento é um grande problema, o que aumenta o gargalo de largura de banda.

Precisamos de um conjunto de modelos fundamentais competitivos e verdadeiramente descentralizados e eles requerem treino e inferência descentralizados para funcionar. Perder a IA pode anular completamente quaisquer conquistas que os “computadores mundiais descentralizados” tenham feito desde o surgimento do Ethereum. Se os computadores se tornarem IA e a IA for centralizada, não haverá nenhum computador mundial para falar, a não ser alguma versão distópica disso.

A formação e inferência são o coração da inovação em IA. Quando o resto do mundo da IA está a mover-se em direção a arquiteturas mais estreitamente ligadas, a Web3 precisa de uma solução ortogonal para competir, porque competir de frente está a tornar-se cada vez menos viável muito rapidamente.

Tamanho do Problema

É tudo sobre computação. Quanto mais você aplicar tanto no treinamento quanto na inferência, melhores serão os resultados. Sim, existem ajustes e otimizações aqui e ali e a própria computação não é homogênea - agora há uma grande variedade de novas abordagens para superar os gargalos da arquitetura tradicional de Von Neumann para unidades de processamento - mas ainda assim tudo se resume a quantas multiplicações de matriz você pode fazer em relação ao tamanho de um bloco de memória e quão rápido.

É por isso que estamos testemunhando uma construção tão forte no front de centros de dados pelos chamados "Hyperscalers", que estão todos procurando criar uma pilha completa com uma potência de modelo de IA no topo e hardware que o alimenta por baixo: OpenAI (modelos) + Microsoft (computação), Anthropic (modelos) + AWS (computação), Google (ambos) e Meta (cada vez mais ambos, através do aumento da construção do próprio data center). Há mais nuances, dinâmicas de interação e partes envolvidas, mas vamos deixar de fora. O quadro geral é que os Hyperscalers estão investindo bilhões de dólares, como nunca antes, na construção de centros de dados e estão criando sinergias entre suas ofertas de computação e IA, esperando gerar enormes lucros à medida que a IA se prolifera pela economia global.

Vamos apenas olhar para o nível de implementação esperado apenas este ano das 4 empresas:

  • Meta antecipa $30-37bndespesas de capital em 2024, que provavelmente serão fortemente inclinadas para os centros de dados.
  • Microsoft gastou cerca de $11.5 biliões em 2023em CapEx e é amplamente rumorado que investirá mais $40-50bn em ‘24-‘25! Isto pode ser parcialmente inferido pelos enormes investimentos em data center anunciados em apenas alguns países: $3.2bno Reino Unido, $3.5bn na Austrália, $2.1bnem Espanha, €3.2bnna Alemanha,$1bnno estado norte-americano da Geórgia e$10bnem Wisconsin, respetivamente. E esses são apenas alguns dos investimentos regionais da sua rede de 300 centros de dados espalhados por mais de 60 regiões. Também existemconversasde um supercomputador para a OpenAI que pode custar à Microsoft mais $100bn!
  • Liderança da Amazonespera seu CapEx crescerá significativamente em 2024, de US$ 48 bilhões gastos em 2023, impulsionado principalmente pela expansão da construção da infraestrutura da AWS para IA.
  • Google gastou $11bnpara expandir seus servidores e data centers apenas no quarto trimestre de 2023. Eles admitem que esses investimentos foram feitos para atender à demanda esperada de IA e estão antecipando que a taxa e o tamanho total de seus gastos com infraestrutura aumentem significativamente em 2024 devido à IA.

E foi isto que já foi gasto em hardware de IA da NVIDIA em 2023:

Jensen Huang, CEO da NVIDIA, tem estado a propor um total de $1tn a ser investido na aceleração da IA nos próximos anos. Uma previsão que fez recentemente dobradopara $2tn, alegadamente motivada pelo interesse que testemunhou por parte dos intervenientes soberanos. Os analistas da Altimeter esperam que os gastos relacionados com IA em datacenters ultrapassem os $160bn e os $200bn a nível global em '24 e '25, respetivamente.

Agora, comparar esses números com o que o Web3 tem a oferecer aos operadores independentes de centros de dados para incentivá-los a expandir o CapEx no hardware de IA mais recente:

  • A capitalização de mercado total de todos os projetos de Infraestrutura Física Descentralizada (DePIn) está atualmente em cerca de US$ 40 bilhões em tokens relativamente ilíquidos e predominantemente especulativos. Essencialmente, as capitalizações de mercado dessas redes são iguais à estimativa limite superior do CapEx total de seus contribuidores, dado que eles incentivam essa construção com os tokens. No entanto, o mcap atual quase não adianta, uma vez que já foi emitido.
  • Portanto, vamos assumir que há mais $80bn (2x o valor existente) de capitalizações de tokens DePIn privados e públicos a entrar no mercado como incentivos nos próximos 3-5 anos e assumir que isto está a ser direcionado 100% para casos de uso de IA.

Mesmo que peguemos esta estimativa muito aproximada dividida por 3 (anos) e comparemos o valor em dólares disso com o dinheiro gasto apenas pelos Hyperscalers em 2024, fica claro que colocar incentivos de token em um monte de projetos de "rede de GPU descentralizada" não é suficiente.

Também é necessário haver bilhões de dólares em demanda de investidores para absorver esses tokens, já que os operadores de tais redes vendem uma grande parte das moedas mineradas para cobrir os custos significativos de Cap- e OpEX. E alguns bilhões a mais para impulsionar esses tokens e incentivar o crescimento na expansão para superar os Hyperscalers.

No entanto, alguém com conhecimento íntimo de como a maioria dos servidores Web3 são atualmente executados pode esperar que uma grande parte da 'Infraestrutura Física Descentralizada' seja efetivamente executada nos mesmos serviços de nuvem dos Hiperescalers. E, é claro, o aumento na demanda por hardware especializado em GPU e outras IA está impulsionando mais oferta, o que eventualmente deve tornar o aluguel ou compra de nuvem muito mais barato. Pelo menos essa é a expectativa.

Mas também considere isto: neste momento, a NVIDIA precisa de priorizar os clientes para as suas GPUs de última geração. É tambémcomeçando a competircom os maiores fornecedores de nuvem em seu próprio terreno - oferecendo serviços de plataforma de IA a clientes empresariais já presos a esses Hyperscalers. Isso eventualmente incentiva a construir seus próprios data centers ao longo do tempo (essencialmente reduzindo as margens de lucro gordo que estão desfrutando agora, portanto, menos provável) ou limitar significativamente suas vendas de hardware de IA apenas a seus provedores de nuvem parceiros.

Além disso, os concorrentes da NVIDIA que estão a desenvolver hardware adicional especializado em IA estão a usar maioritariamente os mesmos chips que a NVIDIA,produzido pela TSMC.Então, essencialmente, todas as empresas de hardware de IA estão atualmentecompetindo pela capacidade da TSMC.Também a TSMC precisa de priorizar certos clientes em detrimento de outros. A Samsung e potencialmente a Intel (que está a tentar regressar à fabricação de chips de última geração para a sua própria hardware em breve) podem conseguir absorver procura adicional, mas a TSMC está a produzir a maioria dos chips relacionados com a IA no momento e a escalonar e calibrar a fabricação de chips de ponta (3 e 2 nanómetros) leva anos.

Além disso, toda a fabricação de chips de ponta no momento é feita junto ao Estreito de Taiwan pela TSMC em Taiwan e pela Samsung na Coreia do Sul, onde existe o risco de um conflito militar se materializar antes das instalações atualmente construídas nos EUA para compensar isso (e também não se espera que produzam os chips da próxima geração por mais alguns anos) poderem ser lançadas.

E, finalmente, a China, que está essencialmente isolada do hardware de IA de última geração devido às restrições impostas à NVIDIA e à TSMC pelos EUA, está competindo por qualquer computação que permaneça disponível, assim como as redes Web3 DePIn. Ao contrário da Web3, as empresas chinesas realmente têm seus próprios modelos competitivos, especialmente os LLMs de, por exemplo, Baidu e Alibaba, que exigem muitos dos dispositivos da geração anterior para funcionar.

Portanto, existe um risco não material devido a um dos motivos acima mencionados ou à confluência de fatores, os Hyperscalers simplesmente limitarem o acesso ao seu hardware de IA a terceiros, à medida que a guerra de dominação de IA se intensifica e passa a ter prioridade sobre o negócio de nuvem. Basicamente, é um cenário em que eles ocupam toda a capacidade de nuvem relacionada à IA para seu próprio uso e não a oferecem mais a mais ninguém, enquanto também consomem todo o hardware mais recente. Isso acontece e o restante do fornecimento de computação é ainda mais demandado por outros grandes players, incluindo soberanos. Tudo isso enquanto as GPUs de nível de consumidor deixadas lá fora estão se tornando cada vez menos competitivas.

Obviamente, este é um cenário extremo, mas o prémio é demasiado grande para os grandes jogadores recuarem no caso de os estrangulamentos de hardware permanecerem. Isto deixa os operadores descentralizados como os centros de dados de nível 2 e os proprietários de hardware de nível de retalho, que compõem a maioria dos fornecedores de DePin da Web3, de fora da competição.

O Outro Lado da Moeda

Enquanto os fundadores de criptomoedas estão a dormir ao volante, os pesos pesados da IA estão a observar de perto as criptomoedas.Pressões do governoe a concorrência pode levá-los a adotar criptomoedas para evitar serem fechados ou fortemente regulamentados.

Fundador da Stability AI recentemente renunciara fim de começar a “descentralizar” a sua empresa é uma das primeiras pistas públicas nesse sentido. Ele anteriormente não havia feito segredo dos seus planos de lançar um token em aparições públicas, mas apenas após a conclusão bem-sucedida do IPO da empresa - o que meio que revela os verdadeiros motivos por trás do movimento esperado.

Na mesma linha, embora Sam Altman não esteja envolvido operacionalmente no projeto de criptomoedas que co-fundou, o Worldcoin, o seu token certamente negoceia como um procurador da OpenAI. Se existecaminho para conectar o projeto de dinheiro gratuito da internet com o projeto de P&D de IA só o tempo dirá, mas a equipe da Worldcoin parece também reconhecerque o mercado está testando esta hipótese.

Faz muito sentido para nós que os gigantes da IA possam explorar diferentes caminhos para a descentralização. O problema que vemos aqui novamente é que o Web3 não produziu soluções significativas. Os "tokens de governança" são, em grande parte, um meme, enquanto apenas aqueles que evitam explicitamente laços diretos entre detentores de ativos e o desenvolvimento e operações de sua rede - $BTC e $ETH - são os verdadeiramente descentralizados no momento.

Os mesmos (des)incentivos que retardam o desenvolvimento tecnológico também afetam o desenvolvimento de diferentes designs para governar redes cripto. As equipes de startups apenas colocam um "token de governança" em cima de seu produto na esperança de descobri-lo à medida que ganham impulso, enquanto eventualmente apenas se entrincheiram no "teatro de governança" em torno da alocação de recursos.

Conclusão

A corrida da IA está a decorrer e todos estão muito sérios em relação a isso. Não conseguimos identificar uma falha no pensamento dos grandes incumbentes de tecnologia quando se trata de escalar os seus cálculos a taxas sem precedentes - mais cálculos significam uma IA melhor, uma IA melhor significa redução de custos, adição de novas receitas e expansão da quota de mercado. Isto significa para nós que a bolha está justificada, mas todos os falsos serão ainda eliminados nos inevitáveis ajustes futuros.

IA corporativa centralizada de grandes empresas está dominando o setor e as startups legítimas acham difícil acompanhar. O espaço Web3 chegou tarde à festa, mas também está entrando na corrida. O mercado está recompensando projetos de IA de criptomoeda de forma muito rica em comparação com as startups Web2 no espaço, o que desvia o interesse dos fundadores de lançar o produto para impulsionar o token em um momento crítico, quando a janela de oportunidade para recuperar o atraso está se fechando rapidamente. Até agora, não houve nenhuma inovação ortogonal aqui que contorne a expansão do cálculo em grande escala para competir.

Há um movimento de código aberto credível agora em torno de modelos voltados para o consumidor, que foi originalmente impulsionado com apenas alguns players centralizados optando por competir com rivais maiores de código fechado por participação de mercado (por exemplo, Meta, Stability AI). Mas agora a comunidade está se atualizando e pressionando as principais empresas de IA. Essas pressões continuarão a afetar o desenvolvimento de código fechado de produtos de IA, mas não de forma significativa até que o código aberto esteja do lado da recuperação. Esta é outra grande oportunidade para o espaço Web3, mas apenas se resolver para treinamento e inferência de modelos descentralizados.

Assim, embora à primeira vista as aberturas "clássicas" para disruptores estejam presentes, a realidade não poderia ser mais favorável a eles. A IA está predominantemente ligada ao cálculo e não há nada que possa ser alterado sobre isso sem uma inovação revolucionária nos próximos 3-5 anos, que é um período crucial para determinar quem controla e orienta o desenvolvimento da IA.

O próprio mercado de computação, embora a demanda esteja impulsionando os esforços do lado da oferta, também não pode "deixar cem flores florescerem" com a concorrência entre fabricantes limitada por fatores estruturais como fabricação de chips e economias de escala.

Continuamos otimistas em relação à engenhosidade humana e temos a certeza de que há pessoas inteligentes e nobres suficientes para tentar resolver o problema da IA de uma forma que favoreça o mundo livre em vez do controlo corporativo ou governamental de cima para baixo. Mas as probabilidades são muito reduzidas e é uma questão de sorte, no máximo, mas os fundadores da Web3 estão demasiado ocupados a lançar a moeda para obter impacto financeiro em vez de impacto no mundo real.

Se estiver a construir algo interessante para ajudar a aumentar as chances do Web3 e não estiver apenas a surfar a onda de entusiasmo, contacte-nos.

Aviso legal:

  1. Este artigo foi reproduzido a partir de [gagra.vc], Todos os direitos de autor pertencem ao autor original [gagra.vc]. Se houver objeções a esta reimpressão, por favor entre em contato com o Gate Learn equipe, e eles vão lidar com isso prontamente.
  2. Responsabilidade de Isenção: As perspetivas e opiniões expressas neste artigo são unicamente as do autor e não constituem qualquer conselho de investimento.
  3. As traduções do artigo para outras línguas são feitas pela equipa Gate Learn. Salvo indicação em contrário, é proibida a cópia, distribuição ou plágio dos artigos traduzidos.
เริ่มตอนนี้
สมัครและรับรางวัล
$100