A cotação das ações da Nvidia atingiu um novo máximo, e os avanços nos modelos multimodais aprofundaram ainda mais a barreira tecnológica da IA no Web2. Desde o alinhamento semântico até a compreensão visual, passando pela incorporação em alta dimensão até a fusão de características, modelos complexos estão integrando, a uma velocidade sem precedentes, várias formas de expressão, construindo uma fortaleza de IA cada vez mais fechada. O mercado de ações dos EUA também demonstrou, com ações concretas, otimismo em relação à indústria de IA, seja com ações de criptomoedas ou ações de IA, todas apresentando uma pequena tendência de alta.
No entanto, essa onda parece não estar relacionada ao campo das criptomoedas. As tentativas recentes de Web3 AI, especialmente as explorações na direção de Agent, apresentam uma clara divergência: tentam montar um sistema modular multimodal no estilo Web2 usando uma estrutura descentralizada, o que, na verdade, é um desalinhamento tanto técnico quanto de pensamento. Hoje, com a forte acoplabilidade dos módulos, a distribuição de características altamente instável e a crescente concentração da demanda computacional, é difícil para a modularidade multimodal firmar-se no ambiente Web3.
O futuro da Web3 AI não está na imitação, mas sim na estratégia de contorno. Desde o alinhamento semântico em espaços de alta dimensão, passando pelo gargalo de informação nos mecanismos de atenção, até o alinhamento de características sob poder computacional heterogêneo, a Web3 AI precisa encontrar novos caminhos e descobrir sua própria trajetória de desenvolvimento.
O dilema do alinhamento semântico da IA Web3
Nos sistemas multimodais da moderna Web2 AI, "alinhamento semântico" é a tecnologia chave que mapeia informações de diferentes modalidades para o mesmo espaço semântico. Isso permite que o modelo compreenda e compare os significados intrínsecos por trás de diferentes formas de sinal. O espaço de incorporação de alta dimensão é a base para alcançar esse objetivo, permitindo que características semânticas complexas sejam codificadas em vetores de centenas ou até milhares de dimensões.
No entanto, o protocolo Web3 Agent é difícil de implementar em embeddings de alta dimensão. A maioria dos Web3 Agents apenas encapsula as APIs existentes em módulos independentes, carecendo de um espaço de embedding centralizado e de um mecanismo de atenção intermodular. Isso resulta em informações que não podem interagir entre os módulos de múltiplas perspectivas e múltiplos níveis, fazendo com que o sistema apresente uma funcionalidade única, dificultando a formação de uma otimização de ciclo fechado global.
Para implementar um agente inteligente de toda a cadeia com barreiras de entrada ao setor, é necessário começar com modelagem conjunta de ponta a ponta, incorporação unificada entre módulos e engenharia sistemática de treinamento e implantação colaborativos. No entanto, atualmente, não há demanda no mercado para isso, e, naturalmente, faltam soluções correspondentes.
Limitações do mecanismo de atenção
Modelos multimodais de alto nível requerem mecanismos de atenção projetados com precisão. O mecanismo de atenção é essencialmente uma forma de alocação dinâmica de recursos computacionais, permitindo que o modelo "focalize" seletivamente nas partes mais relevantes ao processar a entrada.
A IA Web2, ao projetar mecanismos de atenção, geralmente utiliza o padrão Query-Key-Value (Q-K-V), o que ajuda a identificar informações chave. No entanto, a IA Web3 baseada em modularidade tem dificuldade em implementar um agendamento de atenção unificado. As principais razões incluem:
Falta de um espaço Q-K-V unificado
Impossível realizar o cálculo paralelo da atenção múltipla
Falta de um contexto central em tempo real entre os módulos
Assim, apenas encapsular várias funcionalidades em APIs discretas não permite construir uma capacidade de "agendamento de atenção unificada" como a do Transformer.
Dilema superficial da fusão de características
A fusão de características é a combinação adicional de vetores de características obtidos após o processamento de diferentes modalidades, baseada em alinhamento e atenção. A Web3 AI atualmente está no estágio mais simples de concatenação, principalmente devido à falta de espaço de alta dimensão e mecanismos de atenção precisos como pré-requisitos.
A IA Web2 tende a um treinamento conjunto de ponta a ponta, enquanto a IA Web3 adota mais a abordagem de montagem de módulos discretos. Essa abordagem carece de um objetivo de treinamento unificado e não tem fluxo de gradiente entre módulos, resultando em uma fusão de características que permanece na fase superficial de montagem estática.
Barreiras de entrada na indústria de IA e oportunidades futuras
As barreiras tecnológicas da indústria de IA estão a aprofundar-se continuamente. O sistema multimodal de IA Web2 é um enorme projeto de engenharia que requer uma quantidade massiva de dados, poder computacional robusto, algoritmos avançados e capacidades de engenharia sistemática. Isso constitui uma barreira de indústria muito forte e também cria a vantagem competitiva central de algumas equipas líderes.
No entanto, a oportunidade do Web3 AI pode residir na tática de " cercar as cidades a partir do campo". O Web3 AI deve experimentar em pequena escala em cenários periféricos, como estruturas leves, tarefas facilmente paralelizáveis e incentiváveis. Isso pode incluir ajustes finos de LoRA, tarefas de pós-treinamento de alinhamento comportamental, treinamento e rotulagem de dados por crowdsourcing, treinamento de pequenos modelos base, bem como treinamento colaborativo em dispositivos de borda.
É importante notar que as barreiras atuais da IA Web2 estão apenas começando a se formar, sendo esta uma fase inicial da competição entre as principais empresas. A verdadeira oportunidade da IA Web3 pode ter que esperar até que os benefícios da IA Web2 desapareçam, sendo os pontos problemáticos deixados por ela o melhor momento para a IA Web3 entrar.
Antes disso, os projetos de Web3 AI precisam ter as seguintes características:
Entrar pela margem e estabelecer-se em pequenos cenários.
Combinação de pontos e superfícies, avanço em forma circular, iterando e atualizando continuamente em pequenos cenários de aplicação.
Manter flexibilidade e ser capaz de se adaptar rapidamente às necessidades de diferentes cenários
Somente projetos que possuam essas características têm a possibilidade de ocupar um lugar no futuro do campo Web3 AI.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
16 gostos
Recompensa
16
7
Partilhar
Comentar
0/400
TokenomicsTinfoilHat
· 19h atrás
investidor de retalho ainda está a ganhar dinheiro nos sonhos
Ver originalResponder0
YieldChaser
· 08-04 19:01
O mundo crypto voltou a desandar.
Ver originalResponder0
DevChive
· 08-03 12:44
É só fazer e acabou, não enche.
Ver originalResponder0
FlyingLeek
· 08-03 12:41
ai é uma bolha, cai quando vê
Ver originalResponder0
HalfIsEmpty
· 08-03 12:31
As ações americanas fizeram as pessoas de parvas no mundo crypto depois de cortar.
Estratégia indireta da Web3 AI: superando barreiras a partir de cenários periféricos
Desafios e Direções Futuras da Web3 AI
A cotação das ações da Nvidia atingiu um novo máximo, e os avanços nos modelos multimodais aprofundaram ainda mais a barreira tecnológica da IA no Web2. Desde o alinhamento semântico até a compreensão visual, passando pela incorporação em alta dimensão até a fusão de características, modelos complexos estão integrando, a uma velocidade sem precedentes, várias formas de expressão, construindo uma fortaleza de IA cada vez mais fechada. O mercado de ações dos EUA também demonstrou, com ações concretas, otimismo em relação à indústria de IA, seja com ações de criptomoedas ou ações de IA, todas apresentando uma pequena tendência de alta.
No entanto, essa onda parece não estar relacionada ao campo das criptomoedas. As tentativas recentes de Web3 AI, especialmente as explorações na direção de Agent, apresentam uma clara divergência: tentam montar um sistema modular multimodal no estilo Web2 usando uma estrutura descentralizada, o que, na verdade, é um desalinhamento tanto técnico quanto de pensamento. Hoje, com a forte acoplabilidade dos módulos, a distribuição de características altamente instável e a crescente concentração da demanda computacional, é difícil para a modularidade multimodal firmar-se no ambiente Web3.
O futuro da Web3 AI não está na imitação, mas sim na estratégia de contorno. Desde o alinhamento semântico em espaços de alta dimensão, passando pelo gargalo de informação nos mecanismos de atenção, até o alinhamento de características sob poder computacional heterogêneo, a Web3 AI precisa encontrar novos caminhos e descobrir sua própria trajetória de desenvolvimento.
O dilema do alinhamento semântico da IA Web3
Nos sistemas multimodais da moderna Web2 AI, "alinhamento semântico" é a tecnologia chave que mapeia informações de diferentes modalidades para o mesmo espaço semântico. Isso permite que o modelo compreenda e compare os significados intrínsecos por trás de diferentes formas de sinal. O espaço de incorporação de alta dimensão é a base para alcançar esse objetivo, permitindo que características semânticas complexas sejam codificadas em vetores de centenas ou até milhares de dimensões.
No entanto, o protocolo Web3 Agent é difícil de implementar em embeddings de alta dimensão. A maioria dos Web3 Agents apenas encapsula as APIs existentes em módulos independentes, carecendo de um espaço de embedding centralizado e de um mecanismo de atenção intermodular. Isso resulta em informações que não podem interagir entre os módulos de múltiplas perspectivas e múltiplos níveis, fazendo com que o sistema apresente uma funcionalidade única, dificultando a formação de uma otimização de ciclo fechado global.
Para implementar um agente inteligente de toda a cadeia com barreiras de entrada ao setor, é necessário começar com modelagem conjunta de ponta a ponta, incorporação unificada entre módulos e engenharia sistemática de treinamento e implantação colaborativos. No entanto, atualmente, não há demanda no mercado para isso, e, naturalmente, faltam soluções correspondentes.
Limitações do mecanismo de atenção
Modelos multimodais de alto nível requerem mecanismos de atenção projetados com precisão. O mecanismo de atenção é essencialmente uma forma de alocação dinâmica de recursos computacionais, permitindo que o modelo "focalize" seletivamente nas partes mais relevantes ao processar a entrada.
A IA Web2, ao projetar mecanismos de atenção, geralmente utiliza o padrão Query-Key-Value (Q-K-V), o que ajuda a identificar informações chave. No entanto, a IA Web3 baseada em modularidade tem dificuldade em implementar um agendamento de atenção unificado. As principais razões incluem:
Assim, apenas encapsular várias funcionalidades em APIs discretas não permite construir uma capacidade de "agendamento de atenção unificada" como a do Transformer.
Dilema superficial da fusão de características
A fusão de características é a combinação adicional de vetores de características obtidos após o processamento de diferentes modalidades, baseada em alinhamento e atenção. A Web3 AI atualmente está no estágio mais simples de concatenação, principalmente devido à falta de espaço de alta dimensão e mecanismos de atenção precisos como pré-requisitos.
A IA Web2 tende a um treinamento conjunto de ponta a ponta, enquanto a IA Web3 adota mais a abordagem de montagem de módulos discretos. Essa abordagem carece de um objetivo de treinamento unificado e não tem fluxo de gradiente entre módulos, resultando em uma fusão de características que permanece na fase superficial de montagem estática.
Barreiras de entrada na indústria de IA e oportunidades futuras
As barreiras tecnológicas da indústria de IA estão a aprofundar-se continuamente. O sistema multimodal de IA Web2 é um enorme projeto de engenharia que requer uma quantidade massiva de dados, poder computacional robusto, algoritmos avançados e capacidades de engenharia sistemática. Isso constitui uma barreira de indústria muito forte e também cria a vantagem competitiva central de algumas equipas líderes.
No entanto, a oportunidade do Web3 AI pode residir na tática de " cercar as cidades a partir do campo". O Web3 AI deve experimentar em pequena escala em cenários periféricos, como estruturas leves, tarefas facilmente paralelizáveis e incentiváveis. Isso pode incluir ajustes finos de LoRA, tarefas de pós-treinamento de alinhamento comportamental, treinamento e rotulagem de dados por crowdsourcing, treinamento de pequenos modelos base, bem como treinamento colaborativo em dispositivos de borda.
É importante notar que as barreiras atuais da IA Web2 estão apenas começando a se formar, sendo esta uma fase inicial da competição entre as principais empresas. A verdadeira oportunidade da IA Web3 pode ter que esperar até que os benefícios da IA Web2 desapareçam, sendo os pontos problemáticos deixados por ela o melhor momento para a IA Web3 entrar.
Antes disso, os projetos de Web3 AI precisam ter as seguintes características:
Somente projetos que possuam essas características têm a possibilidade de ocupar um lugar no futuro do campo Web3 AI.