Stratégie détournée de l'IA Web3 : franchir les barrières à partir de scénarios périphériques

Les défis et les directions futures du Web3 AI

Le prix des actions d'NVIDIA atteint un nouveau sommet, les progrès des modèles multimodaux approfondissant encore la barrière technologique de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'incorporation haute dimensionnelle à la fusion des caractéristiques, des modèles complexes intègrent des modes d'expression variés à une vitesse sans précédent, construisant ainsi un bastion de l'IA de plus en plus fermé. Le marché boursier américain a également montré par des actions concrètes son optimisme envers l'industrie de l'IA, que ce soit pour les actions de cryptomonnaie ou d'IA, tous affichent une petite tendance haussière.

Cependant, cette vague semble être sans rapport avec le domaine des cryptomonnaies. Les récents essais de Web3 AI, en particulier l'exploration dans le domaine des Agents, montrent une déviation claire dans leur orientation : ils tentent d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée, ce qui représente en réalité un double décalage technique et conceptuel. Aujourd'hui, avec une forte couplabilité des modules, une distribution des caractéristiques hautement instable et une demande de puissance de calcul de plus en plus concentrée, il est difficile pour le modulaire multimodal de s'imposer dans l'environnement Web3.

L'avenir de l'IA Web3 ne réside pas dans l'imitation, mais dans des détours stratégiques. De l'alignement sémantique dans des espaces de haute dimension, aux goulets d'étranglement d'information dans les mécanismes d'attention, en passant par l'alignement des caractéristiques sous une puissance de calcul hétérogène, l'IA Web3 doit emprunter de nouvelles voies pour trouver son propre chemin de développement.

Le dilemme de l'alignement sémantique de l'IA Web3

Dans les systèmes multimodaux de l'IA Web2 moderne, "l'alignement sémantique" est la technologie clé qui permet de mapper des informations de différentes modalités dans le même espace sémantique. Cela permet au modèle de comprendre et de comparer les significations sous-jacentes des signaux sous différentes formes. L'espace d'embedding de haute dimension est la base pour atteindre cet objectif, car il permet de coder des caractéristiques sémantiques complexes dans des vecteurs de plusieurs centaines, voire de milliers de dimensions.

Cependant, le protocole Web3 Agent est difficile à réaliser en raison de l'intégration haute dimensionnelle. La plupart des agents Web3 ne font que encapsuler les API existantes en modules indépendants, manquant d'un espace d'intégration centralisé unifié et d'un mécanisme d'attention inter-module. Cela conduit à l'incapacité d'interagir avec les informations sous plusieurs angles et niveaux entre les modules, le système présentant une fonctionnalité unique et peinant à former une optimisation globale en boucle fermée.

Pour réaliser un agent intelligent à chaîne complète avec des barrières sectorielles, il est nécessaire de commencer par une modélisation conjointe de bout en bout, une intégration unifiée entre les modules, ainsi qu'une ingénierie systémique pour l'entraînement et le déploiement collaboratifs. Cependant, le marché actuel n'a pas encore exprimé un tel besoin, et il manque donc des solutions correspondantes.

Les limites du mécanisme d'attention

Les modèles multimodaux de haut niveau nécessitent des mécanismes d'attention conçus avec précision. Le mécanisme d'attention est essentiellement une manière de répartir dynamiquement les ressources de calcul, permettant au modèle de "se concentrer" sélectivement sur les parties les plus pertinentes lors du traitement des entrées.

L'IA Web2, lors de la conception des mécanismes d'attention, utilise généralement le modèle Query-Key-Value (Q-K-V), ce qui aide à identifier les informations clés. Cependant, l'IA Web3 basée sur la modularité a du mal à réaliser une planification d'attention unifiée. Les principales raisons incluent :

  1. Manque d'un espace Q-K-V unifié
  2. Impossible de réaliser le calcul parallèle de l'attention multi-tête
  3. Manque de contexte central partagé en temps réel entre les modules

Ainsi, se contenter d'encapsuler divers types de fonctions en API discrètes ne permet pas de construire une capacité de "planification d'attention unifiée" comme celle de Transformer.

Les dilemmes superficiels de la fusion des caractéristiques

La fusion des caractéristiques consiste à combiner davantage les vecteurs de caractéristiques obtenus après traitement de différentes modalités sur la base de l'alignement et de l'attention. L'IA Web3 en est actuellement au stade le plus simple de la concaténation, principalement en raison du manque d'espace à haute dimension et de mécanismes d'attention précis comme conditions préalables.

L'IA Web2 a tendance à s'entraîner de manière conjointe de bout en bout, tandis que l'IA Web3 adopte davantage une approche de concaténation de modules discrets. Cette méthode manque d'un objectif d'entraînement unifié et n'a pas de flux de gradients entre les modules, ce qui entraîne une fusion des caractéristiques qui reste à un stade de concaténation statique superficielle.

Barrières dans l'industrie de l'IA et opportunités futures

Les barrières technologiques dans l'industrie de l'IA continuent de se renforcer. Les systèmes multimodaux de l'IA Web2 représentent un vaste projet d'ingénierie, nécessitant des données massives, une puissance de calcul considérable, des algorithmes avancés et des capacités d'ingénierie systématique. Cela constitue une barrière industrielle très forte et forge le cœur de la compétitivité des rares équipes leaders.

Cependant, l'opportunité de l'IA Web3 pourrait résider dans la tactique de "l'encerclement des villes par les campagnes". L'IA Web3 devrait expérimenter à petite échelle dans des scénarios en périphérie, tels que des structures légères, des tâches facilement parallélisables et incitatives. Cela pourrait inclure l'ajustement LoRA, des tâches de post-formation pour l'alignement des comportements, l'entraînement et l'annotation de données en crowdsourcing, l'entraînement de petits modèles de base, ainsi que l'entraînement collaboratif sur des dispositifs périphériques.

Il convient de noter que les barrières actuelles de l'IA Web2 commencent à peine à se former, ce qui représente une phase précoce de la concurrence entre les grandes entreprises. La véritable opportunité pour l'IA Web3 pourrait ne survenir qu'après que les bénéfices de l'IA Web2 aient disparu, et les points de douleur qu'elle laissera derrière elle seront le meilleur moment pour l'IA Web3 d'entrer en jeu.

Avant cela, les projets d'IA Web3 doivent posséder les caractéristiques suivantes :

  1. Entrer par les bords et se stabiliser dans de petits scénarios.
  2. Combinaison de points et de surfaces, progression circulaire, itérations et mises à jour continues dans de petits scénarios d'application.
  3. Rester flexible et capable de s'adapter rapidement aux besoins de différents scénarios.

Seuls les projets qui possèdent ces caractéristiques ont une chance de se faire une place dans le domaine de l'IA Web3 à l'avenir.

AGENT-2.12%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 7
  • Partager
Commentaire
0/400
TokenomicsTinfoilHatvip
· Il y a 19h
Les investisseurs détaillants gagnent encore de l'argent dans leurs rêves.
Voir l'originalRépondre0
YieldChaservip
· 08-04 19:01
l'univers de la cryptomonnaie encore une fois à l'abandon.
Voir l'originalRépondre0
DevChivevip
· 08-03 12:44
C'est fini, ne discute pas.
Voir l'originalRépondre0
FlyingLeekvip
· 08-03 12:41
ai est une bulle, chute quand on voit.
Voir l'originalRépondre0
HalfIsEmptyvip
· 08-03 12:31
Les marchés boursiers américains prennent les gens pour des idiots dans l'univers de la cryptomonnaie.
Voir l'originalRépondre0
PumpBeforeRugvip
· 08-03 12:28
Le prochain bull run sera forcément dans la zone de l'IA.
Voir l'originalRépondre0
MetaverseHermitvip
· 08-03 12:20
C'est vraiment un chemin de mort, n'est-ce pas ?
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)