Synergie entre l'IA et le Web3 : construire un écosystème d'IA décentralisé

AI+Web3 : Tours et places

TL;DR

  1. Les projets Web3 basés sur l'IA deviennent des cibles d'attraction de capitaux sur les marchés primaire et secondaire.

  2. Les opportunités de Web3 dans l'industrie de l'IA se manifestent par : l'utilisation d'incitations distribuées pour coordonner les potentiels fournisseurs dans la longue traîne ------ à travers les données, le stockage et le calcul ; en même temps, établir un modèle open source ainsi qu'un marché décentralisé pour les agents IA.

  3. L'IA trouve principalement son utilité dans l'industrie Web3 pour la finance en chaîne (paiements cryptographiques, transactions, analyse de données) ainsi que pour l'assistance au développement.

  4. L'utilité de l'IA+Web3 se manifeste dans la complémentarité des deux : Web3 espère lutter contre la centralisation de l'IA, et l'IA espère aider Web3 à sortir de son cercle.

AI+Web3 : Tours et Places

Introduction

Au cours des deux dernières années, le développement de l'IA a été comme si un bouton d'accélération avait été pressé. Cette vague provoquée par Chatgpt a non seulement ouvert un nouveau monde pour l'intelligence artificielle générative, mais a également suscité un courant dans le Web3 de l'autre côté.

Avec le soutien du concept d'IA, le financement du marché de la cryptographie, qui ralentit, montre une nette amélioration. Selon les médias, rien qu'au premier semestre 2024, 64 projets Web3+IA ont complété leur financement, et le système d'exploitation basé sur l'intelligence artificielle Zyber365 a atteint un montant de financement maximal de 100 millions de dollars lors de son tour de financement de série A.

Le marché secondaire est plus prospère, les données des sites de regroupement de cryptomonnaies montrent qu'en un peu plus d'un an, la capitalisation totale du secteur de l'IA a atteint 48,5 milliards de dollars, avec un volume de transactions de près de 8,6 milliards de dollars sur 24 heures ; les progrès des technologies d'IA majeures apportent des avantages évidents, après la publication du modèle de texte à vidéo Sora d'OpenAI, le prix moyen du secteur de l'IA a augmenté de 151 % ; l'effet IA s'étend également à l'un des secteurs d'attraction de cryptomonnaies, les Memes : le premier concept de MemeCoin d'Agent IA ------ GOAT a rapidement gagné en popularité et a atteint une valorisation de 1,4 milliard de dollars, déclenchant avec succès la tendance des AI Memes.

La recherche et les sujets autour de AI+Web3 sont tout aussi en vogue, passant de AI+Depin à AI Memecoin, puis aux AI Agent et AI DAO actuels, le sentiment de FOMO ne suit déjà plus la vitesse de rotation des nouveaux récits.

AI+Web3, cette combinaison de termes remplie d'argent facile, de tendances et de fantasmes futurs, ne peut que susciter chez certains l'idée d'un mariage arrangé orchestré par le capital. Il semble que nous ayons du mal à discerner, sous cet habit majestueux, s'il s'agit vraiment d'un terrain de jeu pour les spéculateurs ou de la veille d'une explosion à l'aube.

Pour répondre à cette question, une réflexion clé pour les deux parties est : cela s'améliorera-t-il avec l'autre ? Peut-on bénéficier du modèle de l'autre ? Dans cet article, nous essayons également de nous appuyer sur les épaules de nos prédécesseurs pour examiner ce schéma : comment le Web3 peut-il jouer un rôle à chaque étape de la pile technologique de l'IA, et qu'est-ce que l'IA peut apporter de nouveau au Web3 ?

Partie 1 Quelles opportunités pour Web3 sous la pile AI ?

Avant d'aborder ce sujet, nous devons comprendre la pile technologique des grands modèles d'IA :

Exprimez l'ensemble du processus dans un langage plus simple : le « grand modèle » est comme le cerveau humain. À ses débuts, ce cerveau appartient à un bébé qui vient d'arriver dans le monde et qui doit observer et ingérer une quantité massive d'informations externes pour comprendre ce monde. C'est la phase de « collecte » des données. Étant donné que les ordinateurs ne possèdent pas plusieurs des sens humains tels que la vue et l'ouïe, avant l'entraînement, les vastes informations non étiquetées provenant de l'extérieur doivent être transformées par « prétraitement » en un format d'information compréhensible et utilisable par l'ordinateur.

Après avoir saisi les données, l'IA a construit un modèle capable de compréhension et de prédiction grâce à l'« entraînement », ce qui peut être considéré comme le processus par lequel un bébé comprend et apprend progressivement le monde extérieur. Les paramètres du modèle sont comme les capacités linguistiques d'un bébé qui s'ajustent continuellement au cours de son apprentissage. Lorsque le contenu appris commence à être spécialisé ou que des retours d'expérience sont obtenus par la communication avec les gens et que des corrections sont apportées, le modèle entre alors dans la phase de « réglage fin ».

Les enfants, en grandissant et en apprenant à parler, peuvent comprendre le sens et exprimer leurs sentiments et pensées dans de nouvelles conversations. Cette étape est similaire au « raisonnement » des grands modèles d'IA, qui sont capables de prédire et d'analyser de nouvelles entrées de langage et de texte. Les bébés expriment leurs sentiments, décrivent des objets et résolvent divers problèmes grâce à leurs compétences linguistiques, ce qui est également comparable à l'application des grands modèles d'IA dans des tâches spécifiques après l'achèvement de l'entraînement et leur mise en service, comme la classification d'images, la reconnaissance vocale, etc.

L'AI Agent se rapproche de la prochaine forme des grands modèles ------ capable d'exécuter des tâches de manière indépendante et de poursuivre des objectifs complexes, possédant non seulement des capacités de réflexion, mais également la mémoire, la planification, et la capacité d'utiliser des outils pour interagir avec le monde.

Actuellement, en réponse aux points de douleur de l'IA dans différentes piles, le Web3 a commencé à former un écosystème multi-niveaux et interconnecté, couvrant toutes les étapes du processus des modèles d'IA.

AI+Web3 : Tours et places

I. Couche de base : Airbnb de puissance de calcul et de données

▎Puissance de calcul

Aujourd'hui, l'un des coûts les plus élevés de l'IA est la puissance de calcul et l'énergie nécessaires pour entraîner et inférer des modèles.

Un exemple est que le LLAMA3 de Meta nécessite 16 000 H100GPU produits par NVIDIA (qui est une unité de traitement graphique haut de gamme conçue pour l'intelligence artificielle et les charges de travail de calcul haute performance) pour compléter l'entraînement en 30 jours. Le prix unitaire de la version de 80 Go se situe entre 30 000 et 40 000 dollars, ce qui nécessite un investissement en matériel de calcul de 400 à 700 millions de dollars (GPU + puces réseau), tandis que l'entraînement mensuel consomme 1,6 milliard de kilowattheures, avec des dépenses énergétiques de près de 20 millions de dollars par mois.

La décompression de la puissance de calcul AI est également l'un des premiers domaines où Web3 croise l'IA ------ DePin (réseau d'infrastructure physique décentralisé). Actuellement, le site de données a déjà répertorié plus de 1400 projets, parmi lesquels les projets représentatifs de partage de puissance GPU incluent io.net, Aethir, Akash, Render Network, etc.

La logique principale réside dans le fait que la plateforme permet aux particuliers ou entités disposant de ressources GPU inutilisées de contribuer à leur puissance de calcul de manière décentralisée et sans autorisation, à travers un marché en ligne semblable à celui d'Uber ou d'Airbnb, augmentant ainsi le taux d'utilisation des ressources GPU sous-utilisées. Les utilisateurs finaux bénéficient également de ressources de calcul efficaces à moindre coût ; en même temps, le mécanisme de mise en jeu garantit que si des violations des mécanismes de contrôle de la qualité ou des interruptions de réseau se produisent, les fournisseurs de ressources subissent les sanctions correspondantes.

Ses caractéristiques sont :

  • Rassembler des ressources GPU inutilisées : les fournisseurs sont principalement de petits et moyens centres de données indépendants tiers, des opérateurs de surplus de puissance de calcul de mines de cryptomonnaies, ainsi que du matériel de minage avec un mécanisme de consensus PoS, comme les machines de minage FileCoin et ETH. Actuellement, certains projets s'efforcent de lancer des équipements avec des seuils d'entrée plus bas, comme exolab qui utilise des appareils locaux tels que MacBook, iPhone, iPad pour établir un réseau de puissance de calcul pour l'inférence de grands modèles.

  • Face au marché de la longue traîne de la puissance de calcul IA :

a. « Du point de vue technique », le marché de la puissance de calcul décentralisée est plus adapté aux étapes d'inférence. L'entraînement dépend davantage de la capacité de traitement des données apportée par les GPU à très grande échelle, tandis que l'inférence nécessite relativement moins de performances de calcul GPU, comme Aethir qui se concentre sur le rendu à faible latence et les applications d'inférence IA.

b. Du côté de la demande, les petites et moyennes entreprises ne formeront pas leur propre grand modèle, mais choisiront simplement d'optimiser et de peaufiner autour de quelques grands modèles leaders, et ces scénarios conviennent naturellement aux ressources de calcul inutilisées distribuées.

  • Propriété décentralisée : La signification technique de la blockchain réside dans le fait que les propriétaires de ressources conservent toujours le contrôle sur leurs ressources, ajustant de manière flexible selon la demande, tout en réalisant des bénéfices.

▎Données

Les données sont la base de l'IA. Sans données, le calcul est aussi inutile qu'une feuille flottante, et la relation entre les données et le modèle est comme le dicton " Garbage in, Garbage out ". La quantité de données et la qualité des entrées déterminent la qualité de la sortie du modèle final. Pour l'entraînement des modèles d'IA actuels, les données déterminent la capacité linguistique du modèle, sa capacité de compréhension, voire ses valeurs et son expression humanisée. Actuellement, les problèmes de demande de données pour l'IA se concentrent principalement sur quatre aspects :

  • Soif de données : L'entraînement des modèles d'IA repose sur un grand volume d'entrées de données. Les documents publics montrent que le nombre de paramètres utilisés pour entraîner GPT-4 par OpenAI a atteint le niveau des trillions.

  • Qualité des données : Avec la combinaison de l'IA et de divers secteurs, la temporalité des données, la diversité des données, la spécialisation des données sectorielles et l'intégration de nouvelles sources de données telles que les émotions des médias sociaux posent de nouvelles exigences sur leur qualité.

  • Questions de confidentialité et de conformité : Actuellement, divers pays et entreprises prennent progressivement conscience de l'importance des ensembles de données de qualité et imposent des restrictions sur le scraping des ensembles de données.

  • Coûts de traitement des données élevés : volume de données important, processus de traitement complexe. Selon des sources publiques, plus de 30 % des coûts de recherche et développement des entreprises d'IA sont consacrés à la collecte et au traitement des données de base.

Actuellement, les solutions web3 se manifestent dans les quatre domaines suivants :

  1. Collecte de données : La disponibilité des données du monde réel récupérées gratuitement s'épuise rapidement, et les dépenses des entreprises d'IA pour les données augmentent chaque année. Cependant, ces dépenses ne se répercutent pas sur les véritables contributeurs des données, les plateformes profitant entièrement de la création de valeur générée par les données, comme Reddit, qui a réalisé un revenu total de 203 millions de dollars grâce à des accords de licence de données signés avec des entreprises d'IA.

Permettre aux utilisateurs qui contribuent réellement de participer également à la création de valeur apportée par les données, et d'obtenir des données plus privées et plus précieuses à moindre coût grâce à un réseau distribué et un mécanisme d'incitation, est la vision du Web3.

  • Grass est une couche de données et un réseau décentralisés, permettant aux utilisateurs de faire fonctionner des nœuds Grass, de contribuer à la bande passante inutilisée et au trafic de relais afin de capturer des données en temps réel de l'ensemble d'Internet et d'obtenir des récompenses en jetons ;

  • Vana a introduit un concept unique de pool de liquidité de données (DLP), permettant aux utilisateurs de télécharger leurs données privées (comme les historiques d'achats, les habitudes de navigation, les activités sur les réseaux sociaux, etc.) dans un DLP spécifique, et de choisir de manière flexible s'ils souhaitent autoriser l'utilisation de ces données par des tiers spécifiques ;

  • Sur une certaine plateforme d'IA, les utilisateurs peuvent utiliser #AI 或#Web3 comme étiquette de classification sur les plateformes sociales et @ cette plateforme pour collecter des données.

  1. Prétraitement des données : Dans le processus de traitement des données par l'IA, les données collectées sont souvent bruyantes et contiennent des erreurs, elles doivent donc être nettoyées et converties en un format utilisable avant de former le modèle, ce qui implique des tâches répétitives de normalisation, de filtrage et de traitement des valeurs manquantes. Cette étape est l'un des rares moments de travail manuel dans l'industrie de l'IA, ayant donné naissance à la profession de annotateur de données. À mesure que les exigences de qualité des données du modèle augmentent, le seuil d'entrée pour les annotateurs de données s'élève également, et cette tâche est naturellement adaptée au mécanisme d'incitation décentralisé de Web3.
  • Actuellement, Grass et OpenLayer envisagent tous deux d'intégrer cette étape clé de l'annotation des données.

  • Synesis a proposé le concept de « Train2earn », mettant l'accent sur la qualité des données, les utilisateurs pouvant obtenir des récompenses en fournissant des données annotées, des commentaires ou d'autres formes d'apport.

  • Le projet de annotation de données Sapien gamifie les tâches de marquage et permet aux utilisateurs de miser des points pour en gagner davantage.

  1. Confidentialité et sécurité des données : il est important de clarifier que la confidentialité et la sécurité des données sont deux concepts différents. La confidentialité des données concerne le traitement des données sensibles, tandis que la sécurité des données protège les informations des données contre l'accès, la destruction et le vol non autorisés. Ainsi, les avantages des technologies de confidentialité Web3 et leurs applications potentielles se manifestent de deux manières : (1) l'entraînement de données sensibles ; (2) la collaboration sur les données : plusieurs propriétaires de données peuvent participer ensemble à l'entraînement de l'IA sans avoir à partager leurs données brutes.

Les technologies de confidentialité actuellement courantes dans le Web3 incluent :

  • Environnement d'exécution de confiance ( TEE ), tel que Super Protocol ;

  • Chiffrement homomorphe complet (FHE), par exemple BasedAI, Fhenix.io ou Inco Network ;

  • La technologie à connaissance nulle (zk), comme le Protocole Reclaim utilisant la technologie zkTLS, génère des preuves à connaissance nulle pour le trafic HTTPS, permettant aux utilisateurs d'importer en toute sécurité des activités, des données de réputation et d'identité à partir de sites externes sans exposer d'informations sensibles.

Cependant, ce domaine en est encore à ses débuts, la plupart des projets étant encore en phase d'exploration. Un des dilemmes actuels est que le coût de calcul est trop élevé, quelques exemples sont :

  • cadre zkML E
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 4
  • Partager
Commentaire
0/400
0xSleepDeprivedvip
· Il y a 10h
C'est un peu intéressant ça.
Voir l'originalRépondre0
GasFeeSobbervip
· Il y a 10h
Le projet a un bon potentiel.
Voir l'originalRépondre0
WalletWhisperervip
· Il y a 10h
Le futur est déjà là, le futur est prometteur.
Voir l'originalRépondre0
CryptoAdventurervip
· Il y a 10h
All in nouveau secteur entrer dans une position
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)