Yupp construit un nouveau paradigme d'évaluation AI grâce à la Blockchain ; l'incitation par la foule redéfinit la découverte et l'utilisation des modèles.

Comment Yupp utilise Blockchain et des mécanismes d'incitation pour reconfigurer le modèle d'évaluation de l'IA ?

Les applications d'IA pénètrent profondément divers secteurs, et comment évaluer avec précision les performances des modèles et améliorer la confiance des utilisateurs est un problème urgent à résoudre. Les méthodes d'évaluation traditionnelles dépendent souvent de mécanismes centralisés, ce qui rend difficile la couverture de scénarios diversifiés et ne peut pas refléter fidèlement les préférences des utilisateurs. Parallèlement, le problème de "l'illusion" des modèles se produit fréquemment, et les utilisateurs se retrouvent souvent piégés dans une chambre d'écho d'informations lors de leurs choix.

Dans ce contexte, la nouvelle plateforme Yupp, grâce à son mode de fonctionnement unique basé sur le crowdsourcing et son mécanisme d'incitation, tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA, apportant une véritable révolution paradigmique dans le domaine de l'évaluation de l'IA. Cet article analysera en profondeur les mécanismes fondamentaux de Yupp, ses points techniques forts, le contexte de son équipe et son impact potentiel sur l'écosystème de l'IA.

Contexte de l'équipe et financement

Yupp s'engage à résoudre le problème d'évaluation qui existe depuis longtemps dans le domaine de l'IA, visant à construire un marché de retour d'information sur l'IA "dématérialisé". Grâce à la Blockchain et aux incitations économiques cryptographiques, les retours d'expérience diversifiés des utilisateurs peuvent circuler librement, formant une couche d'évaluation de modèle évolutive, équitable et transparente. Yupp aide les développeurs d'IA à itérer et à optimiser les performances des modèles en incitant à la distribution de données annotées manuellement de haute qualité, capturant rapidement les besoins et préférences réels des utilisateurs dans différents scénarios.

Le projet a été fondé en juin 2024 par Pankaj Gupta (co-fondateur et CEO) et Gilad Mishne (co-fondateur et responsable de l'IA), avec la participation du chef scientifique Jimmy Lin (professeur à l'Université de Waterloo) au sein de l'équipe principale. Les trois ont travaillé ensemble chez Twitter, où ils ont conçu et optimisé des systèmes de recommandation et de recherche à grande échelle, puis ont acquis une riche expérience chez Google et sur une certaine plateforme d'échange.

La vision décentralisée et de transparence de la valeur des données de Yupp répond à la double exigence des fabricants d'IA pour une évaluation fiable et la participation des utilisateurs. De plus, l'expérience riche de l'équipe dirigeante a obtenu la reconnaissance élevée de personnalités célèbres de l'industrie technologique et de capital-risqueurs de premier plan.

Récemment, Yupp a annoncé avoir terminé un tour de financement de 33 millions de dollars, dirigé par un partenaire de capital-risque bien connu, avec d'autres investisseurs incluant le scientifique en chef de Google Jeff Dean, le cofondateur de Twitter Biz Stone, le cofondateur de Pinterest Evan Sharp, le PDG de Perplexity Aravind Srinivas, Dan Boneh de l'université de Stanford, Chris Re, Nick McKeown et Balaji Prabhakar, ainsi que 45 anges et cadres d'entreprise renommés, ainsi qu'un département d'investissement d'une plateforme d'échange.

a16z a mené un tour de table de 33 millions de dollars, comment Yupp réinvente-t-il le modèle d'évaluation de l'IA basé sur la Blockchain et l'incitation ?

Fonctions principales et expérience utilisateur

En tant que plateforme d'évaluation d'IA centralisée, Yupp adhère au principe de "l'IA pour tous", permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement à une réponse unique traditionnelle, Yupp retourne simultanément deux (voire plus) réponses de modèles pour chaque prompt, formant ainsi un "congrès d'IA". Ce design non seulement répond aux besoins des utilisateurs en matière de choix diversifié, mais permet également d'identifier efficacement les "hallucinations" potentielles des modèles, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison. Comme le dit le PDG de Yupp, la sortie en parallèle est particulièrement bénéfique pour les utilisateurs soucieux des erreurs de génération, car elle leur permet de valider les résultats par recoupement.

La plateforme prend désormais en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris plusieurs modèles connus ainsi que de nombreux modèles émergents. Pour optimiser davantage l'expérience, Yupp a également lancé la fonction "QuickTake", qui permet de condenser des réponses longues en un tweet concis.

De plus, Yupp attache une grande importance à la vie privée des utilisateurs : tous les enregistrements de chat sont par défaut privés, sauf si l'utilisateur choisit de les rendre publics ; même en cas de partage public, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler à tout moment le contenu et l'étendue du partage.

a16z a investi 33 millions de dollars dans le tour de table, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur le Blockchain et les incitations ?

Modèle économique et mécanismes d'incitation

Yupp utilisera gratuitement les retours des utilisateurs, mesurant l'utilisation des modèles via un système de "points". Les nouveaux utilisateurs reçoivent 5000 points lors de leur inscription, et peuvent gagner plus de points en notant les réponses des modèles, en choisissant leurs préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont généreuses, garantissant aux utilisateurs un accès gratuit et durable à des modèles haut de gamme. La plateforme s'engage à ce que les points n'augmentent que, et tous les modèles actuels peuvent être expérimentés gratuitement.

Après chaque question, l'utilisateur recevra deux réponses du modèle et pourra gagner une "carte à gratter numérique" grâce à ses retours, avec des récompenses de 0 à 250 points. Chaque 1000 points peuvent être échangés contre 1 dollar, avec un retrait maximum de 10 dollars par jour et 50 dollars par mois. Les points peuvent être échangés contre des dollars, des euros et plus de 20 autres devises, avec des partenaires incluant plusieurs plateformes de paiement de renom. En outre, la plateforme intègre certains réseaux de Blockchain et des stablecoins, offrant des récompenses instantanées et sans frais aux utilisateurs du monde entier.

Comme l'a dit le PDG, les retours d'expérience de haute qualité des utilisateurs ont une valeur bien supérieure à la récompense elle-même pour le fine-tuning des modèles et l'apprentissage renforcé des entreprises d'IA. Bien que les revenus mensuels des utilisateurs ne correspondent qu'à quelques tasses de café, ces données d'annotation payantes sont cruciales pour l'itération de l'IA.

Pour inciter plus de personnes à participer, Yupp a également mis en place une récompense de parrainage : le parrain reçoit 5000 points, le filleul reçoit 1000 points ; actuellement, les nouveaux utilisateurs enregistrés peuvent obtenir 5000 points, et le filleul reçoit 2500 points supplémentaires.

a16z a mené un tour de table de 33 millions de dollars, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur la Blockchain et les incitations ?

Yupp VIBE Score : Une nouvelle approche d'évaluation par l'IA

Pour répondre aux problèmes de transparence insuffisante des classements existants, de manque d'équité et d'accès inégal aux données d'évaluation, Yupp a lancé la version bêta du classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système agrège les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, avec pour objectif de fournir des résultats d'évaluation robustes et fiables.

Les principes d'évaluation de Yupp comprennent :

  • Stabilité : garantir la représentativité (couvrir des scénarios variés), l'authenticité (refléter les préoccupations des utilisateurs), et la résistance à la tricherie (se défendre contre les comportements malveillants) ;

  • Fiabilité : équitable et neutre (sans biais envers le modèle), transparent et public (divulgation détaillée de l'algorithme de classement), rigoureux et scientifique (conformité aux normes d'évaluation).

La plateforme ne se contente pas de collecter des préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses (comme "pertinent", "rapide", "bon style", etc.), et effectue une analyse de segmentation en fonction des informations sur l'âge, l'éducation, la profession des utilisateurs, afin de montrer les différences de préférences entre les différents groupes.

Sur le plan technique, Yupp explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance afin d'assurer l'équité, la transparence et la vérifiabilité du processus d'évaluation. Parallèlement, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour calibrer les évaluateurs par la vérification des dossiers et des contrôles de qualité multicouches, éliminant ainsi les données malveillantes.

Le classement a été mis à jour récemment, affichant les scores VIBE de plusieurs modèles d'IA bien connus ainsi que leurs taux de victoire, de désaccord, de vitesse, de latence, de fenêtre contextuelle et d'indicateurs de coût.

![a16z a investi 33 millions de dollars dans un tour de seed, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur le Blockchain et les incitations ?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01

Historique et perspectives d'avenir

Yupp sera officiellement lancé le 13 juin 2025, après six mois de tests internes. Depuis son lancement, le produit a continué à évoluer :

  • Support multimodal : connexion à plusieurs modèles de génération d'images et prise en charge des questions d'upload d'images/PDF par les utilisateurs ;

  • Extension des méthodes d'interaction : ajout de la saisie vocale et de la fonction de lecture vocale ;

  • Mise à jour du modèle : Introduction progressive de plusieurs nouveaux modèles et de la catégorie "MAX modèle" ;

  • Informations en temps réel : acheminer les demandes de requête en ligne vers la plateforme concernée, avec des citations de liens hypertextes ;

  • Mise à niveau des paiements : ajout de plusieurs méthodes de paiement et support de devises.

  • Partager l'exportation : prise en charge de la copie avec conservation du format, exportation en PDF/texte/Markdown, partage à la demande d'une seule réponse ou de l'ensemble de la conversation ;

  • Activités communautaires : organisation d'activités telles que le "Défi de suggestions IA", avec des prix allant jusqu'à des dizaines de milliers de points ; ajout d'une page de profil personnel, de noms de chat générés automatiquement par IA, etc.

La mission de Yupp est "d'autonomiser l'humanité à façonner l'avenir de l'IA". Le PDG estime que le développement de l'IA nécessite la participation et la contribution de chacun. Grâce à des réponses d'IA multi-perspectives et aux retours des utilisateurs, Yupp non seulement aide les utilisateurs à mieux décider, mais fournit également un élan constant à l'évolution de l'IA.

Il convient de mentionner que l'un des principaux concurrents de Yupp est la plateforme d'évaluation de modèles d'IA LMArena, qui est très populaire parmi les professionnels de l'IA, mais qui est actuellement en phase d'exploration commerciale et n'a pas encore utilisé la technologie Blockchain pour offrir des récompenses matérielles ou des mécanismes d'incitation par points directement aux utilisateurs.

Dans l'ensemble, Yupp a ouvert une nouvelle voie d'évaluation de l'IA grâce à un système d'évaluation basé sur la foule, un mécanisme d'incitation et les préférences réelles des utilisateurs. Il offre non seulement aux utilisateurs une expérience interactive avec l'IA gratuite et variée, mais transforme également les retours des utilisateurs en données d'entraînement de haute valeur, favorisant ainsi l'optimisation continue des modèles. Avec une équipe expérimentée et un soutien de capitaux de premier ordre, Yupp devrait jouer un rôle clé dans l'écosystème de l'IA à l'avenir, réalisant la vision "Chacun bénéficie de l'IA, chacun façonne l'IA".

Cependant, pour Yupp qui vient tout juste d'être lancé, la manière de garantir en permanence la qualité des données, de résister aux comportements frauduleux potentiels, et d'atteindre un équilibre entre la commercialisation et l'incitation des utilisateurs sous une participation massive, sera toujours une direction à explorer et à optimiser dans son développement futur.

MAX-1.88%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 6
  • Partager
Commentaire
0/400
GetRichLeekvip
· Il y a 3h
Encore un projet qui prend les gens pour des idiots ! Les vieux pigeons disent qu'ils ont déjà tendu une embuscade.
Voir l'originalRépondre0
ForkTonguevip
· Il y a 9h
Blockchain et AI ? Ce n'est pas juste le chat de Schrödinger ?
Voir l'originalRépondre0
nft_widowvip
· 07-31 02:55
Un autre nouvel outil pour se faire prendre pour des cons ?
Voir l'originalRépondre0
GasGasGasBrovip
· 07-30 12:31
La Blockchain est vraiment de la merde, juste un coup marketing.
Voir l'originalRépondre0
VibesOverChartsvip
· 07-30 12:30
Tsk tsk, encore une levée de fonds ?
Voir l'originalRépondre0
DoomCanistervip
· 07-30 12:02
Ce n'est qu'un nouveau battage autour d'un ancien projet.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)