PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena.
Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
XRP Ledger alimente $280 millions de jetons Diamond dans une importante opération d'actifs réels aux Émirats arabes unis
La tokenisation par Ripple de 1 milliard d'AED en diamants, « n'est pas seulement une victoire pour les Émirats arabes unis, c'est une masterclass sur la façon dont le XRP Ledger gère à grande échelle les actifs réels de haute valeur », déclare Reece Merrick.
Le réseau résout le problème de la confiance en intégrant le coffre-fort de niveau bancaire de Ripple Custody avec la f native de XRPL.
CryptoNewsFlashIl y a 27m
PACT lance sur Aptos pour développer le crédit en chaîne dans le marché mondial de $300 billions
PACT a migré vers Aptos, traitant près de $2 milliards en prêts en chaîne et détenant plus de $600 millions en crédit actif.
Il représente plus de 75 % du volume de dette tokenisée du réseau et prévoit d'introduire des offres supplémentaires dans les mois à venir.
PACT a migré vers Aptos
CryptoNewsFlashIl y a 33m
Polygon annonce la mise à jour Lisovo le 4 mars pour améliorer les performances et la compatibilité des portefeuilles
Polygon activera la hardfork Lisovo le 4 mars avant le bloc 83 756 500, les opérateurs de nœuds étant invités à effectuer la mise à niveau à l'avance.
La mise à niveau ajoute des subventions en gaz PIP-82, la prise en charge de CLZ, des améliorations du portefeuille passkey, des frais flexibles et des contrôles de transaction renforcés.
La Fondation Polygon a
CryptoNewsFlashIl y a 38m
Heima fait progresser l'économie agentique pour des transactions d'IA sécurisées
Heima a lancé l'économie agentique, permettant aux agents IA autonomes de participer à des transactions dans un environnement blockchain sécurisé et non custodial. Cette infrastructure améliore la transparence et réduit les risques de piratage, permettant des transactions vérifiées et protégeant les actifs des utilisateurs.
BlockChainReporterIl y a 1h
La Fondation Ethereum publie la « Feuille de route du développement à long terme » : 7 hard forks en 4 ans, axés sur 5 grands objectifs
La Fondation Ethereum a publié le « Strawmap », un plan de développement à long terme, prévoyant 7 hard forks d'ici 2029, visant à atteindre 5 grands objectifs, à améliorer la vitesse des transactions et la capacité du réseau. Le plan de développement comprend la réduction du temps de confirmation finale des transactions à 8 secondes, l'introduction de la cryptographie quantique et de la protection de la vie privée, dans le but de se préparer à répondre à une demande utilisateur plus importante à l'avenir.
区块客Il y a 2h