AI Agent reprend le grand modèle de langage LLM et est devenu le sujet le plus brûlant dans le cercle de l'IA.
À l'heure actuelle, la situation dans le cercle du capital-risque de l'IA est à peu près la suivante :
Big Factory Club : les employés internes d'OpenAI affirment que AI Agent est la nouvelle direction d'OpenAI ; Microsoft essaie de promouvoir le copilote et de laisser l'IA jouer le rôle d'assistant, ce qui est un scénario typique d'AI Agent ; NVIDIA a lancé Voyager, cet AI Agent peut être autonome Écrire du code pour dominer le jeu "Minecraft" ; SenseTime domestique a également lancé un agent d'IA généraliste ; Alibaba a lancé un employé numérique...
Cercle académique : en avril de cette année, Stanford a créé une ville Westworld, permettant à 25 agents IA de simuler des humains dans l'environnement sandbox de la ville virtuelle, et de tomber amoureux, de faire la fête, de collaborer, de sortir avec d'autres agents IA, etc. En outre, certains chercheurs ont commencé à utiliser des agents d'IA pour concevoir des expériences scientifiques complexes, notamment la lecture automatique d'articles en ligne et la recherche de médicaments anticancéreux... Ces explorations de pointe sont époustouflantes.
Entrepreneurship Circle : AI Agent n'est pas seulement un jeu destiné aux scientifiques de haut niveau. De nombreux projets tels que Camel, AutoGPT, BabyAGI et AgentGPT ont vu le jour. Il existe également un grand nombre de développeurs et d'entrepreneurs de la communauté open source qui utilisent ces projets open source pour créer quelques outils pratiques. . Par exemple, aomni est une application AI Agent qui aide les utilisateurs à capturer des informations sur le réseau et à les envoyer par e-mail.
Cercle d'investissement : AI Agent est considéré comme « le début de l'ère de l'intelligence artificielle générale (AGI) », et son épidémie est « à toute épreuve ». Certains entrepreneurs de la Silicon Valley ont déclaré que lorsqu'ils discutaient avec les investisseurs sur les agents génératifs, tout le monde regardait vers l'avant. à cela et en espérant que vous comprendrez davantage, vous rapprocherez et réagirez plus rapidement aux explosions ultérieures.
A partir de ces jugements, il est encore trop tôt pour dire que « AI Agent a ouvert la seconde moitié des grands modèles », mais il doit être clair que « AI Agent est le standard commercial pour les grands modèles ».
Par conséquent, nous devrions ensuite voir davantage de grands fabricants et de startups prendre davantage de mesures sur AI Agent.
Alors, qu’est-ce que l’AI Agent exactement ? Pourquoi est-ce considéré comme une condition nécessaire à la commercialisation de grands modèles ?
Le grand modèle est arrogant et arrogant, mais les utilisateurs ne paient toujours pas.
Ici, nous mettons d'abord l'agent IA de côté et examinons à quoi ressemble le grand modèle.
Je crois que la plupart des lecteurs s'accordent sur le fait que les grands modèles sont quelque chose avec une vision élevée, un investissement élevé et un seuil élevé. D'un point de vue sentimental, il est possible de réaliser une intelligence artificielle générale et de changer complètement la société ; d'un point de vue laïque, elle peut reconstruire les affaires/ produits et permettre aux entreprises technologiques d'améliorer leurs performances.
Mais tout cela repose sur le fait que les grands modèles peuvent être véritablement commercialisés, récupérer les coûts de R&D et parvenir à un développement sain et durable.
Au cours des derniers mois, deux modèles commerciaux pour les grands modèles sont devenus plus efficaces : l'un est le déploiement local privatisé de grands modèles par les gouvernements et les entreprises de divers secteurs ; l'autre est la puissance de calcul requise pour vendre de grands modèles via des nuages, des serveurs d'IA. , etc .
À l'heure actuelle, les fabricants nationaux ont publié des rapports commerciaux correspondants et ont obtenu des dizaines de millions de revenus grâce à la demande de déploiement de privatisation dans l'industrie.
Cependant, les activités ToB ne peuvent à elles seules soutenir un modèle économique à grande échelle.
Dans une révolution technologique, la technologie de base doit être diffusée et utilisée par des milliards d’utilisateurs ordinaires afin de créer de la valeur économique. Après que les ordinateurs personnels, Internet et les smartphones soient devenus populaires auprès du grand public, la valeur marchande de nombreuses entreprises technologiques a grimpé en flèche.
De nos jours, les géants ont investi beaucoup de ressources dans la formation de grands modèles, en particulier des modèles de base, qui ont souvent des échelles de paramètres de plusieurs centaines de milliards, voire de milliers de milliards, et doivent être utilisés par des utilisateurs de masse.
Alors, quelle est l’expérience réelle de l’application ?
Les scénarios tels que le chat, le dessin et la créativité ont un taux de tolérance d'erreur élevé. Même si l'IA répond mal à la question, l'utilisateur la trouvera toujours "mignonne". Cette partie de l'application est déjà très compliquée, comme " Photo d'identité IA". Dans la plupart des scénarios, l'IA est nécessaire pour vous aider automatiquement à gérer des tâches plus sérieuses, à coopérer avec d'autres conditions environnementales et à gérer des activités continues et à long terme. Ne faites pas trop d'erreurs, sinon les gens devront participer en grand nombre, et Je ne peux pas vraiment augmenter la productivité.
De toute évidence, ce type de scénario ne peut pas être résolu correctement par un modèle généraliste vaste et complexe à l’heure actuelle.
Prenons l'exemple d'un écrivain comme moi. Si je laisse un grand mannequin écrire mon manuscrit à ma place, il peut avoir des hallucinations. Je dois revérifier les événements/actualités/journaux mentionnés, ce qui est plus gênant que de chercher des informations moi-même et n'est pas assez précis. Quand j'ai une idée, je dois utiliser des mots rapides pour m'inspirer pendant longtemps, et il se peut qu'il n'y en ait aucun qui puisse être utilisé. C'est lent et fatigant, alors autant écrire moi-même.
L'incapacité d'accomplir automatiquement les tâches en une seule étape nécessite l'intervention d'un grand nombre de personnes dans l'examen. Il s'agit actuellement d'une difficulté majeure dans l'application de grands modèles dans des scénarios sérieux, et cela affecte également directement les progrès de la mise en œuvre et de la commercialisation des grands modèles. .
Comment faire? Si les grands modèles veulent être performants, ils ont besoin de toute urgence d’un groupe d’assistants, à savoir les agents IA.
Libère vraiment la productivité, pourquoi AI Agent est-il si incroyable ?
Imaginez, si un grand modèle peut fonctionner seul 24 heures sur 24, 7 jours sur 7, sans intervention humaine, il peut accomplir diverses tâches par lui-même. Il suffit aux gens de retourner occasionnellement à l'ordinateur ou au bureau pour voir comment il se comporte. C'est la manière correcte d'ouvrir un grand modèle.
Lors de la conférence GPT-4, OpenAI a démontré sa capacité à automatiser certaines tâches, comme permettre à GPT4 de reconnaître des croquis pour générer des pages Web et de corriger étape par étape les erreurs dans son propre code.
Mais comment cette capacité peut-elle être utilisée par les développeurs et les utilisateurs ordinaires ? De nombreux développeurs ont répondu que si vous écrivez du code directement à l'aide de GPT4, vous devez toujours le déboguer vous-même. Vous ne pouvez pas regarder des images pour générer du code pour une utilisation directe. Parfois, il est préférable de ne pas l'utiliser.
Les grands fabricants de modèles sont également confrontés à un dilemme. J'ai ouvert l'API. Pour obtenir des capacités plus professionnelles, précises et raffinées, quelqu'un doit la développer davantage, j'ai donc passé le relais à l'agent AI.
AI Agent est une entité automatisée de l'IA dans l'environnement. Il présente quatre caractéristiques principales :
Détectez l’environnement environnant grâce à des capteurs. Cet environnement peut être virtuel, comme des jeux sandbox, des systèmes de formation par simulation, des simulateurs de conduite autonome, etc., ou il peut être physique, comme des routes, des salles, des chaînes de montage, etc.
Capable de prendre des décisions de manière indépendante.
Les actionneurs/effecteurs travaillent ensemble pour agir.
Apprentissage et progrès basés sur la maximisation des performances et l’optimisation des résultats.
De ce point de vue, les humains eux-mêmes sont en fait une sorte d'agent IA « agent intelligent ». Nous pouvons détecter les changements dans l'environnement extérieur à travers nos yeux, nos oreilles, notre peau, etc., puis prendre des décisions à travers notre cerveau, parler avec notre bouche, et marcher avec nos jambes. Agir et s'adapter continuellement à l'environnement extérieur en fonction des commentaires de récompense.
En fait, Agents in AI a la même logique. Prenons l'exemple de l'agent IA dans le scénario de conduite autonome. Des capteurs sont nécessaires pour collecter des informations et détecter les facteurs environnementaux tels que les véhicules routiers et les piétons. Le système prendra alors automatiquement des décisions et pilotera les accélérateurs, les freins et autres équipements pour réagir en conséquence. .
Ceci est également connu sous le nom de modèle PEAS d’agent AI. Faisons un tableau simple pour que vous ayez une idée :
Alors, spécifiquement sur les grands modèles, quel impact l’AI Agent peut-il apporter ? Il a principalement les fonctions clés suivantes :
Tout d’abord, démontez la tâche.
Les grands modèles doivent être combinés avec un domaine spécifique, les besoins des utilisateurs auxquels ils sont confrontés sont relativement généraux et le processus implique souvent plusieurs étapes. Tout comme l'utilisateur dit "il faut de la lumière", un grand modèle isolé ne sait pas quelles lampes se trouvent dans l'environnement, ni comment les contrôler. Par conséquent, même avec un grand modèle, il ne peut pas gérer cette tâche apparemment simple. mais tâche en réalité complexe.
L'agent AI dispose de capacités de planification de tâches et peut automatiquement comprendre et décider comment planifier les étapes, allouer les ressources, optimiser les décisions, puis exécuter les instructions, améliorant ainsi l'efficacité et la précision des tâches de traitement de grands modèles.
Dans un article de l'équipe de recherche de Google Brain, il a été demandé au grand modèle de langage d'exprimer le processus de raisonnement de décomposition des étapes de la tâche, c'est-à-dire le « monologue intérieur », puis de prendre les actions correspondantes, ce qui a soudainement amélioré la précision du réponses des grands modèles. Il a obtenu des résultats SOTA sur plusieurs ensembles de données, améliorant ainsi le non-sens des grands modèles.
Deuxièmement, l'exécution automatique.
AI Agent est conçu pour penser et agir de manière indépendante. Il suffit aux utilisateurs de lui confier une tâche et de le laisser faire son travail. Un exemple typique d'AutoGPT est la commande de pizza. L'utilisateur n'a pas besoin de saisir l'adresse ni de choisir la saveur. L'agent AI s'occupe de toutes les étapes de commande et les exécute automatiquement. Les gens peuvent regarder de côté et les corriger dans temps si des erreurs sont commises.
AI Agent peut non seulement utiliser Internet, mais également travailler dans un environnement physique, en contrôlant des robots pour livrer des livraisons express, des voitures sans conducteur, une conduite autonome, etc.
Avec AI Agent, l'interaction entre les utilisateurs et les grands modèles sera plus naturelle, simple et rapide, réduisant ainsi la participation manuelle et améliorant véritablement la qualité et l'efficacité. Par exemple, dans le monde du jeu, AI Agent peut automatiquement démarrer un dialogue avec les joueurs, fournir une interaction ouverte et concevoir des scénarios infinis basés sur les commentaires des joueurs, rendant véritablement le jeu plus accessible à des milliers de personnes ; dans le monde physique, AI Agent peut générer automatiquement des instructions et fonctionner, piloter le corps mécanique, fournir des services d'entretien ménager aux humains et automatiser les opérations dans les usines sans compter sur les conseils humains.
Troisièmement, économisez les ressources.
Comme les humains, les agents IA peuvent utiliser des outils, c'est-à-dire appeler des API, pour gérer des tâches plus complexes, ce qui étend considérablement les capacités des grands modèles et réduit le gaspillage et la consommation excessive de ressources.
Par exemple, lors de l'écriture de code pour AutoGPT, vous devez accéder aux données de sources d'informations propriétaires, aux ressources informatiques, etc. Au cours de ce processus, l'agent AI peut trouver automatiquement l'API appropriée à appeler, évitant ainsi de gaspiller d'autres jetons API. Vous pouvez également apprendre de manière indépendante, optimiser les résultats et rappeler l'API si vous n'êtes pas satisfait.
D'une manière générale, pour réellement compléter une instruction utilisateur peu claire, telle que la planification d'un voyage, le modèle doit appeler plusieurs API pour résoudre le problème.Les agents IA dotés d'une forte automatisation peuvent sans aucun doute économiser des ressources, ce qui permet aux utilisateurs de réduire les coûts, ce qui permet aux applications IA d'être plus attrayantes. et compétitif.
Quatrièmement, attirez les développeurs.
Pour la commercialisation de grands modèles, le modèle API nécessite la participation du plus grand nombre possible de groupes de développeurs, et le modèle industriel nécessite également des intégrateurs ISV, des fournisseurs de services logiciels, etc. Tout le monde sait qu'il est difficile de gagner avec le modèle de base d'un grand constructeur, et nous espérons trouver des opportunités dans des applications subdivisées de niveau supérieur. AI Agent peut résoudre des problèmes spécifiques, améliorer les effets de modèle et piloter des systèmes numériques et des entités physiques, il est donc très approprié pour créer des super applications.
Si AI Agent est comme la plus petite unité de la vie de l'IA, alors les grands fabricants de modèles sont les usines qui engendrent la vie, et les développeurs, les éditeurs de logiciels, etc. sont comme des cours de formation, leur enseignant des compétences pratiques et différenciées pour l'industrie. avec les utilisateurs.
Par conséquent, quel que soit le grand modèle capable de mieux construire AI Agent, il attirera un écosystème de développement plus large et sera plus fidèle aux utilisateurs commerciaux B-end, formant une énorme opportunité au niveau de la plate-forme d'IA.
En résumé, AI Agent affecte directement l'effet du modèle, la qualité du service, le coût de mise en œuvre et les capacités écologiques des grands modèles, et sera la clé de la concurrence entre divers grands modèles à l'avenir.
Si l'AI Agent fonctionne bien, le modèle est indispensable.
Alors vous vous demandez peut-être comment pouvons-nous générer un bon agent IA ? Quels défis cela pose-t-il pour les grands modèles ?
Nous pensons que pour que AI Agent soit implémenté, les grands modèles doivent effectuer les tâches suivantes, qui feront également l'objet de la concurrence à l'avenir :
Modèle de base.
Les capacités et les effets de AI Agent sont déterminés par les capacités du modèle de base sous-jacent. L'agent AI peut ne pas être en mesure d'utiliser les capacités du modèle de base, mais l'agent AI peut ne pas avoir les capacités que le modèle de base n'a pas.
En prenant comme exemple les tâches linguistiques, GPT-4 offre de fortes capacités de compréhension du langage naturel, mais actuellement très peu d'entre elles sont réellement déployées dans les agents et les produits d'IA. Certains PNJ dans les jeux n'ont toujours pas la capacité de prendre des décisions autonomes.
Pour un autre exemple, bien que GPT-4 soit multimodal, il n'ouvre que l'API du langage. Par conséquent, les développeurs qui souhaitent utiliser les capacités multimodales de GPT4 pour créer des agents IA ne peuvent pas encore le faire, et d'autres modalités telles que les images et l'audio sont Sur la base de l’état des informations, la compréhension et l’effet de l’agent IA sur l’environnement doivent encore être améliorés.
Par conséquent, qu'il s'agisse d'un modèle open source ou d'un modèle fermé, si vous souhaitez le commercialiser via l'économie des API, les capacités du modèle de base seront directement liées à la qualité de l'agent IA, et il y a toujours marge d'amélioration.
2. Connaissance des données.
Pour être un bon agent IA, la collecte et l’utilisation de données sont la condition préalable de base. Pour les développeurs, la quantité de données nécessaire aux tâches numériques n’est plus un problème, mais lors du développement d’agents d’IA dans le monde physique, les coûts des données sont très élevés. Les données de contrôle des robots ne peuvent généralement être collectées que par vous-même, via un simulateur ou une collection de robots physiques sur site. Mais après tout, le simulateur n'est pas un environnement réel et l'effet de formation n'est peut-être pas bon.Cependant, l'achat de centaines de robots et de drones pour aller réellement sur la route et dans les usines pour collecter des données nécessite beaucoup d'investissements en termes d'approvisionnement. coûts, restrictions politiques, mise en œuvre effective, etc. Difficultés.
À ce stade, les grands fabricants de modèles bénéficiant d'avantages en matière de données, tels que les avantages de la conduite autonome de Google et de Baidu, ainsi que les avantages en matière de données de Microsoft, Google, Sogou, Baidu et d'autres entreprises de recherche, pourraient être en mesure de réduire certains obstacles qui empêchent les développeurs d'explorer les agents IA. , et créera également des barrières aux grands modèles de ces fournisseurs.
Assistance produit.
Il faut admettre que les opportunités d'application de grands modèles représentées par AI Agent en sont encore à leurs débuts, que la technologie n'est pas encore complètement mature et que l'exploration commerciale vient de faire un petit pas. Pour les développeurs, les fournisseurs de services logiciels, etc., ce qui est plus critique et plus précoce à considérer que la manière d'implémenter l'agent AI dans le code est d'imaginer où un agent AI devrait aller :
À quoi devrait-il ressembler ? Quel est ton nom? Y a-t-il un genre ? Quel type de personnalité utilisez-vous pour parler aux utilisateurs ? Quels sont les cas d’utilisation ? Quelles difficultés spécifiques allez-vous rencontrer ? Comment évaluer le succès d’un agent IA ?
Il s'agit davantage de « no man's lands » au niveau des produits et au niveau commercial. Pour permettre aux développeurs de laisser libre cours à leur imagination et d'essayer de créer des agents IA dans divers environnements et tâches, les grands fabricants de modèles doivent ouvrir leur propre écosystème commercial et fournir des services plus riches et plus riches. des solutions plus pratiques et des fonctions permettant de réduire le risque d'essais et d'erreurs pour les développeurs, d'augmenter l'intensité de l'amarrage avec les utilisateurs professionnels et de générer davantage d'options commerciales et de cas de mise en œuvre.
Dans l’ensemble, ce domaine est encore très nouveau et AI Agent n’a pas encore clairement impacté la grande industrie du modélisme, mais il est certain qu’AI Agent éliminera un grand nombre d’interactions fastidieuses entre les humains et les systèmes d’IA, et c’est en train de se produire. .
De plus en plus d'agents IA sont proposés aux communautés et aux utilisateurs. Ils apprennent, changent et évoluent. Peut-être que dans quelques mois, nous verrons la maturité et l’explosion des Agents IA, ce qui déclenchera inévitablement un nouveau remaniement dans le domaine des grands modèles.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Le grand modèle est arrogant et arrogant. Sans agents IA, la vie ou la mort est difficile à prédire.
Original : Renard tibétain
**Source : **Cerveau Corps Polaire
AI Agent reprend le grand modèle de langage LLM et est devenu le sujet le plus brûlant dans le cercle de l'IA.
À l'heure actuelle, la situation dans le cercle du capital-risque de l'IA est à peu près la suivante :
Big Factory Club : les employés internes d'OpenAI affirment que AI Agent est la nouvelle direction d'OpenAI ; Microsoft essaie de promouvoir le copilote et de laisser l'IA jouer le rôle d'assistant, ce qui est un scénario typique d'AI Agent ; NVIDIA a lancé Voyager, cet AI Agent peut être autonome Écrire du code pour dominer le jeu "Minecraft" ; SenseTime domestique a également lancé un agent d'IA généraliste ; Alibaba a lancé un employé numérique...
Cercle académique : en avril de cette année, Stanford a créé une ville Westworld, permettant à 25 agents IA de simuler des humains dans l'environnement sandbox de la ville virtuelle, et de tomber amoureux, de faire la fête, de collaborer, de sortir avec d'autres agents IA, etc. En outre, certains chercheurs ont commencé à utiliser des agents d'IA pour concevoir des expériences scientifiques complexes, notamment la lecture automatique d'articles en ligne et la recherche de médicaments anticancéreux... Ces explorations de pointe sont époustouflantes.
Entrepreneurship Circle : AI Agent n'est pas seulement un jeu destiné aux scientifiques de haut niveau. De nombreux projets tels que Camel, AutoGPT, BabyAGI et AgentGPT ont vu le jour. Il existe également un grand nombre de développeurs et d'entrepreneurs de la communauté open source qui utilisent ces projets open source pour créer quelques outils pratiques. . Par exemple, aomni est une application AI Agent qui aide les utilisateurs à capturer des informations sur le réseau et à les envoyer par e-mail.
A partir de ces jugements, il est encore trop tôt pour dire que « AI Agent a ouvert la seconde moitié des grands modèles », mais il doit être clair que « AI Agent est le standard commercial pour les grands modèles ».
Par conséquent, nous devrions ensuite voir davantage de grands fabricants et de startups prendre davantage de mesures sur AI Agent.
Alors, qu’est-ce que l’AI Agent exactement ? Pourquoi est-ce considéré comme une condition nécessaire à la commercialisation de grands modèles ?
Le grand modèle est arrogant et arrogant, mais les utilisateurs ne paient toujours pas.
Ici, nous mettons d'abord l'agent IA de côté et examinons à quoi ressemble le grand modèle.
Je crois que la plupart des lecteurs s'accordent sur le fait que les grands modèles sont quelque chose avec une vision élevée, un investissement élevé et un seuil élevé. D'un point de vue sentimental, il est possible de réaliser une intelligence artificielle générale et de changer complètement la société ; d'un point de vue laïque, elle peut reconstruire les affaires/ produits et permettre aux entreprises technologiques d'améliorer leurs performances.
Mais tout cela repose sur le fait que les grands modèles peuvent être véritablement commercialisés, récupérer les coûts de R&D et parvenir à un développement sain et durable.
Au cours des derniers mois, deux modèles commerciaux pour les grands modèles sont devenus plus efficaces : l'un est le déploiement local privatisé de grands modèles par les gouvernements et les entreprises de divers secteurs ; l'autre est la puissance de calcul requise pour vendre de grands modèles via des nuages, des serveurs d'IA. , etc .
À l'heure actuelle, les fabricants nationaux ont publié des rapports commerciaux correspondants et ont obtenu des dizaines de millions de revenus grâce à la demande de déploiement de privatisation dans l'industrie.
Cependant, les activités ToB ne peuvent à elles seules soutenir un modèle économique à grande échelle.
Dans une révolution technologique, la technologie de base doit être diffusée et utilisée par des milliards d’utilisateurs ordinaires afin de créer de la valeur économique. Après que les ordinateurs personnels, Internet et les smartphones soient devenus populaires auprès du grand public, la valeur marchande de nombreuses entreprises technologiques a grimpé en flèche.
Alors, quelle est l’expérience réelle de l’application ?
Les scénarios tels que le chat, le dessin et la créativité ont un taux de tolérance d'erreur élevé. Même si l'IA répond mal à la question, l'utilisateur la trouvera toujours "mignonne". Cette partie de l'application est déjà très compliquée, comme " Photo d'identité IA". Dans la plupart des scénarios, l'IA est nécessaire pour vous aider automatiquement à gérer des tâches plus sérieuses, à coopérer avec d'autres conditions environnementales et à gérer des activités continues et à long terme. Ne faites pas trop d'erreurs, sinon les gens devront participer en grand nombre, et Je ne peux pas vraiment augmenter la productivité.
De toute évidence, ce type de scénario ne peut pas être résolu correctement par un modèle généraliste vaste et complexe à l’heure actuelle.
Prenons l'exemple d'un écrivain comme moi. Si je laisse un grand mannequin écrire mon manuscrit à ma place, il peut avoir des hallucinations. Je dois revérifier les événements/actualités/journaux mentionnés, ce qui est plus gênant que de chercher des informations moi-même et n'est pas assez précis. Quand j'ai une idée, je dois utiliser des mots rapides pour m'inspirer pendant longtemps, et il se peut qu'il n'y en ait aucun qui puisse être utilisé. C'est lent et fatigant, alors autant écrire moi-même.
L'incapacité d'accomplir automatiquement les tâches en une seule étape nécessite l'intervention d'un grand nombre de personnes dans l'examen. Il s'agit actuellement d'une difficulté majeure dans l'application de grands modèles dans des scénarios sérieux, et cela affecte également directement les progrès de la mise en œuvre et de la commercialisation des grands modèles. .
Comment faire? Si les grands modèles veulent être performants, ils ont besoin de toute urgence d’un groupe d’assistants, à savoir les agents IA.
Libère vraiment la productivité, pourquoi AI Agent est-il si incroyable ?
Imaginez, si un grand modèle peut fonctionner seul 24 heures sur 24, 7 jours sur 7, sans intervention humaine, il peut accomplir diverses tâches par lui-même. Il suffit aux gens de retourner occasionnellement à l'ordinateur ou au bureau pour voir comment il se comporte. C'est la manière correcte d'ouvrir un grand modèle.
Lors de la conférence GPT-4, OpenAI a démontré sa capacité à automatiser certaines tâches, comme permettre à GPT4 de reconnaître des croquis pour générer des pages Web et de corriger étape par étape les erreurs dans son propre code.
Mais comment cette capacité peut-elle être utilisée par les développeurs et les utilisateurs ordinaires ? De nombreux développeurs ont répondu que si vous écrivez du code directement à l'aide de GPT4, vous devez toujours le déboguer vous-même. Vous ne pouvez pas regarder des images pour générer du code pour une utilisation directe. Parfois, il est préférable de ne pas l'utiliser.
Les grands fabricants de modèles sont également confrontés à un dilemme. J'ai ouvert l'API. Pour obtenir des capacités plus professionnelles, précises et raffinées, quelqu'un doit la développer davantage, j'ai donc passé le relais à l'agent AI.
AI Agent est une entité automatisée de l'IA dans l'environnement. Il présente quatre caractéristiques principales :
Détectez l’environnement environnant grâce à des capteurs. Cet environnement peut être virtuel, comme des jeux sandbox, des systèmes de formation par simulation, des simulateurs de conduite autonome, etc., ou il peut être physique, comme des routes, des salles, des chaînes de montage, etc.
Capable de prendre des décisions de manière indépendante.
Les actionneurs/effecteurs travaillent ensemble pour agir.
Apprentissage et progrès basés sur la maximisation des performances et l’optimisation des résultats.
En fait, Agents in AI a la même logique. Prenons l'exemple de l'agent IA dans le scénario de conduite autonome. Des capteurs sont nécessaires pour collecter des informations et détecter les facteurs environnementaux tels que les véhicules routiers et les piétons. Le système prendra alors automatiquement des décisions et pilotera les accélérateurs, les freins et autres équipements pour réagir en conséquence. .
Ceci est également connu sous le nom de modèle PEAS d’agent AI. Faisons un tableau simple pour que vous ayez une idée :
Tout d’abord, démontez la tâche.
Les grands modèles doivent être combinés avec un domaine spécifique, les besoins des utilisateurs auxquels ils sont confrontés sont relativement généraux et le processus implique souvent plusieurs étapes. Tout comme l'utilisateur dit "il faut de la lumière", un grand modèle isolé ne sait pas quelles lampes se trouvent dans l'environnement, ni comment les contrôler. Par conséquent, même avec un grand modèle, il ne peut pas gérer cette tâche apparemment simple. mais tâche en réalité complexe.
L'agent AI dispose de capacités de planification de tâches et peut automatiquement comprendre et décider comment planifier les étapes, allouer les ressources, optimiser les décisions, puis exécuter les instructions, améliorant ainsi l'efficacité et la précision des tâches de traitement de grands modèles.
Dans un article de l'équipe de recherche de Google Brain, il a été demandé au grand modèle de langage d'exprimer le processus de raisonnement de décomposition des étapes de la tâche, c'est-à-dire le « monologue intérieur », puis de prendre les actions correspondantes, ce qui a soudainement amélioré la précision du réponses des grands modèles. Il a obtenu des résultats SOTA sur plusieurs ensembles de données, améliorant ainsi le non-sens des grands modèles.
Deuxièmement, l'exécution automatique.
AI Agent est conçu pour penser et agir de manière indépendante. Il suffit aux utilisateurs de lui confier une tâche et de le laisser faire son travail. Un exemple typique d'AutoGPT est la commande de pizza. L'utilisateur n'a pas besoin de saisir l'adresse ni de choisir la saveur. L'agent AI s'occupe de toutes les étapes de commande et les exécute automatiquement. Les gens peuvent regarder de côté et les corriger dans temps si des erreurs sont commises.
AI Agent peut non seulement utiliser Internet, mais également travailler dans un environnement physique, en contrôlant des robots pour livrer des livraisons express, des voitures sans conducteur, une conduite autonome, etc.
Avec AI Agent, l'interaction entre les utilisateurs et les grands modèles sera plus naturelle, simple et rapide, réduisant ainsi la participation manuelle et améliorant véritablement la qualité et l'efficacité. Par exemple, dans le monde du jeu, AI Agent peut automatiquement démarrer un dialogue avec les joueurs, fournir une interaction ouverte et concevoir des scénarios infinis basés sur les commentaires des joueurs, rendant véritablement le jeu plus accessible à des milliers de personnes ; dans le monde physique, AI Agent peut générer automatiquement des instructions et fonctionner, piloter le corps mécanique, fournir des services d'entretien ménager aux humains et automatiser les opérations dans les usines sans compter sur les conseils humains.
Troisièmement, économisez les ressources.
Comme les humains, les agents IA peuvent utiliser des outils, c'est-à-dire appeler des API, pour gérer des tâches plus complexes, ce qui étend considérablement les capacités des grands modèles et réduit le gaspillage et la consommation excessive de ressources.
Par exemple, lors de l'écriture de code pour AutoGPT, vous devez accéder aux données de sources d'informations propriétaires, aux ressources informatiques, etc. Au cours de ce processus, l'agent AI peut trouver automatiquement l'API appropriée à appeler, évitant ainsi de gaspiller d'autres jetons API. Vous pouvez également apprendre de manière indépendante, optimiser les résultats et rappeler l'API si vous n'êtes pas satisfait.
D'une manière générale, pour réellement compléter une instruction utilisateur peu claire, telle que la planification d'un voyage, le modèle doit appeler plusieurs API pour résoudre le problème.Les agents IA dotés d'une forte automatisation peuvent sans aucun doute économiser des ressources, ce qui permet aux utilisateurs de réduire les coûts, ce qui permet aux applications IA d'être plus attrayantes. et compétitif.
Pour la commercialisation de grands modèles, le modèle API nécessite la participation du plus grand nombre possible de groupes de développeurs, et le modèle industriel nécessite également des intégrateurs ISV, des fournisseurs de services logiciels, etc. Tout le monde sait qu'il est difficile de gagner avec le modèle de base d'un grand constructeur, et nous espérons trouver des opportunités dans des applications subdivisées de niveau supérieur. AI Agent peut résoudre des problèmes spécifiques, améliorer les effets de modèle et piloter des systèmes numériques et des entités physiques, il est donc très approprié pour créer des super applications.
Si AI Agent est comme la plus petite unité de la vie de l'IA, alors les grands fabricants de modèles sont les usines qui engendrent la vie, et les développeurs, les éditeurs de logiciels, etc. sont comme des cours de formation, leur enseignant des compétences pratiques et différenciées pour l'industrie. avec les utilisateurs.
Par conséquent, quel que soit le grand modèle capable de mieux construire AI Agent, il attirera un écosystème de développement plus large et sera plus fidèle aux utilisateurs commerciaux B-end, formant une énorme opportunité au niveau de la plate-forme d'IA.
En résumé, AI Agent affecte directement l'effet du modèle, la qualité du service, le coût de mise en œuvre et les capacités écologiques des grands modèles, et sera la clé de la concurrence entre divers grands modèles à l'avenir.
Si l'AI Agent fonctionne bien, le modèle est indispensable.
Alors vous vous demandez peut-être comment pouvons-nous générer un bon agent IA ? Quels défis cela pose-t-il pour les grands modèles ?
Nous pensons que pour que AI Agent soit implémenté, les grands modèles doivent effectuer les tâches suivantes, qui feront également l'objet de la concurrence à l'avenir :
Les capacités et les effets de AI Agent sont déterminés par les capacités du modèle de base sous-jacent. L'agent AI peut ne pas être en mesure d'utiliser les capacités du modèle de base, mais l'agent AI peut ne pas avoir les capacités que le modèle de base n'a pas.
En prenant comme exemple les tâches linguistiques, GPT-4 offre de fortes capacités de compréhension du langage naturel, mais actuellement très peu d'entre elles sont réellement déployées dans les agents et les produits d'IA. Certains PNJ dans les jeux n'ont toujours pas la capacité de prendre des décisions autonomes.
Pour un autre exemple, bien que GPT-4 soit multimodal, il n'ouvre que l'API du langage. Par conséquent, les développeurs qui souhaitent utiliser les capacités multimodales de GPT4 pour créer des agents IA ne peuvent pas encore le faire, et d'autres modalités telles que les images et l'audio sont Sur la base de l’état des informations, la compréhension et l’effet de l’agent IA sur l’environnement doivent encore être améliorés.
Par conséquent, qu'il s'agisse d'un modèle open source ou d'un modèle fermé, si vous souhaitez le commercialiser via l'économie des API, les capacités du modèle de base seront directement liées à la qualité de l'agent IA, et il y a toujours marge d'amélioration.
Pour être un bon agent IA, la collecte et l’utilisation de données sont la condition préalable de base. Pour les développeurs, la quantité de données nécessaire aux tâches numériques n’est plus un problème, mais lors du développement d’agents d’IA dans le monde physique, les coûts des données sont très élevés. Les données de contrôle des robots ne peuvent généralement être collectées que par vous-même, via un simulateur ou une collection de robots physiques sur site. Mais après tout, le simulateur n'est pas un environnement réel et l'effet de formation n'est peut-être pas bon.Cependant, l'achat de centaines de robots et de drones pour aller réellement sur la route et dans les usines pour collecter des données nécessite beaucoup d'investissements en termes d'approvisionnement. coûts, restrictions politiques, mise en œuvre effective, etc. Difficultés.
À ce stade, les grands fabricants de modèles bénéficiant d'avantages en matière de données, tels que les avantages de la conduite autonome de Google et de Baidu, ainsi que les avantages en matière de données de Microsoft, Google, Sogou, Baidu et d'autres entreprises de recherche, pourraient être en mesure de réduire certains obstacles qui empêchent les développeurs d'explorer les agents IA. , et créera également des barrières aux grands modèles de ces fournisseurs.
Il faut admettre que les opportunités d'application de grands modèles représentées par AI Agent en sont encore à leurs débuts, que la technologie n'est pas encore complètement mature et que l'exploration commerciale vient de faire un petit pas. Pour les développeurs, les fournisseurs de services logiciels, etc., ce qui est plus critique et plus précoce à considérer que la manière d'implémenter l'agent AI dans le code est d'imaginer où un agent AI devrait aller :
À quoi devrait-il ressembler ? Quel est ton nom? Y a-t-il un genre ? Quel type de personnalité utilisez-vous pour parler aux utilisateurs ? Quels sont les cas d’utilisation ? Quelles difficultés spécifiques allez-vous rencontrer ? Comment évaluer le succès d’un agent IA ?
Il s'agit davantage de « no man's lands » au niveau des produits et au niveau commercial. Pour permettre aux développeurs de laisser libre cours à leur imagination et d'essayer de créer des agents IA dans divers environnements et tâches, les grands fabricants de modèles doivent ouvrir leur propre écosystème commercial et fournir des services plus riches et plus riches. des solutions plus pratiques et des fonctions permettant de réduire le risque d'essais et d'erreurs pour les développeurs, d'augmenter l'intensité de l'amarrage avec les utilisateurs professionnels et de générer davantage d'options commerciales et de cas de mise en œuvre.
Dans l’ensemble, ce domaine est encore très nouveau et AI Agent n’a pas encore clairement impacté la grande industrie du modélisme, mais il est certain qu’AI Agent éliminera un grand nombre d’interactions fastidieuses entre les humains et les systèmes d’IA, et c’est en train de se produire. .
De plus en plus d'agents IA sont proposés aux communautés et aux utilisateurs. Ils apprennent, changent et évoluent. Peut-être que dans quelques mois, nous verrons la maturité et l’explosion des Agents IA, ce qui déclenchera inévitablement un nouveau remaniement dans le domaine des grands modèles.