AI Agent бере на себе велику мовну модель LLM і став найгарячішою темою в колі AI.
На даний момент ситуація в венчурному колі ШІ виглядає приблизно так:
Big Factory Club: внутрішні співробітники OpenAI стверджують, що AI Agent є новим напрямком OpenAI; Microsoft намагається просувати другого пілота та дозволити AI виконувати роль помічника, що є типовим сценарієм AI Agent; NVIDIA запустила Voyager, цей AI Agent може бути автономним. Пишіть код, щоб домінувати в грі "Minecraft"; вітчизняний SenseTime також запустив універсального агента штучного інтелекту; Alibaba запустила цифрового співробітника...
Академічне коло: у квітні цього року Стенфорд створив місто Westworld, дозволяючи 25 агентам штучного інтелекту симулювати людей у середовищі пісочниці віртуального міста та закохуватися, проводити вечірки, співпрацювати, зустрічатися тощо з іншими агентами штучного інтелекту. Крім того, деякі вчені почали використовувати агенти штучного інтелекту для розробки складних наукових експериментів, включаючи автоматичне читання статей в Інтернеті та дослідження ліків проти раку... Ці передові дослідження вражають.
Entrepreneurship Circle: AI Agent — це не лише гра для провідних науковців. З’явилося багато проектів, як-от Camel, AutoGPT, BabyAGI та AgentGPT. Існує також велика кількість спільнот розробників із відкритим кодом і підприємців, які використовують ці проекти з відкритим кодом для створення деякі практичні інструменти.. Наприклад, aomni — програма агента штучного інтелекту, яка допомагає користувачам отримувати мережеву інформацію та надсилати її електронною поштою.
Інвестиційне коло: AI Agent вважається «початком ери загального штучного інтелекту (AGI)», і її спалах є «залізним». Деякі підприємці з Кремнієвої долини сказали, що, розмовляючи з інвесторами про Generative Agents, усі з нетерпінням чекають до цього та сподіваючись, що Зрозумійте більше, наблизитесь і швидше реагуйте на наступні спалахи.
З цих суджень ще занадто рано говорити, що «AI Agent відкрив другу половину великих моделей», але «AI Agent є комерційним стандартом для великих моделей» має бути зрозумілим.
Отже, далі ми повинні побачити більше великих виробників і стартапів, які вживатимуть більше заходів щодо AI Agent.
Отже, що ж таке AI Agent? Чому це вважається необхідною умовою для комерціалізації великих моделей?
Велика модель нахабна і зарозуміла, але користувачі все одно не платять.
Тут ми спочатку відкладаємо агента штучного інтелекту та дивимося, як виглядає велика модель.
Я вважаю, що більшість читачів погоджуються з тим, що великі моделі — це щось із високим баченням, великими інвестиціями та високим порогом.З сентиментальної точки зору можна реалізувати загальний штучний інтелект і повністю змінити суспільство; зі світської точки зору, це може реконструювати бізнес/ продуктів і дозволяють технологічним компаніям підвищити продуктивність.
Але все це базується на тому факті, що великі моделі можна справді комерціалізувати, відшкодувати витрати на дослідження та розробки та досягти здорового та сталого розвитку.
Через кілька місяців дві бізнес-моделі для великих моделей стали більш ефективними: одна – це приватизоване локальне розгортання великих моделей урядами та підприємствами в різних галузях; інша – обчислювальна потужність, необхідна для продажу великих моделей через хмару, сервери ШІ. і т.д.
Наразі вітчизняні виробники опублікували відповідні бізнес-звіти та отримали десятки мільйонів доходів від попиту на розгортання приватизації в галузі.
Однак сам по собі бізнес ToB не може підтримувати широкомасштабну бізнес-модель.
Під час технологічної революції основна технологія має витікати та використовуватися мільярдами звичайних користувачів, щоб створити економічну цінність. Після того як домашні ПК, Інтернет і смартфони стали популярними серед мас, ринкова вартість багатьох технологічних компаній різко зросла.
Сьогодні гіганти вклали багато ресурсів у навчання великих моделей, особливо базових моделей, які часто мають масштаби параметрів у сотні мільярдів або трильйонів і повинні використовуватися масовими користувачами.
Отже, який фактичний досвід застосування?
Такі сценарії, як спілкування, малювання та творчість, мають високий рівень терпимості до помилок. Навіть якщо штучний інтелект відповість на запитання неправильно, користувач все одно вважатиме це «милим». Ця частина програми вже дуже складна, наприклад « AI ID фото». У більшості випадків штучний інтелект потрібен, щоб автоматично допомагати вам вирішувати серйозніші завдання, співпрацювати з іншими умовами навколишнього середовища та мати справу з довгостроковим і безперервним бізнесом. Не робіть занадто багато помилок, інакше людям доведеться брати участь у великій кількості, і не може реально підвищити продуктивність.
Очевидно, що такий сценарій не може бути добре вирішений за допомогою великої та складної моделі загального призначення на даний момент.
Візьмемо як приклад такого письменника, як я. Якщо я дозволю великій моделі написати для мене мій рукопис, у нього можуть виникнути галюцинації. Мені доведеться двічі перевіряти згадані події/новини/газети, що складніше, ніж шукати інформацію самостійно та недостатньо точний. Коли я придумую ідею, мені доводиться використовувати підказкові слова, щоб надихати мене протягом тривалого часу, і їх може не бути, що можна використати. Це повільно та виснажливо, тому я міг би також написати це сам.
Неможливість виконувати завдання автоматично за один крок вимагає втручання великої кількості людей у перевірку. Наразі це є основною проблемою при застосуванні великих моделей у серйозних сценаріях, а також безпосередньо впливає на прогрес впровадження та комерціалізації великих моделей .
Як це зробити? Якщо великі моделі хочуть працювати добре, їм терміново потрібна група помічників, а це агенти ШІ.
Справді вільна продуктивність, чому AI Agent такий чудовий?
Уявіть собі, якщо велика модель може працювати сама 24 години на добу, 7 днів на добу, без втручання людини, вона може сама виконувати різноманітні завдання.Людям достатньо лише час від часу повертатися до комп’ютера чи офісу, щоб побачити, як у неї справи Це правильний спосіб відкрити велику модель.
На конференції GPT-4 OpenAI продемонстрував свою здатність автоматизувати деякі завдання, наприклад дозволити GPT4 розпізнавати ескізи для створення веб-сторінок і крок за кроком виправляти помилки у власному коді.
Але як цю можливість використовувати розробники і звичайні користувачі? Багато розробників відповіли, що якщо ви пишете код безпосередньо за допомогою GPT4, ви все одно повинні налагоджувати його самостійно. Ви не можете дивитися на зображення, щоб створити код для прямого використання. Іноді краще його не використовувати.
Великі виробники моделей також опинилися в дилемі. Я відкрив API. Щоб досягти більш професійних, точних і витончених можливостей, хтось повинен його розвивати далі, тому я передав естафету агенту AI.
AI Agent – це автоматизований об’єкт ШІ в середовищі, який має чотири основні характеристики:
Відчуйте навколишнє середовище за допомогою датчиків. Це середовище може бути віртуальним, як-от ігри-пісочниці, системи симуляційного навчання, симулятори автономного водіння тощо, або воно може бути фізичним, як-от дороги, кімнати, конвеєри тощо.
Здатний самостійно приймати рішення.
Актуатори/ефектори працюють разом, щоб вжити заходів.
Навчання та прогрес на основі максимізації продуктивності та оптимізації результатів.
З цієї точки зору, самі люди насправді є свого роду «розумними агентами» AI Agent. Ми можемо відчувати зміни у зовнішньому середовищі очима, вухами, шкірою тощо, а потім приймати рішення через наш мозок, говорити устами, і ходити нашими ногами. Вживати заходів і постійно адаптуватися до зовнішнього середовища на основі відгуків про винагороду.
Фактично агенти в ШІ мають таку саму логіку. Візьмемо як приклад агент ШІ у сценарії автономного водіння. Датчики потрібні для збору інформації та визначення факторів навколишнього середовища, таких як дорожні транспортні засоби та пішоходи. Потім система автоматично прийматиме рішення та керуватиме акселераторами, гальмами та іншим обладнанням, щоб відповідним чином реагувати .
Це також відоме як модель PEAS агента AI. Давайте зробимо просту таблицю, щоб ви її відчули:
Отже, який вплив може мати AI Agent, особливо на великих моделях? В основному він виконує такі ключові функції:
Спочатку розберіть завдання.
Великі моделі потрібно поєднувати з певним полем, а потреби користувачів, з якими вони стикаються, відносно загальні, і процес часто включає кілька етапів. Так само, як користувач каже "потрібно світло", ізольована велика модель не знає, які лампи є в навколишньому середовищі, і не знає, як ними керувати. Тому навіть з великою моделлю вона не може впоратися з цією, здавалося б, простою задачею. але насправді складне завдання.
Агент штучного інтелекту має можливості планування завдань і може автоматично розуміти та вирішувати, як планувати кроки, розподіляти ресурси, оптимізувати рішення, а потім виконувати інструкції, підвищуючи ефективність і точність завдань обробки великих моделей.
У статті дослідницької групи Google Brain велику мовну модель попросили висловити процес міркування декомпозиції кроків завдання, тобто «внутрішній монолог», а потім виконати відповідні дії, що раптово підвищило точність відповіді великої моделі Він досяг результатів SOTA на кількох наборах даних, покращуючи безглуздість великих моделей.
По-друге, автоматичне виконання.
AI Agent створений для того, щоб думати та діяти незалежно. Користувачам потрібно лише дати йому завдання та дозволити йому виконувати свою роботу. Типовим прикладом AutoGPT є замовлення піци. Користувачеві не потрібно вводити адресу або вибирати смак. Агент AI піклується про всі етапи замовлення та виконує їх автоматично. Люди можуть спостерігати збоку та виправляти їх у час, якщо допущено будь-які помилки.
AI Agent може не тільки використовувати Інтернет, але й працювати у фізичному середовищі, керуючи роботами для доставки експрес-доставки, безпілотними автомобілями, автономним водінням тощо.
Завдяки AI Agent взаємодія між користувачами та великими моделями буде більш природною, простою та швидкою, зменшуючи ручну участь і справді покращуючи якість та ефективність. Наприклад, в ігровому світі AI Agent може автоматично починати діалог з гравцями, забезпечувати відкриту взаємодію та створювати нескінченні сюжетні лінії на основі відгуків гравців, справді роблячи гру доступнішою для тисяч людей; у фізичному світі AI Agent може автоматично генерувати інструкції та керувати, керувати механічним тілом, надавати послуги домашнього господарства людям і автоматизувати операції на заводах, не покладаючись на керівництво людини.
По-третє, економте ресурси.
Як і люди, агенти штучного інтелекту можуть використовувати інструменти, тобто викликати API, для вирішення складніших завдань, що значно розширює можливості великих моделей і зменшує марнотратство та надмірне споживання ресурсів.
Наприклад, під час написання коду для AutoGPT вам потрібно отримати доступ до власних даних джерела інформації, обчислювальних ресурсів тощо. Під час цього процесу агент ШІ може автоматично знайти відповідний API для виклику, таким чином уникаючи марнування інших маркерів API. Ви також можете навчатися самостійно, оптимізувати результати та повторно викликати API, якщо вас не влаштовує.
Загалом кажучи, щоб справді виконати незрозумілу інструкцію користувача, наприклад планування подорожі, моделі потрібно викликати кілька API, щоб вирішити проблему. Агент штучного інтелекту з сильною автоматизацією, безсумнівно, може заощадити ресурси, тим самим заощаджуючи витрати для користувачів, дозволяючи штучному інтелекту до програм більш привабливим і конкурентним.
По-четверте, залучення забудовників.
Для комерціалізації великих моделей модель API вимагає участі якомога більшої кількості груп розробників, а галузева модель також вимагає інтеграторів ISV, постачальників програмних послуг тощо. Всім відомо, що з базовою моделлю великого виробника важко перемогти, і ми сподіваємося знайти можливості в розділених додатках верхнього рівня. AI Agent може вирішувати конкретні проблеми, покращувати ефекти моделі та керувати цифровими системами та фізичними об’єктами, тому він дуже підходить для створення супердодатків.
Якщо AI Agent схожий на найменшу одиницю життя штучного інтелекту, то великі виробники моделей є фабриками, які породжують життя, а розробники, постачальники програмного забезпечення тощо схожі на курси навчання навичкам, які навчають їх практичним і диференційованим навичкам для галузі. з користувачами.
Таким чином, будь-яка велика модель може краще побудувати AI Agent, залучить більшу екосистему розробки та буде більш прив’язаною до комерційних кінцевих користувачів, створюючи величезні можливості на рівні платформи AI.
Підводячи підсумок, AI Agent безпосередньо впливає на ефект моделі, якість обслуговування, вартість впровадження та екологічні можливості великих моделей і стане ключем до конкуренції різних великих моделей у майбутньому.
Якщо AI Agent справляється добре, модель незамінна.
Тоді ви можете запитати, як ми можемо створити хорошого AI Agent? Які проблеми це створює для великих моделей?
Ми вважаємо, що для впровадження AI Agent великі моделі повинні виконувати наступні завдання, які також стануть центром конкуренції в майбутньому:
Базова модель.
Можливості та ефекти AI Agent визначаються можливостями базової моделі. AI Agent може не мати можливості використовувати можливості базової моделі, але AI Agent може не мати можливостей, яких немає в базовій моделі.
Взявши як приклад мовні завдання, GPT-4 забезпечує потужні можливості розуміння природної мови, але наразі дуже мало з них фактично розгорнуто в агентах і продуктах штучного інтелекту. Деякі NPC в іграх досі не мають здатності приймати автономні рішення.
Для іншого прикладу, хоча GPT-4 є мультимодальним, він відкриває лише мовний API. Тому розробники, які хочуть використовувати мультимодальні можливості GPT4 для створення агентів штучного інтелекту, ще не можуть цього зробити, а інші модальності, такі як зображення та аудіо Виходячи зі стану інформації, розуміння агентом штучного інтелекту та його вплив на навколишнє середовище все ще потребує вдосконалення.
Таким чином, незалежно від того, чи це модель з відкритим або закритим кодом, якщо ви хочете комерціалізувати її через економіку API, можливості базової моделі будуть безпосередньо пов’язані з якістю агента штучного інтелекту, і ще є простір для вдосконалення.
2. Знання даних.
Щоб бути хорошим агентом зі штучним інтелектом, збір і використання даних є основною передумовою. Для розробників кількість даних, необхідних для цифрових завдань, більше не є проблемою, але при розробці агентів штучного інтелекту у фізичному світі вартість даних дуже висока. Дані про керування роботами, як правило, можна збирати лише самостійно, за допомогою симулятора або колекції фізичних роботів на місці. Але врешті-решт симулятор не є реальним середовищем, і тренувальний ефект може бути поганим.Однак придбання сотень роботів і безпілотників, щоб фактично відправлятися в дорогу та заводи для збору даних, потребує великих інвестицій з точки зору закупівель витрати, політичні обмеження, фактичне впровадження тощо. Труднощі.
На даний момент великі виробники моделей з перевагами даних, як-от переваги автономного водіння Google і Baidu, а також переваги даних Microsoft, Google, Sogou, Baidu та інших пошукових компаній, можуть зменшити деякі бар’єри для розробників у дослідженні агентів AI. , а також створить бар’єри для великих моделей від цих постачальників.
Підтримка продукту.
Треба визнати, що можливості застосування великої моделі, які представляє AI Agent, все ще знаходяться на дуже ранній стадії, технологія ще не повністю зріла, а комерційне дослідження лише зробило невеликий крок. Для розробників, постачальників послуг програмного забезпечення тощо важливішим і більш раннім для розгляду, ніж те, як реалізувати AI Agent у коді, є уявлення про те, куди має рухатися AI Agent:
Як це має виглядати? Як вас звати? Чи є стать? Яку особистість ви використовуєте, щоб спілкуватися з користувачами? Які варіанти використання? З якими конкретними труднощами ви зіткнетеся? Як оцінити успішність AI Agent?
Це більше «нічиї землі» на рівні продукту та комерційному рівні. Щоб дозволити розробникам дати волю своїй уяві та спробувати створити агентів штучного інтелекту в різних середовищах і завданнях, великим виробникам моделей потрібно відкрити власну бізнес-екосистему та надати більш багаті та більш зручні рішення.функції для зменшення ризику проб і помилок для розробників, збільшення інтенсивності зв’язку з бізнес-користувачами та створення більшої кількості варіантів для бізнесу та прикладів реалізації.
Загалом, ця сфера все ще дуже нова, і AI Agent ще не вплинув на велику модельну індустрію.Однак безперечно, що AI Agent усуне велику кількість громіздких взаємодій між людьми та системами AI, і це відбувається .
Більше агентів ШІ просувається до спільнот і користувачів. Вони навчаються, змінюються та розвиваються. Можливо, через кілька місяців ми побачимо зрілість і вибух агентів штучного інтелекту, що неминуче призведе до чергових перестановок у сфері великих моделей.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Велика модель зарозуміла та зарозуміла. Без агентів ШІ важко передбачити життя чи смерть.
Оригінал: тибетська лисиця
**Джерело: **Brain Polar Body
AI Agent бере на себе велику мовну модель LLM і став найгарячішою темою в колі AI.
На даний момент ситуація в венчурному колі ШІ виглядає приблизно так:
Big Factory Club: внутрішні співробітники OpenAI стверджують, що AI Agent є новим напрямком OpenAI; Microsoft намагається просувати другого пілота та дозволити AI виконувати роль помічника, що є типовим сценарієм AI Agent; NVIDIA запустила Voyager, цей AI Agent може бути автономним. Пишіть код, щоб домінувати в грі "Minecraft"; вітчизняний SenseTime також запустив універсального агента штучного інтелекту; Alibaba запустила цифрового співробітника...
Академічне коло: у квітні цього року Стенфорд створив місто Westworld, дозволяючи 25 агентам штучного інтелекту симулювати людей у середовищі пісочниці віртуального міста та закохуватися, проводити вечірки, співпрацювати, зустрічатися тощо з іншими агентами штучного інтелекту. Крім того, деякі вчені почали використовувати агенти штучного інтелекту для розробки складних наукових експериментів, включаючи автоматичне читання статей в Інтернеті та дослідження ліків проти раку... Ці передові дослідження вражають.
Entrepreneurship Circle: AI Agent — це не лише гра для провідних науковців. З’явилося багато проектів, як-от Camel, AutoGPT, BabyAGI та AgentGPT. Існує також велика кількість спільнот розробників із відкритим кодом і підприємців, які використовують ці проекти з відкритим кодом для створення деякі практичні інструменти.. Наприклад, aomni — програма агента штучного інтелекту, яка допомагає користувачам отримувати мережеву інформацію та надсилати її електронною поштою.
З цих суджень ще занадто рано говорити, що «AI Agent відкрив другу половину великих моделей», але «AI Agent є комерційним стандартом для великих моделей» має бути зрозумілим.
Отже, далі ми повинні побачити більше великих виробників і стартапів, які вживатимуть більше заходів щодо AI Agent.
Отже, що ж таке AI Agent? Чому це вважається необхідною умовою для комерціалізації великих моделей?
Велика модель нахабна і зарозуміла, але користувачі все одно не платять.
Тут ми спочатку відкладаємо агента штучного інтелекту та дивимося, як виглядає велика модель.
Я вважаю, що більшість читачів погоджуються з тим, що великі моделі — це щось із високим баченням, великими інвестиціями та високим порогом.З сентиментальної точки зору можна реалізувати загальний штучний інтелект і повністю змінити суспільство; зі світської точки зору, це може реконструювати бізнес/ продуктів і дозволяють технологічним компаніям підвищити продуктивність.
Але все це базується на тому факті, що великі моделі можна справді комерціалізувати, відшкодувати витрати на дослідження та розробки та досягти здорового та сталого розвитку.
Через кілька місяців дві бізнес-моделі для великих моделей стали більш ефективними: одна – це приватизоване локальне розгортання великих моделей урядами та підприємствами в різних галузях; інша – обчислювальна потужність, необхідна для продажу великих моделей через хмару, сервери ШІ. і т.д.
Наразі вітчизняні виробники опублікували відповідні бізнес-звіти та отримали десятки мільйонів доходів від попиту на розгортання приватизації в галузі.
Однак сам по собі бізнес ToB не може підтримувати широкомасштабну бізнес-модель.
Під час технологічної революції основна технологія має витікати та використовуватися мільярдами звичайних користувачів, щоб створити економічну цінність. Після того як домашні ПК, Інтернет і смартфони стали популярними серед мас, ринкова вартість багатьох технологічних компаній різко зросла.
Отже, який фактичний досвід застосування?
Такі сценарії, як спілкування, малювання та творчість, мають високий рівень терпимості до помилок. Навіть якщо штучний інтелект відповість на запитання неправильно, користувач все одно вважатиме це «милим». Ця частина програми вже дуже складна, наприклад « AI ID фото». У більшості випадків штучний інтелект потрібен, щоб автоматично допомагати вам вирішувати серйозніші завдання, співпрацювати з іншими умовами навколишнього середовища та мати справу з довгостроковим і безперервним бізнесом. Не робіть занадто багато помилок, інакше людям доведеться брати участь у великій кількості, і не може реально підвищити продуктивність.
Очевидно, що такий сценарій не може бути добре вирішений за допомогою великої та складної моделі загального призначення на даний момент.
Візьмемо як приклад такого письменника, як я. Якщо я дозволю великій моделі написати для мене мій рукопис, у нього можуть виникнути галюцинації. Мені доведеться двічі перевіряти згадані події/новини/газети, що складніше, ніж шукати інформацію самостійно та недостатньо точний. Коли я придумую ідею, мені доводиться використовувати підказкові слова, щоб надихати мене протягом тривалого часу, і їх може не бути, що можна використати. Це повільно та виснажливо, тому я міг би також написати це сам.
Неможливість виконувати завдання автоматично за один крок вимагає втручання великої кількості людей у перевірку. Наразі це є основною проблемою при застосуванні великих моделей у серйозних сценаріях, а також безпосередньо впливає на прогрес впровадження та комерціалізації великих моделей .
Як це зробити? Якщо великі моделі хочуть працювати добре, їм терміново потрібна група помічників, а це агенти ШІ.
Справді вільна продуктивність, чому AI Agent такий чудовий?
Уявіть собі, якщо велика модель може працювати сама 24 години на добу, 7 днів на добу, без втручання людини, вона може сама виконувати різноманітні завдання.Людям достатньо лише час від часу повертатися до комп’ютера чи офісу, щоб побачити, як у неї справи Це правильний спосіб відкрити велику модель.
На конференції GPT-4 OpenAI продемонстрував свою здатність автоматизувати деякі завдання, наприклад дозволити GPT4 розпізнавати ескізи для створення веб-сторінок і крок за кроком виправляти помилки у власному коді.
Але як цю можливість використовувати розробники і звичайні користувачі? Багато розробників відповіли, що якщо ви пишете код безпосередньо за допомогою GPT4, ви все одно повинні налагоджувати його самостійно. Ви не можете дивитися на зображення, щоб створити код для прямого використання. Іноді краще його не використовувати.
Великі виробники моделей також опинилися в дилемі. Я відкрив API. Щоб досягти більш професійних, точних і витончених можливостей, хтось повинен його розвивати далі, тому я передав естафету агенту AI.
AI Agent – це автоматизований об’єкт ШІ в середовищі, який має чотири основні характеристики:
Відчуйте навколишнє середовище за допомогою датчиків. Це середовище може бути віртуальним, як-от ігри-пісочниці, системи симуляційного навчання, симулятори автономного водіння тощо, або воно може бути фізичним, як-от дороги, кімнати, конвеєри тощо.
Здатний самостійно приймати рішення.
Актуатори/ефектори працюють разом, щоб вжити заходів.
Навчання та прогрес на основі максимізації продуктивності та оптимізації результатів.
Фактично агенти в ШІ мають таку саму логіку. Візьмемо як приклад агент ШІ у сценарії автономного водіння. Датчики потрібні для збору інформації та визначення факторів навколишнього середовища, таких як дорожні транспортні засоби та пішоходи. Потім система автоматично прийматиме рішення та керуватиме акселераторами, гальмами та іншим обладнанням, щоб відповідним чином реагувати .
Це також відоме як модель PEAS агента AI. Давайте зробимо просту таблицю, щоб ви її відчули:
Спочатку розберіть завдання.
Великі моделі потрібно поєднувати з певним полем, а потреби користувачів, з якими вони стикаються, відносно загальні, і процес часто включає кілька етапів. Так само, як користувач каже "потрібно світло", ізольована велика модель не знає, які лампи є в навколишньому середовищі, і не знає, як ними керувати. Тому навіть з великою моделлю вона не може впоратися з цією, здавалося б, простою задачею. але насправді складне завдання.
Агент штучного інтелекту має можливості планування завдань і може автоматично розуміти та вирішувати, як планувати кроки, розподіляти ресурси, оптимізувати рішення, а потім виконувати інструкції, підвищуючи ефективність і точність завдань обробки великих моделей.
У статті дослідницької групи Google Brain велику мовну модель попросили висловити процес міркування декомпозиції кроків завдання, тобто «внутрішній монолог», а потім виконати відповідні дії, що раптово підвищило точність відповіді великої моделі Він досяг результатів SOTA на кількох наборах даних, покращуючи безглуздість великих моделей.
По-друге, автоматичне виконання.
AI Agent створений для того, щоб думати та діяти незалежно. Користувачам потрібно лише дати йому завдання та дозволити йому виконувати свою роботу. Типовим прикладом AutoGPT є замовлення піци. Користувачеві не потрібно вводити адресу або вибирати смак. Агент AI піклується про всі етапи замовлення та виконує їх автоматично. Люди можуть спостерігати збоку та виправляти їх у час, якщо допущено будь-які помилки.
AI Agent може не тільки використовувати Інтернет, але й працювати у фізичному середовищі, керуючи роботами для доставки експрес-доставки, безпілотними автомобілями, автономним водінням тощо.
Завдяки AI Agent взаємодія між користувачами та великими моделями буде більш природною, простою та швидкою, зменшуючи ручну участь і справді покращуючи якість та ефективність. Наприклад, в ігровому світі AI Agent може автоматично починати діалог з гравцями, забезпечувати відкриту взаємодію та створювати нескінченні сюжетні лінії на основі відгуків гравців, справді роблячи гру доступнішою для тисяч людей; у фізичному світі AI Agent може автоматично генерувати інструкції та керувати, керувати механічним тілом, надавати послуги домашнього господарства людям і автоматизувати операції на заводах, не покладаючись на керівництво людини.
По-третє, економте ресурси.
Як і люди, агенти штучного інтелекту можуть використовувати інструменти, тобто викликати API, для вирішення складніших завдань, що значно розширює можливості великих моделей і зменшує марнотратство та надмірне споживання ресурсів.
Наприклад, під час написання коду для AutoGPT вам потрібно отримати доступ до власних даних джерела інформації, обчислювальних ресурсів тощо. Під час цього процесу агент ШІ може автоматично знайти відповідний API для виклику, таким чином уникаючи марнування інших маркерів API. Ви також можете навчатися самостійно, оптимізувати результати та повторно викликати API, якщо вас не влаштовує.
Загалом кажучи, щоб справді виконати незрозумілу інструкцію користувача, наприклад планування подорожі, моделі потрібно викликати кілька API, щоб вирішити проблему. Агент штучного інтелекту з сильною автоматизацією, безсумнівно, може заощадити ресурси, тим самим заощаджуючи витрати для користувачів, дозволяючи штучному інтелекту до програм більш привабливим і конкурентним.
Для комерціалізації великих моделей модель API вимагає участі якомога більшої кількості груп розробників, а галузева модель також вимагає інтеграторів ISV, постачальників програмних послуг тощо. Всім відомо, що з базовою моделлю великого виробника важко перемогти, і ми сподіваємося знайти можливості в розділених додатках верхнього рівня. AI Agent може вирішувати конкретні проблеми, покращувати ефекти моделі та керувати цифровими системами та фізичними об’єктами, тому він дуже підходить для створення супердодатків.
Якщо AI Agent схожий на найменшу одиницю життя штучного інтелекту, то великі виробники моделей є фабриками, які породжують життя, а розробники, постачальники програмного забезпечення тощо схожі на курси навчання навичкам, які навчають їх практичним і диференційованим навичкам для галузі. з користувачами.
Таким чином, будь-яка велика модель може краще побудувати AI Agent, залучить більшу екосистему розробки та буде більш прив’язаною до комерційних кінцевих користувачів, створюючи величезні можливості на рівні платформи AI.
Підводячи підсумок, AI Agent безпосередньо впливає на ефект моделі, якість обслуговування, вартість впровадження та екологічні можливості великих моделей і стане ключем до конкуренції різних великих моделей у майбутньому.
Якщо AI Agent справляється добре, модель незамінна.
Тоді ви можете запитати, як ми можемо створити хорошого AI Agent? Які проблеми це створює для великих моделей?
Ми вважаємо, що для впровадження AI Agent великі моделі повинні виконувати наступні завдання, які також стануть центром конкуренції в майбутньому:
Можливості та ефекти AI Agent визначаються можливостями базової моделі. AI Agent може не мати можливості використовувати можливості базової моделі, але AI Agent може не мати можливостей, яких немає в базовій моделі.
Взявши як приклад мовні завдання, GPT-4 забезпечує потужні можливості розуміння природної мови, але наразі дуже мало з них фактично розгорнуто в агентах і продуктах штучного інтелекту. Деякі NPC в іграх досі не мають здатності приймати автономні рішення.
Для іншого прикладу, хоча GPT-4 є мультимодальним, він відкриває лише мовний API. Тому розробники, які хочуть використовувати мультимодальні можливості GPT4 для створення агентів штучного інтелекту, ще не можуть цього зробити, а інші модальності, такі як зображення та аудіо Виходячи зі стану інформації, розуміння агентом штучного інтелекту та його вплив на навколишнє середовище все ще потребує вдосконалення.
Таким чином, незалежно від того, чи це модель з відкритим або закритим кодом, якщо ви хочете комерціалізувати її через економіку API, можливості базової моделі будуть безпосередньо пов’язані з якістю агента штучного інтелекту, і ще є простір для вдосконалення.
Щоб бути хорошим агентом зі штучним інтелектом, збір і використання даних є основною передумовою. Для розробників кількість даних, необхідних для цифрових завдань, більше не є проблемою, але при розробці агентів штучного інтелекту у фізичному світі вартість даних дуже висока. Дані про керування роботами, як правило, можна збирати лише самостійно, за допомогою симулятора або колекції фізичних роботів на місці. Але врешті-решт симулятор не є реальним середовищем, і тренувальний ефект може бути поганим.Однак придбання сотень роботів і безпілотників, щоб фактично відправлятися в дорогу та заводи для збору даних, потребує великих інвестицій з точки зору закупівель витрати, політичні обмеження, фактичне впровадження тощо. Труднощі.
На даний момент великі виробники моделей з перевагами даних, як-от переваги автономного водіння Google і Baidu, а також переваги даних Microsoft, Google, Sogou, Baidu та інших пошукових компаній, можуть зменшити деякі бар’єри для розробників у дослідженні агентів AI. , а також створить бар’єри для великих моделей від цих постачальників.
Треба визнати, що можливості застосування великої моделі, які представляє AI Agent, все ще знаходяться на дуже ранній стадії, технологія ще не повністю зріла, а комерційне дослідження лише зробило невеликий крок. Для розробників, постачальників послуг програмного забезпечення тощо важливішим і більш раннім для розгляду, ніж те, як реалізувати AI Agent у коді, є уявлення про те, куди має рухатися AI Agent:
Як це має виглядати? Як вас звати? Чи є стать? Яку особистість ви використовуєте, щоб спілкуватися з користувачами? Які варіанти використання? З якими конкретними труднощами ви зіткнетеся? Як оцінити успішність AI Agent?
Це більше «нічиї землі» на рівні продукту та комерційному рівні. Щоб дозволити розробникам дати волю своїй уяві та спробувати створити агентів штучного інтелекту в різних середовищах і завданнях, великим виробникам моделей потрібно відкрити власну бізнес-екосистему та надати більш багаті та більш зручні рішення.функції для зменшення ризику проб і помилок для розробників, збільшення інтенсивності зв’язку з бізнес-користувачами та створення більшої кількості варіантів для бізнесу та прикладів реалізації.
Загалом, ця сфера все ще дуже нова, і AI Agent ще не вплинув на велику модельну індустрію.Однак безперечно, що AI Agent усуне велику кількість громіздких взаємодій між людьми та системами AI, і це відбувається .
Більше агентів ШІ просувається до спільнот і користувачів. Вони навчаються, змінюються та розвиваються. Можливо, через кілька місяців ми побачимо зрілість і вибух агентів штучного інтелекту, що неминуче призведе до чергових перестановок у сфері великих моделей.