AI Agent берет на себя большую языковую модель LLM и стал самой горячей темой в кругах AI.
В настоящее время ситуация в сфере AI венчурного капитала примерно следующая:
Клуб Big Factory: внутренние сотрудники OpenAI утверждают, что AI Agent — это новое направление OpenAI; Microsoft пытается продвигать второго пилота и позволить ИИ играть роль помощника, что является типичным сценарием AI Agent; NVIDIA запустила Voyager, этот AI Agent может быть автономным. Напишите код, чтобы доминировать в игре «Minecraft»; отечественная компания SenseTime также запустила универсального ИИ-агента; Alibaba запустила цифрового сотрудника...
Академический круг: В апреле этого года Стэнфорд создал город Мира Дикого Запада, позволяющий 25 ИИ-агентам имитировать людей в песочнице виртуального города, а также влюбляться, веселиться, сотрудничать, встречаться и т. д. с другими ИИ-агентами. Кроме того, некоторые ученые начали использовать агентов ИИ для разработки сложных научных экспериментов, включая автоматическое чтение статей в Интернете и исследование противораковых лекарств... Эти передовые исследования просто ошеломляют.
Entrepreneurship Circle: AI Agent — это не просто игра для ведущих ученых. Появилось множество проектов, таких как Camel, AutoGPT, BabyAGI и AgentGPT. Существует также большое количество разработчиков и предпринимателей из сообщества с открытым исходным кодом, которые используют эти проекты с открытым исходным кодом для создания некоторые практические инструменты. . Например, aomni — это приложение AI Agent, которое помогает пользователям собирать сетевую информацию и отправлять ее по электронной почте.
Инвестиционный круг: AI Agent считается «началом эры общего искусственного интеллекта (AGI)», и его вспышка является «железной». Некоторые предприниматели Кремниевой долины говорят, что, говоря с инвесторами о генеративных агентах, все смотрят вперед к этому и надеясь, что поймешь больше, станешь ближе и быстрее отреагируешь на последующие вспышки.
Из этих суждений еще рано говорить, что «Агент ИИ открыл вторую половину крупных моделей», но должно быть ясно, что «Агент ИИ является коммерческим стандартом для крупных моделей».
Таким образом, в дальнейшем мы должны увидеть, как больше крупных производителей и стартапов будут предпринимать больше действий в отношении AI Agent.
Итак, что же такое AI-агент? Почему говорят, что это необходимое условие для коммерциализации больших моделей?
Большая модель высокомерна и высокомерна, но пользователи все равно не платят.
Здесь мы сначала отложим AI-агент и посмотрим, что из себя представляет большая модель.
Я считаю, что большинство читателей согласны с тем, что крупные модели - это нечто, требующее высокого видения, больших инвестиций и высокого порога. С сентиментальной точки зрения можно реализовать общий искусственный интеллект и полностью изменить общество; с светской точки зрения, он может реконструировать бизнес. продукты и позволяют технологическим компаниям повысить производительность.
Но все они основаны на том факте, что большие модели могут быть по-настоящему коммерциализированы, окупить затраты на исследования и разработки и достичь здорового и устойчивого развития.
За последние несколько месяцев две бизнес-модели для больших моделей стали более эффективными: одна — это приватизированное локальное развертывание больших моделей правительствами и предприятиями в различных отраслях; другая — вычислительная мощность, необходимая для продажи больших моделей через облака, серверы искусственного интеллекта. и т. д. .
В настоящее время отечественные производители опубликовали соответствующие бизнес-отчеты и получили десятки миллионов доходов от требований о проведении приватизации в отрасли.
Однако бизнес ToB сам по себе не может поддерживать крупномасштабную бизнес-модель.
В ходе технологической революции основная технология должна распространиться и использоваться миллиардами обычных пользователей, чтобы создать экономическую ценность. После того, как домашние ПК, Интернет и смартфоны стали популярными среди масс, рыночная стоимость многих технологических компаний резко возросла.
Сегодня гиганты вложили много ресурсов в обучение больших моделей, особенно базовых, которые часто имеют масштабы параметров в сотни миллиардов или триллионов и должны использоваться массовыми пользователями.
Итак, каков реальный опыт применения?
Такие сценарии, как общение в чате, рисование и творчество, имеют высокий уровень толерантности к ошибкам. Даже если ИИ ответит на вопрос неправильно, пользователь всё равно посчитает это «милым». Эта часть приложения уже очень сложна, например « Фото для удостоверения личности AI». В большинстве сценариев ИИ необходим, чтобы автоматически помогать вам справляться с более серьезными задачами, сотрудничать с другими условиями окружающей среды и заниматься долгосрочными и непрерывными делами. Не делайте слишком много ошибок, иначе людям придется участвовать в большом количестве. и Невозможно реально повысить производительность.
Очевидно, что такой сценарий в настоящее время не может быть хорошо решен с помощью большой и сложной модели общего назначения.
Возьмем, к примеру, такого писателя, как я. Если я позволю крупной модели написать за меня мою рукопись, у нее могут возникнуть галлюцинации. Мне придется перепроверять упомянутые события/новости/документы, что более хлопотно, чем искать информацию самому и недостаточно точен. Когда мне приходит в голову идея, мне приходится использовать наводящие слова, чтобы вдохновить меня в течение длительного времени, и их может не быть, которые можно было бы использовать. Это медленно и утомительно, поэтому я мог бы также написать это сам.
Невозможность автоматического выполнения задач за один шаг требует вмешательства большого количества людей в проверку. В настоящее время это является основной трудностью в применении больших моделей в серьезных сценариях, а также напрямую влияет на ход реализации и коммерциализации больших моделей. .
Как это сделать? Если крупные модели хотят работать хорошо, им срочно нужна группа помощников, и это агенты ИИ.
Действительно повышающая производительность. Почему AI Agent так хорош?
Только представьте, если большая модель может работать сама по себе 24 часа в сутки, 7 дней в сутки, без вмешательства человека, она может самостоятельно выполнять различные задачи, людям достаточно лишь изредка возвращаться к компьютеру или в офис, чтобы посмотреть, как у нее дела. Это правильный способ открыть большую модель.
На конференции GPT-4 OpenAI продемонстрировала свою способность автоматизировать некоторые задачи, например, позволить GPT4 распознавать эскизы для создания веб-страниц и шаг за шагом исправлять ошибки в собственном коде.
Но как эту возможность могут использовать разработчики и обычные пользователи? Многие разработчики ответили, что если вы пишете код напрямую с использованием GPT4, вам все равно придется его отлаживать самостоятельно. Вы не сможете смотреть картинки, чтобы сгенерировать код для прямого использования. Иногда лучше его не использовать.
Крупные производители моделей также оказались перед дилеммой.Я открыл API.Чтобы добиться более профессиональных, точных и совершенных возможностей, кто-то должен его и дальше развивать, поэтому я передал эстафету агенту ИИ.
AI Agent — это автоматизированный объект искусственного интеллекта в среде, имеющий четыре основные характеристики:
Ощущайте окружающую среду с помощью датчиков. Эта среда может быть виртуальной, например, игры-песочницы, системы симуляционного обучения, автономные симуляторы вождения и т. д., или может быть физической, например, дороги, помещения, сборочные линии и т. д.
Способен принимать решения самостоятельно.
Исполнительные механизмы/эффекторы работают вместе, чтобы действовать.
Обучение и прогресс основаны на максимизации производительности и оптимизации результатов.
С этой точки зрения, сами люди на самом деле являются своего рода «разумным агентом» AI Agent. Мы можем ощущать изменения во внешней среде через наши глаза, уши, кожу и т. д., а затем принимать решения с помощью мозга, говорить ртом, и ходить ногами.Принимать меры и постоянно приспосабливаться к внешней среде на основе обратной связи с вознаграждением.
Фактически, у Агентов в ИИ та же логика. Возьмем в качестве примера агента искусственного интеллекта в сценарии автономного вождения.Датчики необходимы для сбора информации и определения факторов окружающей среды, таких как дорожные транспортные средства и пешеходы.Затем система будет автоматически принимать решения и управлять акселераторами, тормозами и другим оборудованием, чтобы реагировать соответствующим образом. .
Это также известно как модель AI Agent PEAS. Давайте составим простую таблицу, чтобы вы могли в этом разобраться:
Итак, какое влияние может оказать AI-агент, особенно на крупные модели? В основном он имеет следующие ключевые функции:
Сначала разберите задачу.
Большие модели необходимо сочетать с конкретной областью, а потребности пользователей, с которыми они сталкиваются, относительно общие, и этот процесс часто включает в себя несколько этапов. Точно так же, как пользователь говорит «должен быть свет», изолированная большая модель не знает, какие лампы есть в окружающей среде, и не знает, как ими управлять, поэтому даже с большой моделью она не может справиться с этой, казалось бы, простой но на самом деле сложная задача.
Агент ИИ обладает возможностями планирования задач и может автоматически понимать и решать, как планировать шаги, распределять ресурсы, оптимизировать решения, а затем выполнять инструкции, повышая эффективность и точность задач обработки больших моделей.
В статье исследовательской группы Google Brain большой языковой модели было предложено озвучить процесс рассуждения по декомпозиции шагов задачи, то есть «внутренний монолог», а затем предпринять соответствующие действия, что внезапно повысило точность ответы больших моделей.Он достиг результатов SOTA на нескольких наборах данных, улучшая бессмысленность больших моделей.
Во-вторых, автоматическое исполнение.
AI Agent создан для того, чтобы думать и действовать независимо: пользователям нужно только дать ему задание и позволить ему выполнять свою работу. Типичным примером AutoGPT является заказ пиццы. Пользователю не нужно вводить адрес или выбирать вкус. AI-агент берет на себя все этапы заказа и выполняет их автоматически. Люди могут наблюдать со стороны и корректировать их в время, если допущены ошибки.
AI Agent может не только использовать Интернет, но и работать в физической среде, управляя роботами для доставки экспресс-доставки, беспилотных автомобилей, автономного вождения и т. д.
Благодаря AI Agent взаимодействие между пользователями и большими моделями станет более естественным, простым и быстрым, что позволит сократить количество ручного труда и действительно повысить качество и эффективность. Например, в игровом мире AI-агент может автоматически начинать диалог с игроками, обеспечивать открытое взаимодействие и разрабатывать бесконечные сюжетные линии на основе отзывов игроков, что действительно делает игру более доступной для тысяч людей; в физическом мире AI-агент может автоматически генерировать инструкции и управлять, управлять механическим телом, оказывать людям хозяйственные услуги и автоматизировать операции на заводах, не полагаясь на руководство человека.
В-третьих, экономьте ресурсы.
Как и люди, ИИ-агенты могут использовать инструменты, то есть вызывать API, для решения более сложных задач, что значительно расширяет возможности больших моделей и снижает потери и чрезмерное потребление ресурсов.
Например, при написании кода для AutoGPT вам необходимо получить доступ к данным источника частной информации, вычислительным ресурсам и т. д. В ходе этого процесса AI-агент может автоматически найти соответствующий API для вызова, избегая таким образом траты других токенов API. Вы также можете учиться самостоятельно, оптимизировать результаты и снова вызывать API, если вас что-то не устраивает.
Вообще говоря, чтобы действительно выполнить неясную инструкцию пользователя, например, планирование поездки, модели необходимо вызвать несколько API для решения проблемы. более привлекательным и конкурентоспособным.
В-четвертых, привлечь разработчиков.
Для коммерциализации больших моделей модель API требует участия как можно большего числа групп разработчиков, а отраслевая модель также требует интеграторов независимых поставщиков программного обеспечения, поставщиков программных услуг и т. д. Все знают, что с базовой моделью крупного производителя победить сложно, и мы надеемся найти возможности в подразделенных приложениях верхнего уровня. AI Agent может решать конкретные проблемы, улучшать эффекты модели и управлять цифровыми системами и физическими объектами, поэтому он очень подходит для создания суперприложений.
Если ИИ-агент похож на мельчайшую единицу жизни ИИ, то крупные производители моделей — это фабрики, порождающие жизнь, а разработчики, поставщики программного обеспечения и т. д. — это курсы повышения квалификации, обучающие их некоторым практическим и дифференцированным навыкам для отрасли. с пользователями.
Таким образом, какая бы крупная модель ни могла лучше построить AI Agent, она привлечет более крупную экосистему разработки и будет более привязана к коммерческим B-конечным пользователям, создавая огромные возможности на уровне платформы AI.
Подводя итог, AI Agent напрямую влияет на эффект модели, качество обслуживания, стоимость внедрения и экологические возможности больших моделей и станет ключом к конкуренции различных крупных моделей в будущем.
Если AI Agent работает хорошо, модель незаменима.
Тогда вы можете спросить, как нам создать хорошего ИИ-агента? Какие проблемы это создает для больших моделей?
Мы считаем, что для реализации AI Agent большие модели должны выполнять следующие задачи, которые также будут в центре внимания конкуренции в будущем:
Базовая модель.
Возможности и эффекты AI Agent определяются возможностями базовой базовой модели. Агент ИИ может не иметь возможности использовать возможности базовой модели, но у Агента ИИ может не быть тех возможностей, которых нет у базовой модели.
Если взять в качестве примера языковые задачи, GPT-4 обеспечивает широкие возможности понимания естественного языка, но в настоящее время очень немногие из них фактически используются в агентах и продуктах ИИ. Некоторые NPC в играх до сих пор не обладают способностью принимать автономные решения.
Другой пример: хотя GPT-4 является мультимодальным, он открывает только языковой API. Поэтому разработчики, которые хотят использовать мультимодальные возможности GPT4 для создания агентов ИИ, пока не могут этого сделать, а другие модальности, такие как изображения и аудио, доступны. Судя по состоянию информации, понимание и влияние окружающей среды AI-агентом все еще необходимо улучшить.
Поэтому, будь то модель с открытым исходным кодом или модель с закрытым исходным кодом, если вы хотите коммерциализировать ее через экономику API, возможности базовой модели будут напрямую связаны с качеством AI-агента, и есть еще возможности для совершенствования.
2. Знание данных.
Чтобы стать хорошим агентом ИИ, основным условием является сбор и использование данных. Для разработчиков объем данных, необходимый для цифровых задач, больше не является проблемой, но при разработке ИИ-агентов в физическом мире затраты на данные очень высоки. Данные управления роботом, как правило, можно собрать только самостоятельно, с помощью симулятора или сбора физических роботов на месте. Но в конце концов, симулятор не является реальной средой, и эффект обучения может быть не очень хорошим. Однако закупка сотен роботов и дронов, которые действительно могут отправляться в путь и на заводы для сбора данных, требует больших инвестиций с точки зрения закупок. затраты, политические ограничения, фактическая реализация и т. д. Трудности.
На этом этапе крупные производители моделей, обладающие преимуществами данных, такими как преимущества автономного вождения Google и Baidu, а также преимуществами данных Microsoft, Google, Sogou, Baidu и других поисковых компаний, могут снизить некоторые барьеры для разработчиков при изучении агентов искусственного интеллекта. , а также построим барьеры для крупных моделей этих производителей.
Поддержка продукта.
Следует признать, что возможности применения больших моделей, предоставляемые AI Agent, все еще находятся на очень ранней стадии, технология еще не полностью развита, а коммерческое освоение только что сделало небольшой шаг. Для разработчиков, поставщиков программных услуг и т. д. важнее и раньше рассмотреть вопрос о том, как реализовать AI-агент в коде, — это представить, куда должен идти AI-агент:
Как это должно выглядеть? Как вас зовут? Есть ли пол? Какую личность вы используете, чтобы общаться с пользователями? Каковы варианты использования? С какими конкретно трудностями вы столкнетесь? Как оценить успех ИИ-агента?
Это скорее «ничейная зона» на уровне продукта и на коммерческом уровне.Чтобы позволить разработчикам дать волю своему воображению и попытаться создать агентов ИИ для различных сред и задач, крупным производителям моделей необходимо открыть свою собственную бизнес-экосистему и предоставить более богатые и более удобные решения и функции, позволяющие снизить риск проб и ошибок для разработчиков, повысить интенсивность стыковки с бизнес-пользователями, а также генерировать больше бизнес-вариантов и кейсов реализации.
В целом, эта область все еще очень нова, и агент ИИ еще не оказал явного влияния на индустрию крупных моделей. .
Сообществам и пользователям становится все больше агентов ИИ. Они учатся, меняются и развиваются. Возможно, через несколько месяцев мы увидим зрелость и взрыв ИИ-агентов, что неизбежно спровоцирует очередные перестановки в сфере крупных моделей.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Большая модель высокомерна и высокомерна. Без агентов ИИ трудно предсказать жизнь или смерть.
Оригинал: Тибетская лисица
**Источник: **Полярное тело мозга.
AI Agent берет на себя большую языковую модель LLM и стал самой горячей темой в кругах AI.
В настоящее время ситуация в сфере AI венчурного капитала примерно следующая:
Клуб Big Factory: внутренние сотрудники OpenAI утверждают, что AI Agent — это новое направление OpenAI; Microsoft пытается продвигать второго пилота и позволить ИИ играть роль помощника, что является типичным сценарием AI Agent; NVIDIA запустила Voyager, этот AI Agent может быть автономным. Напишите код, чтобы доминировать в игре «Minecraft»; отечественная компания SenseTime также запустила универсального ИИ-агента; Alibaba запустила цифрового сотрудника...
Академический круг: В апреле этого года Стэнфорд создал город Мира Дикого Запада, позволяющий 25 ИИ-агентам имитировать людей в песочнице виртуального города, а также влюбляться, веселиться, сотрудничать, встречаться и т. д. с другими ИИ-агентами. Кроме того, некоторые ученые начали использовать агентов ИИ для разработки сложных научных экспериментов, включая автоматическое чтение статей в Интернете и исследование противораковых лекарств... Эти передовые исследования просто ошеломляют.
Entrepreneurship Circle: AI Agent — это не просто игра для ведущих ученых. Появилось множество проектов, таких как Camel, AutoGPT, BabyAGI и AgentGPT. Существует также большое количество разработчиков и предпринимателей из сообщества с открытым исходным кодом, которые используют эти проекты с открытым исходным кодом для создания некоторые практические инструменты. . Например, aomni — это приложение AI Agent, которое помогает пользователям собирать сетевую информацию и отправлять ее по электронной почте.
Из этих суждений еще рано говорить, что «Агент ИИ открыл вторую половину крупных моделей», но должно быть ясно, что «Агент ИИ является коммерческим стандартом для крупных моделей».
Таким образом, в дальнейшем мы должны увидеть, как больше крупных производителей и стартапов будут предпринимать больше действий в отношении AI Agent.
Итак, что же такое AI-агент? Почему говорят, что это необходимое условие для коммерциализации больших моделей?
Большая модель высокомерна и высокомерна, но пользователи все равно не платят.
Здесь мы сначала отложим AI-агент и посмотрим, что из себя представляет большая модель.
Я считаю, что большинство читателей согласны с тем, что крупные модели - это нечто, требующее высокого видения, больших инвестиций и высокого порога. С сентиментальной точки зрения можно реализовать общий искусственный интеллект и полностью изменить общество; с светской точки зрения, он может реконструировать бизнес. продукты и позволяют технологическим компаниям повысить производительность.
Но все они основаны на том факте, что большие модели могут быть по-настоящему коммерциализированы, окупить затраты на исследования и разработки и достичь здорового и устойчивого развития.
За последние несколько месяцев две бизнес-модели для больших моделей стали более эффективными: одна — это приватизированное локальное развертывание больших моделей правительствами и предприятиями в различных отраслях; другая — вычислительная мощность, необходимая для продажи больших моделей через облака, серверы искусственного интеллекта. и т. д. .
В настоящее время отечественные производители опубликовали соответствующие бизнес-отчеты и получили десятки миллионов доходов от требований о проведении приватизации в отрасли.
Однако бизнес ToB сам по себе не может поддерживать крупномасштабную бизнес-модель.
В ходе технологической революции основная технология должна распространиться и использоваться миллиардами обычных пользователей, чтобы создать экономическую ценность. После того, как домашние ПК, Интернет и смартфоны стали популярными среди масс, рыночная стоимость многих технологических компаний резко возросла.
Итак, каков реальный опыт применения?
Такие сценарии, как общение в чате, рисование и творчество, имеют высокий уровень толерантности к ошибкам. Даже если ИИ ответит на вопрос неправильно, пользователь всё равно посчитает это «милым». Эта часть приложения уже очень сложна, например « Фото для удостоверения личности AI». В большинстве сценариев ИИ необходим, чтобы автоматически помогать вам справляться с более серьезными задачами, сотрудничать с другими условиями окружающей среды и заниматься долгосрочными и непрерывными делами. Не делайте слишком много ошибок, иначе людям придется участвовать в большом количестве. и Невозможно реально повысить производительность.
Очевидно, что такой сценарий в настоящее время не может быть хорошо решен с помощью большой и сложной модели общего назначения.
Возьмем, к примеру, такого писателя, как я. Если я позволю крупной модели написать за меня мою рукопись, у нее могут возникнуть галлюцинации. Мне придется перепроверять упомянутые события/новости/документы, что более хлопотно, чем искать информацию самому и недостаточно точен. Когда мне приходит в голову идея, мне приходится использовать наводящие слова, чтобы вдохновить меня в течение длительного времени, и их может не быть, которые можно было бы использовать. Это медленно и утомительно, поэтому я мог бы также написать это сам.
Невозможность автоматического выполнения задач за один шаг требует вмешательства большого количества людей в проверку. В настоящее время это является основной трудностью в применении больших моделей в серьезных сценариях, а также напрямую влияет на ход реализации и коммерциализации больших моделей. .
Как это сделать? Если крупные модели хотят работать хорошо, им срочно нужна группа помощников, и это агенты ИИ.
Действительно повышающая производительность. Почему AI Agent так хорош?
Только представьте, если большая модель может работать сама по себе 24 часа в сутки, 7 дней в сутки, без вмешательства человека, она может самостоятельно выполнять различные задачи, людям достаточно лишь изредка возвращаться к компьютеру или в офис, чтобы посмотреть, как у нее дела. Это правильный способ открыть большую модель.
На конференции GPT-4 OpenAI продемонстрировала свою способность автоматизировать некоторые задачи, например, позволить GPT4 распознавать эскизы для создания веб-страниц и шаг за шагом исправлять ошибки в собственном коде.
Но как эту возможность могут использовать разработчики и обычные пользователи? Многие разработчики ответили, что если вы пишете код напрямую с использованием GPT4, вам все равно придется его отлаживать самостоятельно. Вы не сможете смотреть картинки, чтобы сгенерировать код для прямого использования. Иногда лучше его не использовать.
Крупные производители моделей также оказались перед дилеммой.Я открыл API.Чтобы добиться более профессиональных, точных и совершенных возможностей, кто-то должен его и дальше развивать, поэтому я передал эстафету агенту ИИ.
AI Agent — это автоматизированный объект искусственного интеллекта в среде, имеющий четыре основные характеристики:
Ощущайте окружающую среду с помощью датчиков. Эта среда может быть виртуальной, например, игры-песочницы, системы симуляционного обучения, автономные симуляторы вождения и т. д., или может быть физической, например, дороги, помещения, сборочные линии и т. д.
Способен принимать решения самостоятельно.
Исполнительные механизмы/эффекторы работают вместе, чтобы действовать.
Обучение и прогресс основаны на максимизации производительности и оптимизации результатов.
Фактически, у Агентов в ИИ та же логика. Возьмем в качестве примера агента искусственного интеллекта в сценарии автономного вождения.Датчики необходимы для сбора информации и определения факторов окружающей среды, таких как дорожные транспортные средства и пешеходы.Затем система будет автоматически принимать решения и управлять акселераторами, тормозами и другим оборудованием, чтобы реагировать соответствующим образом. .
Это также известно как модель AI Agent PEAS. Давайте составим простую таблицу, чтобы вы могли в этом разобраться:
Сначала разберите задачу.
Большие модели необходимо сочетать с конкретной областью, а потребности пользователей, с которыми они сталкиваются, относительно общие, и этот процесс часто включает в себя несколько этапов. Точно так же, как пользователь говорит «должен быть свет», изолированная большая модель не знает, какие лампы есть в окружающей среде, и не знает, как ими управлять, поэтому даже с большой моделью она не может справиться с этой, казалось бы, простой но на самом деле сложная задача.
Агент ИИ обладает возможностями планирования задач и может автоматически понимать и решать, как планировать шаги, распределять ресурсы, оптимизировать решения, а затем выполнять инструкции, повышая эффективность и точность задач обработки больших моделей.
В статье исследовательской группы Google Brain большой языковой модели было предложено озвучить процесс рассуждения по декомпозиции шагов задачи, то есть «внутренний монолог», а затем предпринять соответствующие действия, что внезапно повысило точность ответы больших моделей.Он достиг результатов SOTA на нескольких наборах данных, улучшая бессмысленность больших моделей.
Во-вторых, автоматическое исполнение.
AI Agent создан для того, чтобы думать и действовать независимо: пользователям нужно только дать ему задание и позволить ему выполнять свою работу. Типичным примером AutoGPT является заказ пиццы. Пользователю не нужно вводить адрес или выбирать вкус. AI-агент берет на себя все этапы заказа и выполняет их автоматически. Люди могут наблюдать со стороны и корректировать их в время, если допущены ошибки.
AI Agent может не только использовать Интернет, но и работать в физической среде, управляя роботами для доставки экспресс-доставки, беспилотных автомобилей, автономного вождения и т. д.
Благодаря AI Agent взаимодействие между пользователями и большими моделями станет более естественным, простым и быстрым, что позволит сократить количество ручного труда и действительно повысить качество и эффективность. Например, в игровом мире AI-агент может автоматически начинать диалог с игроками, обеспечивать открытое взаимодействие и разрабатывать бесконечные сюжетные линии на основе отзывов игроков, что действительно делает игру более доступной для тысяч людей; в физическом мире AI-агент может автоматически генерировать инструкции и управлять, управлять механическим телом, оказывать людям хозяйственные услуги и автоматизировать операции на заводах, не полагаясь на руководство человека.
В-третьих, экономьте ресурсы.
Как и люди, ИИ-агенты могут использовать инструменты, то есть вызывать API, для решения более сложных задач, что значительно расширяет возможности больших моделей и снижает потери и чрезмерное потребление ресурсов.
Например, при написании кода для AutoGPT вам необходимо получить доступ к данным источника частной информации, вычислительным ресурсам и т. д. В ходе этого процесса AI-агент может автоматически найти соответствующий API для вызова, избегая таким образом траты других токенов API. Вы также можете учиться самостоятельно, оптимизировать результаты и снова вызывать API, если вас что-то не устраивает.
Вообще говоря, чтобы действительно выполнить неясную инструкцию пользователя, например, планирование поездки, модели необходимо вызвать несколько API для решения проблемы. более привлекательным и конкурентоспособным.
Для коммерциализации больших моделей модель API требует участия как можно большего числа групп разработчиков, а отраслевая модель также требует интеграторов независимых поставщиков программного обеспечения, поставщиков программных услуг и т. д. Все знают, что с базовой моделью крупного производителя победить сложно, и мы надеемся найти возможности в подразделенных приложениях верхнего уровня. AI Agent может решать конкретные проблемы, улучшать эффекты модели и управлять цифровыми системами и физическими объектами, поэтому он очень подходит для создания суперприложений.
Если ИИ-агент похож на мельчайшую единицу жизни ИИ, то крупные производители моделей — это фабрики, порождающие жизнь, а разработчики, поставщики программного обеспечения и т. д. — это курсы повышения квалификации, обучающие их некоторым практическим и дифференцированным навыкам для отрасли. с пользователями.
Таким образом, какая бы крупная модель ни могла лучше построить AI Agent, она привлечет более крупную экосистему разработки и будет более привязана к коммерческим B-конечным пользователям, создавая огромные возможности на уровне платформы AI.
Подводя итог, AI Agent напрямую влияет на эффект модели, качество обслуживания, стоимость внедрения и экологические возможности больших моделей и станет ключом к конкуренции различных крупных моделей в будущем.
Если AI Agent работает хорошо, модель незаменима.
Тогда вы можете спросить, как нам создать хорошего ИИ-агента? Какие проблемы это создает для больших моделей?
Мы считаем, что для реализации AI Agent большие модели должны выполнять следующие задачи, которые также будут в центре внимания конкуренции в будущем:
Возможности и эффекты AI Agent определяются возможностями базовой базовой модели. Агент ИИ может не иметь возможности использовать возможности базовой модели, но у Агента ИИ может не быть тех возможностей, которых нет у базовой модели.
Если взять в качестве примера языковые задачи, GPT-4 обеспечивает широкие возможности понимания естественного языка, но в настоящее время очень немногие из них фактически используются в агентах и продуктах ИИ. Некоторые NPC в играх до сих пор не обладают способностью принимать автономные решения.
Другой пример: хотя GPT-4 является мультимодальным, он открывает только языковой API. Поэтому разработчики, которые хотят использовать мультимодальные возможности GPT4 для создания агентов ИИ, пока не могут этого сделать, а другие модальности, такие как изображения и аудио, доступны. Судя по состоянию информации, понимание и влияние окружающей среды AI-агентом все еще необходимо улучшить.
Поэтому, будь то модель с открытым исходным кодом или модель с закрытым исходным кодом, если вы хотите коммерциализировать ее через экономику API, возможности базовой модели будут напрямую связаны с качеством AI-агента, и есть еще возможности для совершенствования.
Чтобы стать хорошим агентом ИИ, основным условием является сбор и использование данных. Для разработчиков объем данных, необходимый для цифровых задач, больше не является проблемой, но при разработке ИИ-агентов в физическом мире затраты на данные очень высоки. Данные управления роботом, как правило, можно собрать только самостоятельно, с помощью симулятора или сбора физических роботов на месте. Но в конце концов, симулятор не является реальной средой, и эффект обучения может быть не очень хорошим. Однако закупка сотен роботов и дронов, которые действительно могут отправляться в путь и на заводы для сбора данных, требует больших инвестиций с точки зрения закупок. затраты, политические ограничения, фактическая реализация и т. д. Трудности.
На этом этапе крупные производители моделей, обладающие преимуществами данных, такими как преимущества автономного вождения Google и Baidu, а также преимуществами данных Microsoft, Google, Sogou, Baidu и других поисковых компаний, могут снизить некоторые барьеры для разработчиков при изучении агентов искусственного интеллекта. , а также построим барьеры для крупных моделей этих производителей.
Следует признать, что возможности применения больших моделей, предоставляемые AI Agent, все еще находятся на очень ранней стадии, технология еще не полностью развита, а коммерческое освоение только что сделало небольшой шаг. Для разработчиков, поставщиков программных услуг и т. д. важнее и раньше рассмотреть вопрос о том, как реализовать AI-агент в коде, — это представить, куда должен идти AI-агент:
Как это должно выглядеть? Как вас зовут? Есть ли пол? Какую личность вы используете, чтобы общаться с пользователями? Каковы варианты использования? С какими конкретно трудностями вы столкнетесь? Как оценить успех ИИ-агента?
Это скорее «ничейная зона» на уровне продукта и на коммерческом уровне.Чтобы позволить разработчикам дать волю своему воображению и попытаться создать агентов ИИ для различных сред и задач, крупным производителям моделей необходимо открыть свою собственную бизнес-экосистему и предоставить более богатые и более удобные решения и функции, позволяющие снизить риск проб и ошибок для разработчиков, повысить интенсивность стыковки с бизнес-пользователями, а также генерировать больше бизнес-вариантов и кейсов реализации.
В целом, эта область все еще очень нова, и агент ИИ еще не оказал явного влияния на индустрию крупных моделей. .
Сообществам и пользователям становится все больше агентов ИИ. Они учатся, меняются и развиваются. Возможно, через несколько месяцев мы увидим зрелость и взрыв ИИ-агентов, что неизбежно спровоцирует очередные перестановки в сфере крупных моделей.