O grande modelo é arrogante e arrogante. Sem agentes de IA, é difícil prever a vida ou a morte.

Original: Raposa Tibetana

**Fonte: **Cérebro Polar Corpo

O AI Agent está assumindo o controle do grande modelo de linguagem LLM e se tornou o tópico mais quente no círculo de IA.

Atualmente, a situação no círculo de capital de risco de IA é aproximadamente a seguinte:

Big Factory Club: Funcionários internos da OpenAI afirmam que o AI Agent é a nova direção da OpenAI; a Microsoft está tentando promover o copiloto e deixar a IA desempenhar o papel de assistente, que é um cenário típico do AI Agent; a NVIDIA lançou o Voyager, este AI Agent pode seja autônomo Escreva código para dominar o jogo "Minecraft"; o SenseTime doméstico também lançou um agente generalista de IA; o Alibaba lançou um funcionário digital...

Círculo acadêmico: Em abril deste ano, Stanford criou uma cidade do Westworld, permitindo que 25 Agentes de IA simulassem humanos no ambiente sandbox da cidade virtual e se apaixonassem, festejassem, colaborassem, namorassem, etc. Além disso, alguns estudiosos começaram a usar agentes de IA para projetar experimentos científicos complexos, incluindo a leitura automática de artigos online e a pesquisa de medicamentos anticâncer... Essas explorações de ponta são alucinantes.

Círculo de Empreendedorismo: AI Agent não é apenas um jogo para cientistas de ponta. Muitos projetos como Camel, AutoGPT, BabyAGI e AgentGPT surgiram. Há também um grande número de desenvolvedores e empreendedores de comunidades de código aberto que usam esses projetos de código aberto para criar algumas ferramentas práticas. Por exemplo, aomni é um aplicativo AI Agent que ajuda os usuários a capturar informações de rede e enviá-las por e-mail.

Círculo de investimentos: o Agente AI é considerado “o início da era da inteligência artificial geral (AGI)”, e seu surto é “forte”. Alguns empresários do Vale do Silício disseram que, ao conversar com investidores sobre Agentes Geradores, todos estão ansiosos a isso e esperando que entendam mais, se aproximem e respondam mais rapidamente às explosões subsequentes.

A partir desses julgamentos, ainda é muito cedo para dizer que “AI Agent abriu a segunda metade dos grandes modelos”, mas deve ficar claro que “AI Agent é o padrão comercial para grandes modelos”.

Portanto, a seguir devemos ver mais grandes fabricantes e startups realizando mais ações no AI Agent.

Então, o que exatamente é o Agente AI? Por que se diz que é uma condição necessária para a comercialização de modelos de grande porte?

O grande modelo é arrogante e arrogante, mas os usuários ainda não pagam.

Aqui deixamos primeiro o Agente AI de lado e damos uma olhada em como é o grande modelo.

Acredito que a maioria dos leitores concorda que grandes modelos são algo com alta visão, alto investimento e alto limiar. De uma perspectiva sentimental, é possível realizar a inteligência artificial geral e mudar completamente a sociedade; de uma perspectiva secular, pode reconstruir negócios/ produtos e permitir que as empresas de tecnologia aumentem o desempenho.

Mas tudo isto se baseia no facto de que grandes modelos podem ser verdadeiramente comercializados, recuperar custos de I&D e alcançar um desenvolvimento saudável e sustentável.

Nos últimos meses, dois modelos de negócios para grandes modelos tornaram-se mais eficazes: um é a implantação local privatizada de grandes modelos por governos e empresas em vários setores; o outro é o poder de computação necessário para vender grandes modelos através de nuvens, servidores de IA , etc.

Actualmente, os fabricantes nacionais divulgaram relatórios comerciais correspondentes e obtiveram dezenas de milhões de receitas provenientes da procura de implantação da privatização na indústria.

Contudo, os negócios ToB por si só não podem apoiar um modelo de negócios em grande escala.

Numa revolução tecnológica, a tecnologia central deve fluir e ser utilizada por milhares de milhões de utilizadores comuns, a fim de criar valor económico. Depois que os PCs domésticos, a Internet e os smartphones se tornaram populares entre as massas, o valor de mercado de muitas empresas de tecnologia disparou.

Hoje em dia, os gigantes têm investido muitos recursos no treinamento de grandes modelos, especialmente modelos básicos, que muitas vezes têm escalas de parâmetros de centenas de bilhões ou trilhões, e devem ser usados por usuários em massa.

Então, qual é a experiência real do aplicativo?

Cenários como bate-papo, desenho e criatividade têm uma alta taxa de tolerância a erros. Mesmo que a IA responda a pergunta incorretamente, o usuário ainda achará "fofo". Essa parte do aplicativo já é muito complicada, como " Foto de identificação AI". Na maioria dos cenários, a IA é necessária para ajudá-lo automaticamente a lidar com tarefas mais sérias, cooperar com outras condições ambientais e lidar com negócios contínuos e de longo prazo. Não cometa muitos erros, caso contrário, as pessoas terão que participar em grande número, e Não é possível realmente aumentar a produtividade.

Obviamente, este tipo de cenário não pode ser bem resolvido por um modelo de uso geral grande e complexo no momento.

Tomemos como exemplo um escritor como eu. Se eu deixar uma grande modelo escrever meu manuscrito para mim, ela pode ter alucinações. Tenho que verificar novamente os eventos/notícias/jornais mencionados, o que é mais problemático do que procurar informações sozinho e não é preciso o suficiente. Quando tenho uma ideia, tenho que usar palavras rápidas para me inspirar por um longo tempo, e pode não haver nenhuma que possa ser usada. É lento e cansativo, então é melhor escrever sou eu mesmo.

A incapacidade de completar tarefas automaticamente em uma única etapa requer a intervenção de um grande número de humanos na revisão. Esta é atualmente uma grande dificuldade na aplicação de grandes modelos em cenários sérios, e também afeta diretamente o progresso da implementação e comercialização de grandes modelos. .

Como fazer isso? Se os modelos grandes desejam ter um bom desempenho, eles precisam urgentemente de um grupo de ajudantes, que são os Agentes de IA.

Produtividade realmente libertadora, por que o AI Agent é tão incrível?

Imagine, se um modelo grande pode funcionar sozinho 24 horas por dia, 7 dias por dia, sem intervenção humana, ele pode realizar várias tarefas sozinho. As pessoas só precisam retornar ocasionalmente ao computador ou ao escritório para ver como está o desempenho. Esta é a maneira correta de abrir um modelo grande.

Na conferência GPT-4, a OpenAI demonstrou sua capacidade de automatizar algumas tarefas, como permitir que o GPT4 reconheça esboços para gerar páginas da web e corrija erros em seu próprio código passo a passo.

Mas como esse recurso pode ser utilizado por desenvolvedores e usuários comuns? Muitos desenvolvedores responderam que se você escrever código diretamente usando GPT4, ainda terá que depurá-lo sozinho. Você não pode olhar imagens para gerar código para uso direto. Às vezes é melhor não usá-lo.

Os grandes fabricantes de modelos também estão em um dilema. Abri a API. Para obter recursos mais profissionais, precisos e refinados, alguém precisa desenvolvê-la ainda mais, então entreguei o bastão ao agente de IA.

AI Agent é uma entidade automatizada de IA no ambiente. Possui quatro características principais:

  1. Sinta o ambiente circundante através de sensores. Esse ambiente pode ser virtual, como jogos sandbox, sistemas de simulação de treinamento, simuladores de direção autônoma, etc., ou pode ser físico, como estradas, salas, linhas de montagem, etc.

  2. Capaz de tomar decisões de forma independente.

  3. Atuadores/efetores trabalham juntos para agir.

  4. Aprendizagem e progresso baseados na maximização do desempenho e na otimização dos resultados.

Desta perspectiva, os próprios humanos são na verdade uma espécie de agente de IA "agente inteligente", podemos sentir mudanças no ambiente externo através de nossos olhos, ouvidos, pele, etc., e então tomar decisões através de nossos cérebros, falar com nossas bocas, e andar com as pernas. Agir e ajustar-se continuamente ao ambiente externo com base no feedback da recompensa.

Na verdade, os Agentes em IA têm a mesma lógica. Tomemos como exemplo o Agente de IA no cenário de direção autônoma. Sensores são necessários para coletar informações e detectar fatores ambientais, como veículos rodoviários e pedestres. O sistema tomará decisões automaticamente e acionará aceleradores, freios e outros equipamentos para responder adequadamente .

Isso também é conhecido como modelo PEAS do Agente AI. Vamos fazer uma tabela simples para você ter uma ideia:

Então, especificamente em modelos grandes, que impacto o AI Agent pode trazer? Possui principalmente as seguintes funções principais:

Primeiro, desmonte a tarefa.

Grandes modelos precisam ser combinados com um campo específico, e as necessidades do usuário que enfrentam são relativamente gerais, e o processo geralmente envolve várias etapas. Assim como o usuário diz "é preciso ter luz", um modelo grande isolado não sabe quais lâmpadas estão no ambiente, nem como controlá-las. Portanto, mesmo com um modelo grande, ele não consegue lidar com essa tarefa aparentemente simples. mas na verdade tarefa complexa.

O Agente de IA possui recursos de planejamento de tarefas e pode compreender e decidir automaticamente como planejar etapas, alocar recursos, otimizar decisões e, em seguida, completar instruções, melhorando a eficiência e a precisão de tarefas de processamento de grandes modelos.

Em um artigo da equipe de pesquisa do Google Brain, foi solicitado ao grande modelo de linguagem que falasse o processo de raciocínio de decomposição das etapas da tarefa, ou seja, o "monólogo interno", e então tomasse as ações correspondentes, o que de repente melhorou a precisão do respostas de modelos grandes.Alcançou resultados SOTA em vários conjuntos de dados, melhorando o absurdo de modelos grandes.

Em segundo lugar, a execução automática.

O AI Agent foi projetado para pensar e agir de forma independente. Os usuários só precisam atribuir uma tarefa e deixá-lo fazer seu trabalho. Um exemplo típico de AutoGPT é o pedido de pizza. O usuário não precisa digitar o endereço ou escolher o sabor. O Agente AI cuida de todas as etapas do pedido e as executa automaticamente. As pessoas podem assistir de lado e corrigi-las em tempo se algum erro for cometido.

O AI Agent pode não apenas usar a Internet, mas também trabalhar no ambiente físico, controlando robôs para entrega expressa, carros sem motorista, direção autônoma, etc.

Com o AI Agent, a interação entre usuários e grandes modelos será mais natural, simples e rápida, reduzindo a participação manual e melhorando verdadeiramente a qualidade e a eficiência. Por exemplo, no mundo do jogo, o AI Agent pode iniciar automaticamente um diálogo com os jogadores, fornecer interação aberta e criar enredos infinitos com base no feedback dos jogadores, tornando o jogo verdadeiramente mais acessível a milhares de pessoas; no mundo físico, o AI Agent pode gerar instruções e operar automaticamente, acionar o corpo mecânico, fornecer serviços de limpeza para humanos e automatizar operações em fábricas sem depender da orientação humana.

Terceiro, economize recursos.

Assim como os humanos, os Agentes de IA podem utilizar ferramentas, ou seja, chamar APIs, para lidar com tarefas mais complexas, o que amplia muito as capacidades de grandes modelos e reduz o desperdício e o consumo excessivo de recursos.

Por exemplo, ao escrever código para AutoGPT, você precisa acessar dados de fontes de informações proprietárias, recursos de computação, etc. Durante esse processo, o Agente de IA pode encontrar automaticamente a API apropriada para chamar, evitando assim o desperdício de outros tokens de API. Você também pode aprender de forma independente, otimizar os resultados e chamar a API novamente se não estiver satisfeito.

De um modo geral, para realmente completar uma instrução de usuário pouco clara, como o planejamento de viagens, o modelo precisa chamar várias APIs para resolver o problema. Agentes de IA com forte automação podem, sem dúvida, economizar recursos, economizando custos para os usuários, permitindo que os aplicativos de IA sejam mais atraentes e competitivo.

Quarto, atraia desenvolvedores.

Para a comercialização de grandes modelos, o modelo API requer a participação de tantos grupos de desenvolvedores quanto possível, e o modelo industrial também requer integradores ISV, provedores de serviços de software, etc. Todos sabem que é difícil vencer com o modelo básico de um grande fabricante e esperamos encontrar oportunidades em aplicações subdivididas de nível superior. O AI Agent pode resolver problemas específicos, melhorar os efeitos do modelo e conduzir sistemas digitais e entidades físicas, por isso é muito adequado para a construção de superaplicativos.

Se o Agente de IA é como a menor unidade da vida da IA, então os grandes fabricantes de modelos são as fábricas que geram vida, e os desenvolvedores, fornecedores de software, etc. são como aulas de treinamento de habilidades, ensinando-lhes algumas habilidades práticas e diferenciadas para a indústria. com os usuários.

Portanto, qualquer modelo grande que possa construir melhor o Agente de IA atrairá um ecossistema de desenvolvimento maior e será mais aderente aos usuários finais B comerciais, formando uma grande oportunidade no nível da plataforma de IA.

Resumindo, o AI Agent afeta diretamente o efeito do modelo, a qualidade do serviço, o custo de implementação e as capacidades ecológicas de grandes modelos, e será a chave para a competição de vários grandes modelos no futuro.

Se o Agente AI se sair bem, o modelo é indispensável.

Então você pode perguntar: como podemos gerar um bom Agente de IA? Que desafios isso representa para modelos grandes?

Acreditamos que para que o AI Agent seja implementado, grandes modelos precisam realizar as seguintes tarefas, que também serão foco de competição no futuro:

  1. Modelo básico.

As capacidades e efeitos do AI Agent são determinados pelas capacidades do modelo básico subjacente. O Agente de IA pode não ser capaz de usar os recursos do modelo básico, mas o Agente de IA pode não ter os recursos que o modelo básico não possui.

Tomando como exemplo tarefas de linguagem, o GPT-4 fornece fortes capacidades de compreensão de linguagem natural, mas atualmente poucas delas são realmente implantadas em agentes e produtos de IA. Alguns NPCs em jogos ainda não têm a capacidade de tomar decisões autônomas.

Por outro exemplo, embora o GPT-4 seja multimodal, ele apenas abre a API da linguagem, portanto, os desenvolvedores que desejam usar os recursos multimodais do GPT4 para construir agentes de IA ainda não podem fazê-lo, e outras modalidades, como imagens e áudio, são faltando. Com base no estado das informações, a compreensão e o efeito do agente de IA sobre o ambiente ainda precisam ser melhorados.

Portanto, seja um modelo de código aberto ou um modelo de código fechado, se você quiser comercializá-lo através da economia de API, as capacidades do modelo básico estarão diretamente relacionadas à qualidade do Agente de IA, e ainda há espaço para melhorias.

2. Conhecimento de dados.

Para ser um bom Agente de IA, coletar e usar dados é o pré-requisito básico. Para os desenvolvedores, a quantidade de dados necessária para tarefas digitais não é mais um problema, mas ao desenvolver agentes de IA no mundo físico, os custos de dados são muito elevados. Os dados de controle do robô geralmente só podem ser coletados por você mesmo, por meio de um simulador ou coleta de robôs físicos no local. Mas afinal, o simulador não é um ambiente real e o efeito do treinamento pode não ser bom.No entanto, comprar centenas de robôs e drones para realmente ir para a estrada e entrar nas fábricas para coletar dados requer muito investimento em termos de aquisição custos, restrições políticas, implementação real, etc. Dificuldades.

Neste ponto, grandes fabricantes de modelos com vantagens de dados, como as vantagens de direção autônoma do Google e do Baidu, e as vantagens de dados da Microsoft, Google, Sogou, Baidu e outras empresas de pesquisa, podem ser capazes de reduzir algumas barreiras para os desenvolvedores explorarem os agentes de IA. , e também criará barreiras para grandes modelos desses fornecedores.

  1. Suporte ao produto.

Deve-se admitir que as grandes oportunidades de aplicação de modelos representadas pelo AI Agent ainda estão em um estágio muito inicial, a tecnologia ainda não está totalmente madura e a exploração comercial acaba de dar um pequeno passo. Para desenvolvedores, provedores de serviços de software, etc., o que é mais crítico e mais cedo a considerar do que como implementar o Agente de IA no código é imaginar onde um Agente de IA deve ir:

Como deveria parecer? Qual o seu nome? Existe um gênero? Que tipo de personalidade você usa para falar com os usuários? Quais são os casos de uso? Que dificuldades específicas você encontrará? Como avaliar o sucesso de um Agente de IA?

Estas são mais "terras de ninguém" no nível do produto e no nível comercial. Para permitir que os desenvolvedores liberem sua imaginação e tentem criar agentes de IA em vários ambientes e tarefas, os grandes fabricantes de modelos precisam abrir seu próprio ecossistema de negócios e fornecer produtos mais ricos e soluções mais convenientes, funções para reduzir o risco de tentativa e erro para os desenvolvedores, aumentar a intensidade do acoplamento com usuários corporativos e gerar mais opções de negócios e casos de implementação.

Em suma, este campo ainda é muito novo e o AI Agent ainda não teve um impacto claro na grande indústria de modelos.No entanto, é certo que o AI Agent eliminará um grande número de interações complicadas entre humanos e sistemas de IA, e isso está acontecendo .

Mais agentes de IA estão sendo empurrados para comunidades e usuários. Eles aprendem, mudam e evoluem. Talvez dentro de alguns meses veremos a maturidade e a explosão dos Agentes de IA, o que inevitavelmente desencadeará outra remodelação no campo dos grandes modelos.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)