Nota do editor: A tecnologia de inteligência artificial está se desenvolvendo em ritmo acelerado e há muitas empresas iniciantes na área de inteligência artificial que se destacaram. Neste artigo, vamos dar uma olhada em quais startups promissoras de IA foram escolhidas por investidores como Sequoia Capital e Kleiner Perkins Caufield & Byers. Este artigo é uma compilação e espero que possa inspirar você.
Se você tiver apenas alguns minutos de sobra, aqui estão as startups mais interessantes sobre inteligência artificial que investidores, operadores e fundadores devem conhecer.
Melhorar a saúde humana. As startups estão usando tecnologia de inteligência artificial para melhorar os resultados médicos e projetar novos tratamentos. Por exemplo, a empresa Alife utiliza inteligência artificial para melhorar os tratamentos de fertilização in vitro e proporcionar aos pacientes melhores hipóteses de conceber. Com o tempo, a abordagem da empresa poderá alterar fundamentalmente a estrutura de custos da indústria. NewLimit é outra startup de saúde que utiliza a tecnologia de IA. A equipe da empresa está buscando melhores formas de tratar doenças persistentes que antes eram difíceis de tratar.
Deixe a inteligência artificial servir às empresas. A maioria dos produtos de IA generativa é para consumidores. Os usuários regulares da Internet agora podem brincar com modelos complexos e criar textos e imagens. Várias empresas promissoras estão a abordar as necessidades empresariais de forma mais direta, criando produtos que incorporam dados internos de acordo com as diretrizes empresariais. Glean, Lamini, Dust e Lance são representantes desta tendência.
Use IA para limitar a IA. A revolução da IA pode trazer muitas novas oportunidades, mas também trará muitas ameaças. Em particular, a IA generativa facilita a criação de mensagens escritas realistas, aumentando o número e a sofisticação dos esquemas de “spear phishing”, concebidos para obter informações pessoais dos destinatários. Empresas como a Abnormal Security são capazes de usar inteligência artificial para detectar mensagens maliciosas de IA para evitar tais ataques.
*As startups de IA estão espalhadas por todo o mundo. Embora os Estados Unidos sejam o lar de muitos gigantes da indústria, como OpenAI e Google, startups promissoras estão surgindo em todo o mundo. A Mistral está construindo um modelo de linguagem de código aberto em grande escala em sua sede em Paris, e um de seus fundadores acredita que eles rivalizarão com o OpenAI. A empresa alemã Sereact também desenvolveu impressionantes produtos robóticos de inteligência artificial e assinou contratos com gigantes industriais.
A inteligência artificial é o fio condutor da história da tecnologia deste ano. Desde a última série “O que observar em IA”, a área continuou a atrair capital, talento e atenção. É claro que nem toda atenção é positiva. Apesar do entusiasmo generalizado sobre as capacidades da tecnologia, ao longo dos últimos quatro meses, os pesos pesados da indústria expressaram as suas preocupações e os reguladores começaram a conceber algumas salvaguardas. Nos próximos meses e anos, a inteligência artificial terá um impacto abrangente nas nossas vidas e criará novos vencedores e perdedores em todo o mundo.
Nossa série "O que assistir" foi projetada para ajudar os leitores a se prepararem para os tempos futuros e a imaginarem o futuro com mais clareza. Este é um excelente ponto de partida para quem quer compreender as tecnologias emergentes na fronteira da inteligência artificial e tirar partido das mudanças que estão a ocorrer. Para isso, convidamos os mais impressionantes investidores e fundadores da área de inteligência artificial para apresentarem as startups que consideram mais promissoras.
1. Vida viva
Usando inteligência artificial para melhorar a tecnologia de fertilização in vitro
Em qualquer processo reprodutivo, há momentos que exigem a tomada de decisão humana, e os dois elos mais relevantes para a fertilização in vitro são a “estimulação ovariana” e a “seleção de embriões”.
"Estimulação ovariana" refere-se à determinação da dose de medicamento que uma paciente recebe para estimular o crescimento dos folículos nos ovários e quando administrar uma injeção desencadeadora para estimular os folículos a liberarem óvulos. O momento do disparo do gatilho é crucial; se for muito cedo, você poderá obter óvulos imaturos; se for tarde demais, você poderá obter óvulos muito maduros ou poderá não obter tantos óvulos quanto possível.
"Seleção de embriões" refere-se à escolha de qual óvulo fertilizado usar e implantar. Atualmente, os médicos e embriologistas, como a maioria dos profissionais médicos, baseiam as suas decisões numa combinação da sua própria experiência e formação, sistemas de classificação morfológica e tentativa e erro. Se a dose ou o horário não estiverem corretos em um ciclo, eles irão ajustá-los no próximo ciclo. Isto exige uma competência profissional muito elevada dos médicos e, neste momento, os médicos têm níveis variados de competências e as suas competências são muito importantes para os resultados. Para a fertilidade, um mercado com oferta severamente limitada, isso significa um preço elevado, especialmente se quiser obter resultados óptimos.
Alife está construindo ferramentas de inteligência artificial para melhorar os resultados da fertilização in vitro (FIV). A empresa usa ferramentas de inteligência artificial para fornecer aos profissionais “superpoderes” para melhorar a precisão da tomada de decisões, aproveitando enormes conjuntos de dados de entrada e resultados. Agora, através de uma interface simples, os médicos podem inserir as características de um paciente e receber recomendações precisas em momentos-chave da jornada de fertilidade, derivadas dos resultados de milhares de ciclos anteriores. Esses conjuntos de dados vêm de grandes quantidades de informações de pacientes já existentes e melhoram à medida que cada paciente usa os produtos Alife.
Estas ferramentas mudarão a natureza da indústria da fertilidade. A pesquisa da Alife mostra que seu modelo de aprendizado de máquina pode ajudar os médicos a otimizar 50% do tempo de ativação e ajudar a recuperar uma média de mais três óvulos maduros, dois óvulos fertilizados e mais um embrião. Os produtos da Alife podem ampliar significativamente o acesso aos tratamentos de infertilidade, reduzindo os custos por paciente, reduzindo a dosagem dos medicamentos necessários e aumentando a taxa de sucesso dos ciclos de fertilização in vitro. Também proporcionaria condições de concorrência niveladas para os médicos, dando àqueles que não têm experiência em primeira mão acesso a uma gama mais ampla de conhecimentos e informações.
Em última análise, você pode imaginar as ferramentas da Alife fornecendo todas as informações para momentos de julgamento em um processo e permitindo que outros profissionais além dos médicos operem, alterando significativamente a estrutura de custos e a disponibilidade do setor. Além do mais, a medicina de precisão baseada em dados, que aumenta (ou eventualmente substitui) o julgamento de uma pessoa com recomendações personalizadas, não é exclusiva do mundo da fertilização in vitro. Existem milhares de momentos como este na medicina, em que temos a oportunidade de utilizar dados para alterar drasticamente os resultados e o acesso a procedimentos e tratamentos críticos.
—Rebecca Kaden, sócia geral, Union Square Ventures
2. Recolher
Pesquisa empresarial
No trabalho, encontrar exatamente as informações que você precisa, quando precisa delas, deve ser rápido e fácil. Como todo mundo usa muitos aplicativos para realizar seu trabalho e, como resultado, gera muitos dados e documentos, nem sempre é esse o caso. À medida que o “conhecimento” cresce exponencialmente e a natureza do trabalho se torna cada vez mais distribuída, leva cada vez mais tempo para encontrar o conhecimento existente. Em outras palavras, é muito difícil “procurar coisas” no trabalho.
Para ajudar os empregadores a resolver esse problema, Arvind Jain e sua equipe criaram o Glean, uma plataforma unificada de pesquisa de locais de trabalho com tecnologia de IA. Ele equipa os funcionários com um assistente de trabalho intuitivo que os ajuda a encontrar exatamente o que precisam e a descobrir de forma proativa o que devem saber.
A missão da empresa tem sido simples desde o início: ajudar as pessoas a encontrar respostas para todas as suas questões no local de trabalho com mais rapidez, com menos frustração e perda de tempo. Mas os resultados da empresa posteriormente se expandiram muito além da pesquisa. Por exemplo, o Glean não apenas pesquisa todos os aplicativos e bases de conhecimento do local de trabalho (Slack, Teams, Google Drive, Figma, Dropbox, Coda, etc.), mas também entende a linguagem natural e o contexto, com base nas funções das pessoas e dentro/fora da empresa. Os relacionamentos personalizam as interações do usuário. Ele exibe de forma inteligente as informações mais populares e verificadas da sua empresa, ajudando você a descobrir o que sua equipe sabe e a manter a consistência, tudo de maneira autorizada.
À medida que as organizações se tornam mais distribuídas e o conhecimento se torna mais fragmentado, assistentes de trabalho intuitivos como o Glean não são mais uma ferramenta interessante, mas sim uma ferramenta crítica para melhorar a produtividade dos funcionários. O crescimento da empresa quebrará barreiras que impedem o progresso e criará uma experiência de trabalho mais positiva e produtiva.
Além disso, a tecnologia de pesquisa da Glean permite trazer IA generativa para o local de trabalho, ao mesmo tempo em que segue as permissões estritas e os requisitos de gerenciamento de dados da empresa. Hoje, um dos principais obstáculos que impedem as empresas de colocar aplicações de IA em produção é a sua incapacidade de implementar controlos de governação adequados. Ao inserir permissões de dados em tempo real no ambiente local de uma empresa, o Glean tornou-se a solução ideal para ajudar as empresas a resolver problemas de governança em escala e permitir que as empresas aproveitem com confiança seus dados internos para treinamento e inferência de modelos, aproveitando assim uma experiência de nível empresarial. Plataforma de dados de IA/O papel do armazenamento vetorial.
Com o tempo, acreditamos que cada empresa terá a sua própria versão de IA que compreende as nuances do negócio e dos seus funcionários. Acreditamos que Glean está aproveitando esta oportunidade.
—Josh Coyne, sócio, Kleiner Perkins
3. Lança
Armazenamento e gerenciamento de dados multimodais
Todos nós já jogamos Midjourney e a maioria de nós viu uma demonstração do GPT-4. Midjourney (texto para imagem) e GPT-4 (imagem para texto/código) ilustram as possibilidades quando os modelos se tornam multimodais, fazendo a ponte entre diferentes formas de mídia, como texto, imagens e áudio. Embora grande parte da atual mania da IA gire em torno de modelos baseados em texto, os modelos multimodais são essenciais para a construção de representações mais precisas do mundo.
À medida que embarcamos na próxima onda de aplicações de IA em indústrias como a robótica, a saúde, a indústria transformadora, o entretenimento e a publicidade, cada vez mais empresas se basearão em modelos multimodais. Empresas como Runway e Flair.ai são bons exemplos de líderes emergentes nas suas áreas que registaram uma enorme procura dos utilizadores pelos seus produtos, enquanto empresas existentes como a Google começaram a lançar capacidades multimodais semelhantes.
Contudo, a utilização de modelos multimodais representa um desafio: como armazenar e gerir os dados? Os formatos de armazenamento tradicionais, como o Parquet, não são otimizados para dados não estruturados; portanto, grandes equipes de modelos de linguagem apresentam desempenho lento ao carregar, analisar, avaliar e depurar dados. Além disso, fluxos de trabalho de modelos de linguagem grandes são mais propensos a erros sutis devido à falta de uma única fonte de verdade. Lance é a mais recente empresa a surgir para enfrentar esse desafio. Empresas como Midjourney e WeRide estão convertendo conjuntos de dados em escala de petabytes para o formato Lance, que fornece melhorias significativas de desempenho e custos incrementais de armazenamento muito mais baixos em comparação com formatos tradicionais, como Parquet e TFRecords.
A Lance não para no armazenamento, eles reconheceram a necessidade de reconstruir toda a sua pilha de gerenciamento de dados para se alinhar melhor com o mundo para o qual estamos caminhando, onde os dados multimodais e não estruturados se tornarão o ativo mais valioso de uma empresa. Seu primeiro produto de plataforma, LanceDB (atualmente em versão beta privada), oferece uma experiência integrada perfeita para desenvolvedores que desejam incorporar funcionalidade multimodal em seus aplicativos.
Lance é apenas um exemplo de como as empresas estão trazendo os desenvolvedores para um futuro multimodal, e estou muito entusiasmado em ver outras tecnologias surgirem para o avanço das aplicações multimodais. Com o desenvolvimento da inteligência artificial, não demorará muito para que tal futuro se torne realidade.
——Saar Gur, sócio geral, CRV
4. Segurança anormal
Contendo a onda de ataques cibernéticos aprimorados por IA
Sou um otimista descarado quando se trata de IA generativa, mas não sou ingênuo no assunto. Por exemplo, estou preocupado com a proliferação de ataques de “engenharia social”, como o spear phishing, que muitas vezes utiliza e-mail para extrair informações confidenciais. Desde que o ChatGPT se tornou popular no ano passado, a incidência de tais ataques aumentou dramaticamente.
No ano passado, o número de ataques por 1.000 pessoas saltou de menos de 500 para mais de 2.500, segundo a Abnormal Security. A sofisticação dos ataques também está a aumentar dramaticamente. Assim como qualquer aluno pode usar o ChatGPT para escrever uma redação perfeita, o ChatGPT também pode ser usado para enviar mensagens fraudulentas perigosamente personalizadas e gramaticalmente perfeitas.
De acordo com o FBI, esses ataques direcionados de “comprometimento de e-mail comercial” causaram mais de US$ 50 bilhões em perdas desde 2013. E vai piorar. Todos os dias, inúmeros cibercriminosos e outros agentes mal-intencionados exploram ferramentas de chapéu preto como o “WormGPT”, um chatbot projetado para extrair dados de malware, a fim de orquestrar as campanhas fraudulentas mais convincentes e em grande escala.
Felizmente, os cofundadores da Abnormal, Evan Reiser e Sanjay Jeyakumar, estão trabalhando duro para usar inteligência artificial para combater essa ameaça. Você pode pensar nisso como usar IA para combater a IA. Historicamente, os sistemas de segurança de e-mail verificavam assinaturas de mau comportamento conhecido, como endereços IP específicos ou tentativas de acesso a informações de identificação pessoal (PII).
Aproveitando o poder da inteligência artificial, Abnormal subverte tudo isso. Como muitos ataques parecem legítimos graças à inteligência artificial, a abordagem da Abnormal é compreender completamente o bom comportamento conhecido, para que até mesmo desvios sutis sejam percebidos. A empresa usa modelos de linguagem em larga escala para construir representações detalhadas de seu funcionamento digital interno e externo, como quem normalmente fala entre si e com qual conteúdo é provável que interajam. Se meu parceiro Reid Hoffman me enviasse um e-mail e dissesse: "Ei, por favor, envie-me as informações mais recentes sobre Inflection.AI", o mecanismo de IA do Abnormal descobriria rapidamente. , Reed raramente começa com "ei", raramente envia uma única frase, e ele nunca me pediu para lhe enviar um arquivo sobre o Inflection.AI. (Como cofundador e membro do conselho da empresa, ele teve mais acesso a esses documentos do que eu!).
Não é de surpreender que, à medida que as preocupações de segurança em torno da IA generativa continuam a crescer, a procura dos clientes empresariais da Abnormal tenha acelerado. Acho que o sucesso da Abnormal é muito gratificante porque foi capaz de aproveitar a IA muito rapidamente para resolver problemas que estão sendo acelerados pela IA. Em períodos de mudanças tecnológicas disruptivas, os maus atores muitas vezes desfrutam de vantagens prolongadas como pioneiros. Afinal, eles podem tirar proveito da inovação sem ter que se preocupar com a qualidade do produto, a segurança ou os reguladores que ainda não promulgaram novas leis.
Ao mesmo tempo, as startups tecnológicas estão compreensivelmente focadas no desenvolvimento de novos casos de utilização poderosos para as suas inovações, em vez de bloquear inovações ilegais ou disruptivas. Mas, como todas as questões relacionadas com a inteligência artificial, os danos cibernéticos que o uso indevido da inteligência artificial pode causar são impressionantes. Graças à visão da equipe Abnormal, o novo normal do crime cibernético pode pelo menos tornar-se menos provável de ocorrer.
—Sam Motamedi, sócio, Greylock
5. Poeira
Capacitar trabalhadores do conhecimento
É evidente que grandes modelos linguísticos melhorarão a eficiência dos trabalhadores do conhecimento. Mas não está claro exatamente como isso seria feito. Dust está tentando descobrir isso. Os gestores do conhecimento pouco ajudam na empresa se não conseguirem aceder aos dados internos. Assim, Dust construiu uma plataforma que indexa, incorpora e atualiza em tempo real os dados internos de uma empresa (Notion, Slack, Drive, GitHub) e os expõe a produtos alimentados por grandes modelos de linguagem.
Os cofundadores da Dust, Gabriel Hubert e Stanislas Polu, venderam uma empresa para a Stripe e trabalharam lá por cinco anos. Eles viram em primeira mão como as empresas em rápido crescimento lutam para ganhar escala. Eles viram em primeira mão o que é chamado de “dívida de informação” e agora estão focados na aplicação de grandes modelos de linguagem para resolver alguns dos principais problemas associados a ela. Atualmente, Dust está explorando os seguintes aplicativos em sua plataforma:
Mecanismo de resposta. A ênfase está na factualidade, pois esta é a chave para a adoção generalizada.
Gerar assistente. Fornece ajuda modelada ao criar conteúdo. Por exemplo, gere parágrafos faltantes com base em dados internos.
*Documentos atualizados automaticamente. Sempre que surge dentro da empresa alguma informação que deva atualizar o documento, o titular do documento recebe notificações e sugestões.
Extração de eventos estruturados. Os usuários podem gerar eventos estruturados a partir de dados não estruturados (como threads do Slack) com base em modelos predefinidos.
Monitoramento de dados internos. Monitore dados corporativos com regras inteligentes. Por exemplo, receba um alerta se informações de identificação pessoal (PII) aparecerem inadvertidamente onde não deveriam.
Embora seja muito conteúdo, os fundadores do Dust acreditam que a maioria desses fluxos de dados acabará convergindo para um produto unificado. Eles ainda estão nos estágios iniciais de exploração e formando uma imagem final do Pó. Com base nas iterações iniciais, eles acreditam ter confirmado a sua hipótese central: que as capacidades dos trabalhadores do conhecimento podem ser aumentadas (em vez de substituídas) por modelos de linguagem em larga escala, e que um novo “sistema operacional de equipe” pode ser construído sobre esse.
——Konstantine Buhler, sócio da Sequoia Capital
6. Caixa de etiqueta
Liberar dados comerciais
A “ascensão do big data” já dura há mais de 20 anos e, embora as empresas estejam continuamente a ingerir mais dados do que nunca, muitas empresas ainda lutam para utilizar esses dados para obter insights a partir de modelos de inteligência artificial. O processamento e a interpretação de dados continuam sendo as partes mais tediosas e caras do processo de IA, mas também as mais importantes para resultados de alta qualidade. Mesmo com o aumento de modelos de grandes linguagens pré-treinados, as empresas ainda precisarão se concentrar no uso de seus próprios dados proprietários (em múltiplas modalidades) para criar IA generativa posicionada de forma única para fornecer serviços e insights diferenciados e melhorar a eficiência operacional.
Labelbox resolve esse desafio simplificando a forma como as empresas alimentam conjuntos de dados em modelos de IA. Ele ajuda as equipes de dados e de aprendizado de máquina a encontrar os dados certos, processá-los e interpretá-los, enviar modelos para aplicativos e medir e melhorar continuamente o desempenho.
A nova plataforma da Labelbox aproveita a inteligência artificial generativa. O Model Foundry permite que as equipes experimentem rapidamente modelos básicos de IA de todos os principais fornecedores de código aberto e fechado, permitindo-lhes pré-rotular os dados e experimentar rapidamente com apenas alguns cliques. Dessa forma, eles podem entender qual modelo tem melhor desempenho em seus dados. O Model Foundry gera automaticamente métricas de desempenho detalhadas para cada experimento executado durante o versionamento dos resultados.
O impacto pode ser de longo alcance. Tradicionalmente, os humanos passam dias realizando uma tarefa simples, mas demorada, como classificar uma listagem de comércio eletrônico contendo vários parágrafos de texto. Com o GPT-4, esta tarefa pode ser concluída em horas. O Model Foundry permite que as empresas descubram essas formas eficientes por si mesmas.
Este não é o único exemplo. Os primeiros resultados mostram que mais de 88% das tarefas de etiquetagem podem ser aceleradas por um ou mais modelos básicos. O Labelbox permite que qualquer pessoa pré-etiquete os dados com apenas alguns cliques, sem a necessidade de codificação e inserção de dados em um modelo. Esta ferramenta foi projetada para capacitar as equipes a trabalhar de forma colaborativa e aproveitar o conhecimento multifuncional para manter a supervisão manual da garantia da qualidade dos dados. Esse recurso democratiza o acesso à inteligência artificial, permitindo que especialistas em modelos de linguagem e pequenas e médias empresas avaliem facilmente modelos, enriqueçam conjuntos de dados e colaborem para construir aplicativos inteligentes.
Está comprovado que o Labelbox reduz significativamente os custos e melhora a qualidade dos modelos para as maiores empresas do mundo, incluindo Walmart, Procter & Gamble, Genentech e Adobe.
É agora uma competição para as empresas libertarem o poder destes modelos subjacentes nos seus dados proprietários para resolverem problemas de negócio. Estamos ansiosos para ver como o Labelbox ajudará as empresas a desbloquear dados para fornecer produtos melhores com maior eficiência.
——Robert Kaplan, sócio, SoftBank
7. Pista
Nova suíte criativa
A inteligência artificial está em toda parte e se tornando cada vez mais uma mercadoria. Na maioria dos casos, as empresas utilizam IA como chatbots para enriquecer as aplicações existentes. Poucas aplicações de IA estão a reinventar as experiências dos produtos, utilizando a tecnologia para mudar fundamentalmente a forma como interagimos com os produtos, tal como o motor de pesquisa do Google mudou a forma como navegamos na Internet ou o Instagram mudou a forma como partilhamos fotos dos nossos telefones. Da mesma forma. Essas aplicações de IA exigem um conhecimento profundo da experiência do usuário existente, pensamento visionário sobre produtos e tecnologia de ponta.
A Runway é um exemplo importante de empresa que usa pesquisa aplicada de IA para reimaginar experiências criativas e construir um conjunto criativo totalmente novo.
Profundo entendimento da experiência do usuário. Fundadores Cristobal Valenzuela, Anastasis Germanidis e Alejandro Matamara-Ortiz Alejandro Matamala-Ortiz é pesquisador com especialização em telecomunicações interativas na Universidade de Nova York e tem muitos anos de experiência em design. A equipe da Runway entende o ecossistema de ferramentas criativas a partir da experiência direta e das barreiras à adoção em massa. Por exemplo, a produção cinematográfica criativa requer frequentemente maquinaria dispendiosa, recursos de software e elevados níveis de formação. Como resultado, a produção cinematográfica criativa tem sido historicamente concentrada em grandes estúdios. A Runway viu uma oportunidade de expandir e melhorar a acessibilidade das ferramentas criativas necessárias.
Pensamento de produto clarividente. A Runway reconheceu desde o início que um ponto de inflexão na inteligência artificial poderia melhorar drasticamente a experiência do usuário, não apenas aprimorando as ferramentas criativas existentes, mas também mudando fundamentalmente a forma como essas ferramentas funcionam. Por exemplo, os usuários podem criar conteúdo de vídeo totalmente novo do zero usando instruções de texto simples. É importante ressaltar que este vídeo é de nível profissional e pode ser compartilhado via desktop ou dispositivo móvel. Independentemente do nível de habilidade, experiência ou recursos, o Runway pode economizar horas ou dias de trabalho de edição. Este é um produto visionário que transforma lembretes simples em vida vívida e comovente.
Especialista líder em tecnologia de inteligência artificial. A Runway não apenas resolveu um problema com um produto visionário, mas também reinventou a infraestrutura subjacente de pesquisa e tecnologia. A organização interna de pesquisa da Runway está liderando o caminho em redes neurais profundas para síntese de imagens e vídeos. A empresa desenvolveu o Gen-2, um modelo de vídeo de inteligência artificial multimodal que é mais poderoso do que qualquer coisa atualmente no mercado. Este é o primeiro modelo público capaz de converter texto em vídeo. Antes disso, a Runway lançou o Gen-1, um modelo que leva a uma mudança de paradigma nas ferramentas de geração de vídeo que produz resultados de alta qualidade. Os pesquisadores da pista também foram pioneiros no modelo de texto para imagem Stable Diffusion.
Desde outubro de 2022, a Runway desenvolveu mais de 30 “ferramentas mágicas” de IA que abrangem vídeo, imagens, 3D e texto, atendendo a todos os aspectos do processo criativo, da pré-produção à pós-produção. Sua base de clientes inclui empresas Fortune 500 e Global 2000, como The Late Show with Stephen Colbert da CBS, New Balance, Harbour Picture Video, Publicis) e Google. A plataforma também tem sido usada para editar filmes indicados ao Oscar, como o sucesso de Hollywood Everything Everywhere All at Once.
Os aplicativos de IA mais interessantes transformam as experiências de produtos existentes e repensam a forma como os usuários interagem com os produtos. Com o Runway, os usuários podem concluir novas criações de vídeo em segundos, estejam eles gravando um vídeo pela primeira vez ou no estúdio profissionalmente. Esta é uma mudança revolucionária e um exemplo de como a inteligência artificial está a remodelar diferentes indústrias.
—Grace Isford, sócia da Lux Capital
8. Novo Limite
Remodelando o destino celular
As células são os sistemas de computador mais complexos da Terra. Assim como os chips de computador, o DNA é composto de unidades básicas que criam funções complexas. Ao contrário dos códigos baseados em bits, os códigos baseados em átomos são aleatórios e hierárquicos. Um sistema depende de outro, que por sua vez depende de outros sistemas físicos, cada um afetado pelo calor, pela acidez e pelas moléculas do microambiente da célula.
Apesar dessas interdependências, o código de máquina celular (DNA) pode executar diferentes programas com eficiência. Embora as células do fígado e da pele contenham o mesmo genoma, esses tipos de células têm aparência, sensação e função diferentes. Por que? Porque eles estão executando diferentes programas epigenéticos.
Em 2006, Takahashi et al., usaram uma combinação de quatro proteínas de fator de transcrição (TF) para reprogramar células maduras em células-tronco, sendo pioneiros no campo da reprogramação epigenética. Fatores de transcrição são proteínas que regulam genes, alterando essencialmente o “programa” em execução. A descoberta de Takahashi e Yamanaka levou à criação de células-tronco pluripotentes induzidas (iPSCs) e lhes rendeu o Prêmio Nobel. Desde então, muitos grupos de pesquisa começaram a aplicar combinações únicas de TF para alterar os estados celulares, rejuvenescer células danificadas e restaurar fenótipos celulares jovens.
Embora a reprogramação epigenética esteja se tornando mais tratável, ainda não é uma questão trivial. A equipe teve que discernir qual combinação de TFs era eficaz na transição das células do estado A para o estado B desejado. Por exemplo, futuras combinações de TF poderão permitir-nos converter células doentes em células saudáveis, desenvolvendo assim uma nova classe de medicamentos. Precisamos de telas de reprogramação em grande escala porque a combinação exata de TFs não é conhecida para muitas áreas de aplicação. Existem mais de 1.500 TFs humanos nativos, portanto é necessário um método de pesquisa mais eficiente. Acreditamos que a NewLimit está projetando tal abordagem.
Impulsionada por avanços em sequenciamento unicelular e tecnologias de aprendizado de máquina, a NewLimit está transformando uma disciplina anteriormente manual em ciência orientada por dados. A empresa possui uma divisão saudável de trabalho entre biólogos moleculares e biólogos computacionais, estabelecendo as bases culturais necessárias para construir uma plataforma de circuito fechado cada vez mais eficiente. Combinando experiência e leituras multimodais (scRNA-Seq, scATAC-Seq, etc.), o NewLimit visa descobrir remodeladores terapêuticos para tratar doenças anteriormente intratáveis.
Em cada rodada de experimentos, a NewLimit utiliza tecnologia de linguagem de máquina para:
Combine e comprima múltiplas leituras de detecção em um espaço de otimização de baixa dimensão contendo o estado atual A e o estado desejado B da célula.
Enumere novas combinações de TF ao longo do espaço de otimização que podem levar a unidade ao estado desejado.
Recomendar quais tipos de dados ajudarão a melhorar os modelos e quando/onde aplicar métodos experimentais mais caros e de menor rendimento.
Sugira mudanças que devem ser feitas na plataforma para maximizar as informações úteis geradas por cada dólar gasto.
Além de sua excelente equipe, habilidade técnica e visão ambiciosa, também admiramos o espírito pragmático da NewLimit. Embora a empresa não tenha partilhado publicamente detalhes da sua estratégia comercial inicial, acreditamos que esta abordagem é criativa, reduz razoavelmente o risco e tem o potencial de ser transformadora para a humanidade. A equipa fundadora concorda que as plataformas biotecnológicas podem ser comparadas a projetos científicos dispendiosos sem gerar ativos a curto prazo. Para tal, a NewLimit tem sido transparente e catalogou o seu progresso tecnológico desde a sua criação.
Deveríamos nos sentir humilhados pela complexidade da natureza. Na verdade, a biologia é mais difícil de programar do que os dispositivos de silício que nós mesmos projetamos. O objetivo da Dimension é capacitar empreendedores pioneiros como a NewLimit para explorar os limites das possibilidades na interface da tecnologia e da biologia.
—Simon Barnett, Diretor de Pesquisa, Dimension
9. À beira da piscina
Inteligência Artificial Básica para Desenvolvimento de Software
OpenAI concentra-se na inteligência artificial geral, DeepMind concentra-se na descoberta científica e o terceiro caso de uso fundamental da inteligência artificial é a compreensão e criação de software.
O GPT-4 está enraizado nos fluxos de trabalho de desenvolvedores experientes e novatos. Mas esta mudança de paradigma ainda está na sua infância. Extrapolando os últimos meses, a programação assistida por IA em breve se tornará onipresente. À medida que esta tendência se desenvolve, a linguagem natural se tornará a base abstrata sobre a qual o software é construído.
Embora outras empresas tenham lançado modelos de código puro em larga escala, como o StarCoder, nenhum método chegou perto do desempenho do GPT-4. Acho que isso ocorre porque um modelo treinado apenas em código não pode produzir fortes capacidades de desenvolvimento de software. Foi assim que conheci o Poolside. A empresa foi fundada por Jason Warner, ex-diretor de tecnologia do GitHub, e Eiso Kant, ex-fundador da source{d}, a primeira empresa de inteligência artificial de código de pesquisa do mundo.
Poolside é o único que adota a abordagem do modelo básico OpenAI, mas se concentra em apenas uma função: geração de código. A sua estratégia tecnológica depende do facto de o código poder ser executado, permitindo feedback imediato e automático durante o processo de aprendizagem. Isso permite o aprendizado por reforço por meio da execução de código, uma alternativa atraente ao aprendizado por reforço baseado em feedback humano (RLHF). Isso é algo que a Esso começou a explorar já em 2017.
Embora o potencial da inteligência artificial geral (AGI) para beneficiar a humanidade seja inegável, a sua realização ainda está longe. Então, por que esperar pela AGI? Ao concentrarmo-nos em áreas específicas do avanço da IA, como o desenvolvimento de software, podemos desmantelar mais barreiras à criatividade. Estou ansioso pelo dia em que a equipe Poolside concretizará sua visão de construir um modelo de infraestrutura de software dedicado.
——Matan Grinberg, cofundador e CEO da Factory
10. Mistral
Concorrentes da OpenAI na França
Recentemente, Paris foi iluminada por uma explosão de projetos no campo da inteligência artificial generativa. Talvez você pergunte por quê? Minha opinião é que Paris tem o maior conjunto de talentos de classe mundial em IA generativa que está fora do horizonte de eventos da OpenAI. Destes projetos, o mais ousado é sem dúvida o Mistral. A Mistral foi fundada por Guillaume Lample, Arthur Mensch e Timothe Lacroix com a missão de construir os melhores modelos de linguagem de código aberto. O objetivo é construir um ecossistema próspero em torno desses modelos.
Conheço Guillaume há quatro anos e ambos estivemos profundamente envolvidos na aplicação de grandes modelos de linguagem a áreas da matemática, especialmente à matemática formal. Enquanto trabalhamos na OpenAI e na Meta, desenvolvemos um relacionamento competitivo amigável. Guillaume é um dos pesquisadores mais talentosos com quem já tive o prazer de trabalhar e tive o privilégio de vê-lo passar da pesquisa na Meta à fundação da Mistral. No processo, também conheci Arthur Mensch. Sempre fiquei impressionado com seu trabalho, especialmente Chinchilla, que redefiniu o que significa treinar com eficiência grandes modelos de linguagem, e RETRO, uma abordagem para modelagem de linguagem com recuperação aprimorada que, eu diria, ainda não foi totalmente explorada.
Agora, vamos descobrir o que torna o Mistral Mistral. A visão da startup é construir um ecossistema baseado no melhor modelo de código aberto da categoria. Este ecossistema servirá como plataforma de lançamento para projetos, equipes e empresas, acelerando o ritmo de inovação e uso criativo de grandes modelos de linguagem.
Tomemos como exemplo a aprendizagem por reforço baseada em feedback humano (RLHF). Normalmente, a realização de RLHF é demorada e, portanto, dispendiosa. Envolve “sinalização” manual de ações de IA, o que pode exigir muito trabalho. O esforço só valerá a pena se a promessa de um modelo de IA for suficientemente boa. Para uma grande empresa como a OpenAI, investir neste processo faz sentido e a empresa tem os recursos para que isso aconteça. Mas as comunidades tradicionais de código aberto geralmente precisam de um “líder” para dar um passo à frente e assumir esta importante responsabilidade.
A Mistral tem a oportunidade de fazer exatamente isso, investindo em um modelo de código aberto para RLHF. Ao fazê-lo, Mistral abrirá a porta a uma explosão cambriana de inovação. Os desenvolvedores de código aberto terão acesso a modelos claramente identificados que podem adaptar e personalizar para diferentes necessidades. O vencedor final será o mercado mais amplo e teremos acesso a casos de uso mais específicos e atraentes do que uma empresa fechada poderia produzir sozinha.
Quem tiver o melhor modelo de código aberto atrairá mais interesse e valor. Estou otimista em relação ao Mistral porque a equipe está ativamente ampliando a fronteira de eficiência/desempenho. Ao mesmo tempo, o talento da Mistral nesta área é de longe o melhor do mundo.
Mistral garantiu a equipe e os recursos para executar esta visão inicial. A empresa também encontrou parceiros para avaliar esses modelos em casos de uso de nível empresarial. Fique de olho no Mistral, eles estão prontos para enfrentar o OpenAI.
——Stanislas Polu, cofundador da Dust
11. Sereagir
Robôs Industriais Mais Inteligentes
Frequentemente ouvimos previsões de que, a longo prazo, a inteligência artificial e a robótica aumentarão ou automatizarão as tarefas humanas. Hoje, isso se tornou cada vez mais um imperativo comercial urgente.
Até 2030, a população em idade ativa da Europa deverá diminuir em 13,5 milhões e os custos laborais estão a aumentar ao ritmo mais rápido em mais de 20 anos. Com a ascensão do comércio eletrónico, os armazéns estão sob mais pressão do que nunca e torna-se cada vez mais difícil para as empresas permanecerem competitivas.
55% das despesas operacionais do armazém provêm da recolha de encomendas, mas a situação não é optimista para as empresas que procuram migrar para sistemas automatizados. Nenhum dos aplicativos chamativos com os quais estamos familiarizados em SaaS (software como serviço) liderado por IA, ou a infinidade de produtos de código aberto que vemos em outras partes do ecossistema, ainda não foram aplicados à robótica.
Em vez disso, as empresas que procuram automatizar a recolha e embalagem enfrentam a escolha de soluções robóticas dispendiosas e inflexíveis. Eles devem navegar por uma série de interfaces proprietárias que exigem conhecimento e tempo de programação significativos. Esses sistemas também enfrentam dificuldades para lidar com mudanças na mistura de produtos, exigem intervenção humana regular e apresentam desempenho insatisfatório ao lidar com situações extremas.
Secret resolve esses problemas. Seu software é baseado em poderosos ambientes simulados, treinando braços robóticos para compreender as nuances espaciais e físicas de qualquer ambiente potencial do mundo real. Uma vez implantado, o sistema será otimizado aprendendo continuamente com dados do mundo real. Isso também significa que eles podem lidar com o desafio de pegar itens tradicionalmente difíceis, como eletrônicos, têxteis, frutas, azulejos e madeira.
O mais interessante é que sua pilha de robótica usa grandes modelos de linguagem para permitir o controle intuitivo da linguagem natural dos robôs. Eles desenvolveram um modelo de conversor chamado “PickGPT” que permite aos usuários dar instruções e feedback ao robô por voz ou texto. Dessa forma, qualquer pessoa pode solicitar ao robô a execução de uma tarefa desejada, independente do seu nível de conhecimento técnico.
A Secret combina as duas áreas de atuação de seus cofundadores. O CEO Ralf Gulde trabalhou na interseção entre inteligência artificial e robótica, enquanto o CTO Marc Tusher é especializado em aprendizagem profunda. A dupla conduziu pesquisas revisadas por pares sobre esses assuntos na Universidade de Stuttgart, uma das universidades mais prestigiadas da Alemanha em automação e fabricação industrial.
Apesar de ser uma empresa jovem, a Sereact já atraiu uma lista impressionante de parceiros, incluindo Daimler Truck, Schmalz, Zenfulfillment, Zimmer Group) e Material Bank. Isto indica que existe uma enorme oportunidade de mercado potencial na indústria de separação e embalagem.
Além dos casos de uso óbvios em armazéns de comércio eletrônico, seja na separação de pedidos ou na desembalagem de caixas, há uma série de outros casos de uso. Por exemplo, na fabricação tradicional, existe um processo demorado chamado montagem, que envolve a coleta laboriosa das peças delicadas necessárias para a montagem. Os braços robóticos têm historicamente lutado para agarrar peças pequenas e separar peças individuais em ambientes desordenados. O software da Sereact pode identificar essas peças e selecionar a pinça correta para selecioná-las.
A equipe da Sereact não é apenas altamente qualificada, mas também possui um profundo conhecimento do ambiente de trabalho do cliente e um desejo genuíno de ajudar os clientes a superar a escassez de mão de obra e alcançar operações eficientes e sustentáveis. Como a primeira empresa a migrar a combinação de grandes modelos de linguagem e embalagens de captação da possibilidade acadêmica para o impacto no mundo real, tenho plena confiança em sua capacidade de executar e escalar um verdadeiro desafio à robótica.
—Nathan Benaich, sócio geral da Air Street Capital
12. Lamini
Mecanismo de modelo de linguagem em grande escala feito sob medida
Agora, todas as empresas estão tentando integrar a inteligência artificial aos negócios da empresa. As maiores empresas do mundo reconhecem o potencial da inteligência artificial, com 20% dos CEO do S&P 500 a mencionarem a IA durante as suas teleconferências de resultados do primeiro trimestre. Grandes modelos de linguagem podem melhorar significativamente a eficiência dos negócios, acelerando funções essenciais, como suporte ao cliente, vendas externas e codificação. Grandes modelos de linguagem também podem melhorar as experiências principais dos produtos, respondendo às perguntas dos clientes com assistentes baseados em IA ou criando novos fluxos de trabalho generativos de IA para encantar os clientes.
Dado que as grandes empresas tendem a ser lentas na adoção de novas tecnologias, ficámos surpreendidos com a rapidez com que as empresas começaram a construir com IA. Não é de surpreender que muitas empresas queiram construir internamente seus próprios modelos e soluções de IA. Cada empresa possui um acervo proprietário de dados de clientes, muitas vezes como parte de seu negócio principal. Essas empresas veem riscos ao enviar seus dados mais valiosos para APIs de modelos subjacentes ou startups cuja confiabilidade é incerta. Mesmo independentemente das questões de privacidade de dados, os modelos de linguagem pública de grande escala, como GPT-4 ou Claude, são inteiramente treinados em dados abertos e, portanto, carecem de capacidades de personalização para casos de uso e segmentos de clientes específicos da empresa.
Algumas empresas de tecnologia, como Shopify e Canva, formaram "AI Tiger Teams" internas para usar modelos de código aberto prontos para integrar inteligência artificial em todas as partes do negócio. No entanto, a maioria das empresas não tem recursos ou investigadores experientes em IA para construir e implementar modelos de linguagem proprietários em grande escala com base nos seus próprios dados. Eles percebem que esta onda de IA pode ser um momento de transformação para o futuro dos seus negócios, mas até agora não foram capazes de alavancar ou controlar o seu próprio desenvolvimento de IA.
É por isso que estamos tão entusiasmados com o que Sharon Zhou, Greg Diamos e sua equipe estão fazendo na Lamini. Lamini é um mecanismo de modelo de linguagem em grande escala que facilita aos desenvolvedores treinar, ajustar, implantar e melhorar rapidamente seus próprios modelos com feedback humano. Esta ferramenta proporciona uma experiência de desenvolvimento agradável que abstrai as complexidades dos modelos de IA e, mais importante ainda, permite que as empresas criem soluções de IA com base nos seus próprios dados, sem terem de contratar investigadores de IA ou correrem o risco de fuga de dados. Trabalhamos com Sharon e Greg pela primeira vez no outono passado. Desde então, tivemos a oportunidade de apoiar esta equipa fundadora tecnicamente proficiente e focada no cliente à medida que concretizam a sua visão ambiciosa de transformar a forma como as empresas adotam a IA.
Especificamente, a implantação de modelos privados de grandes linguagens com o Lamini oferece uma ampla gama de vantagens em comparação ao uso de soluções públicas. Ter uma equipe interna de engenharia cuidando do processo de construção garante a privacidade dos dados e permite maior flexibilidade na seleção do modelo e em toda a pilha de computação e dados. Os modelos feitos com Lamini também reduzem artefatos, reduzem a latência, garantem tempos de execução confiáveis e custos mais baixos em comparação com APIs disponíveis no mercado. Essas melhorias de desempenho vêm de insights técnicos básicos que a equipe Lamini incorpora ao produto com base em décadas de pesquisa e experiência no setor em torno de modelos de IA e otimização de GPU.
Startups e grandes empresas conhecidas já estão usando o Lamini para implantar grandes modelos de linguagem internamente e com clientes, e estão entusiasmados com a velocidade de configuração, desempenho e confiabilidade. No futuro, acreditamos que todas as empresas utilizarão IA nos seus negócios e produtos, mas apenas algumas empresas terão equipas dedicadas à IA. Lamini é uma startup que está nivelando o campo de atuação e dando a todas as empresas a oportunidade de aproveitar as vantagens desta tecnologia transformadora. Graças à sua recente parceria com a Databricks, agora é mais fácil do que nunca para as empresas colocarem suas soluções de IA em funcionamento, configurando o Lamini diretamente nos data lakes e clusters de computação existentes da Databricks.
——James Wu, investidor da First Round Capital; Todd Jackson, sócio da First Round Capital
13. Fábrica
Seu “robô” de codificação
Hoje, se você quiser que um computador faça algo por você, você terá que traduzir seus pensamentos para uma “linguagem de computador”, um código de hipertexto que um compilador possa entender. Para se tornar um engenheiro, você precisa torcer seu cérebro como uma máquina. No entanto, estamos chegando a um ponto crítico em que a IA pode transformar a linguagem humana em código. A transição de engenheiros humanos para engenheiros digitais provavelmente se tornará um dos pontos de inflexão tecnológica mais importantes em nossas vidas.
Ainda estamos nos estágios iniciais dessa transformação. Ferramentas de inteligência artificial como BabyAGI e AutoGPT capturaram a imaginação do público. Mas embora assistentes de codificação como o Github Copilot representem uma melhoria, eles ainda são muito limitados, servindo principalmente como preenchimento automático para ideias já implementadas no código.
A fábrica é diferente. A empresa foi fundada em 2023 pelo ex-teórico de cordas Matan Grinberg e pelo engenheiro de aprendizado de máquina Eno Reyes. Quando conheci Mattan, fui imediatamente atraído por sua visão: um futuro onde os engenheiros possam tornar a construção divertida, delegando tarefas chatas e concentrando-se em problemas difíceis. Para fazer isso, Matan e Eno criaram “robôs” de codificação autônomos.
Os bots são engenheiros de inteligência artificial que lidam com tarefas diárias, como revisão de código, depuração e refatoração. Ao contrário dos produtos existentes, os bots do Factory não exigem que você faça nada; eles podem revisar códigos de forma independente, lidar com erros e responder perguntas. Você também pode usar bots como desenvolvedores juniores, usando-os para debater e compartilhar trabalhos de recursos. Os robôs possuem mecanismos de proteção poderosos e sua inteligência é direcionada às necessidades dos usuários, dificultando que eles “alucinem” respostas erradas.
A geração de código será uma das áreas mais transformadoras da revolução da IA, e a Factory possui todas as ferramentas necessárias para ter sucesso.
*Equipe. Mattan, o CEO da Factory, é um teórico de cordas na Universidade de Princeton, onde imaginou singularidades de buracos negros. Eno trabalhou como engenheiro de aprendizado de máquina na Hugging Face e cuidou pessoalmente do tedioso processo de engenharia. Esta é uma equipe única.
Praticidade. Embora os robôs ainda não consigam executar tarefas tão bem quanto os engenheiros humanos, eles ainda podem realizar tarefas que os engenheiros odeiam. Os engenheiros podem deixar o trabalho chato e repetitivo para a fábrica.
velocidade. A Factory realizou algo notável em apenas alguns meses. Enquanto outros ainda imaginavam engenheiros de inteligência artificial, Matan e Eno já os desenvolviam. Eles estão melhorando rapidamente este produto já excelente.
A história do desenvolvimento humano é a de descarregar tarefas repetitivas, permitindo-nos passar para tarefas mais complexas. Quando os humanos inventaram a agricultura, essencialmente libertaram a nossa capacidade de construir cidades. Após a Revolução Industrial, construímos foguetes que levaram humanos à Lua. A próxima geração tem a missão de libertar os humanos do trabalho penoso online e avançar ainda mais a fronteira tecnológica.
Quando o único limite é a imaginação humana, o que construiremos a seguir?
— Markie Wagner, fundador e CEO da Delphi Labs
Tradutor: Jane
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Setor de IA: destaques tecnológicos recentes e oportunidades de investimento
Fonte: 36Kr God Translation Bureau
Nota do editor: A tecnologia de inteligência artificial está se desenvolvendo em ritmo acelerado e há muitas empresas iniciantes na área de inteligência artificial que se destacaram. Neste artigo, vamos dar uma olhada em quais startups promissoras de IA foram escolhidas por investidores como Sequoia Capital e Kleiner Perkins Caufield & Byers. Este artigo é uma compilação e espero que possa inspirar você.
Se você tiver apenas alguns minutos de sobra, aqui estão as startups mais interessantes sobre inteligência artificial que investidores, operadores e fundadores devem conhecer.
A inteligência artificial é o fio condutor da história da tecnologia deste ano. Desde a última série “O que observar em IA”, a área continuou a atrair capital, talento e atenção. É claro que nem toda atenção é positiva. Apesar do entusiasmo generalizado sobre as capacidades da tecnologia, ao longo dos últimos quatro meses, os pesos pesados da indústria expressaram as suas preocupações e os reguladores começaram a conceber algumas salvaguardas. Nos próximos meses e anos, a inteligência artificial terá um impacto abrangente nas nossas vidas e criará novos vencedores e perdedores em todo o mundo.
Nossa série "O que assistir" foi projetada para ajudar os leitores a se prepararem para os tempos futuros e a imaginarem o futuro com mais clareza. Este é um excelente ponto de partida para quem quer compreender as tecnologias emergentes na fronteira da inteligência artificial e tirar partido das mudanças que estão a ocorrer. Para isso, convidamos os mais impressionantes investidores e fundadores da área de inteligência artificial para apresentarem as startups que consideram mais promissoras.
1. Vida viva
Usando inteligência artificial para melhorar a tecnologia de fertilização in vitro
Em qualquer processo reprodutivo, há momentos que exigem a tomada de decisão humana, e os dois elos mais relevantes para a fertilização in vitro são a “estimulação ovariana” e a “seleção de embriões”.
"Estimulação ovariana" refere-se à determinação da dose de medicamento que uma paciente recebe para estimular o crescimento dos folículos nos ovários e quando administrar uma injeção desencadeadora para estimular os folículos a liberarem óvulos. O momento do disparo do gatilho é crucial; se for muito cedo, você poderá obter óvulos imaturos; se for tarde demais, você poderá obter óvulos muito maduros ou poderá não obter tantos óvulos quanto possível.
"Seleção de embriões" refere-se à escolha de qual óvulo fertilizado usar e implantar. Atualmente, os médicos e embriologistas, como a maioria dos profissionais médicos, baseiam as suas decisões numa combinação da sua própria experiência e formação, sistemas de classificação morfológica e tentativa e erro. Se a dose ou o horário não estiverem corretos em um ciclo, eles irão ajustá-los no próximo ciclo. Isto exige uma competência profissional muito elevada dos médicos e, neste momento, os médicos têm níveis variados de competências e as suas competências são muito importantes para os resultados. Para a fertilidade, um mercado com oferta severamente limitada, isso significa um preço elevado, especialmente se quiser obter resultados óptimos.
Alife está construindo ferramentas de inteligência artificial para melhorar os resultados da fertilização in vitro (FIV). A empresa usa ferramentas de inteligência artificial para fornecer aos profissionais “superpoderes” para melhorar a precisão da tomada de decisões, aproveitando enormes conjuntos de dados de entrada e resultados. Agora, através de uma interface simples, os médicos podem inserir as características de um paciente e receber recomendações precisas em momentos-chave da jornada de fertilidade, derivadas dos resultados de milhares de ciclos anteriores. Esses conjuntos de dados vêm de grandes quantidades de informações de pacientes já existentes e melhoram à medida que cada paciente usa os produtos Alife.
Estas ferramentas mudarão a natureza da indústria da fertilidade. A pesquisa da Alife mostra que seu modelo de aprendizado de máquina pode ajudar os médicos a otimizar 50% do tempo de ativação e ajudar a recuperar uma média de mais três óvulos maduros, dois óvulos fertilizados e mais um embrião. Os produtos da Alife podem ampliar significativamente o acesso aos tratamentos de infertilidade, reduzindo os custos por paciente, reduzindo a dosagem dos medicamentos necessários e aumentando a taxa de sucesso dos ciclos de fertilização in vitro. Também proporcionaria condições de concorrência niveladas para os médicos, dando àqueles que não têm experiência em primeira mão acesso a uma gama mais ampla de conhecimentos e informações.
Em última análise, você pode imaginar as ferramentas da Alife fornecendo todas as informações para momentos de julgamento em um processo e permitindo que outros profissionais além dos médicos operem, alterando significativamente a estrutura de custos e a disponibilidade do setor. Além do mais, a medicina de precisão baseada em dados, que aumenta (ou eventualmente substitui) o julgamento de uma pessoa com recomendações personalizadas, não é exclusiva do mundo da fertilização in vitro. Existem milhares de momentos como este na medicina, em que temos a oportunidade de utilizar dados para alterar drasticamente os resultados e o acesso a procedimentos e tratamentos críticos.
—Rebecca Kaden, sócia geral, Union Square Ventures
2. Recolher
Pesquisa empresarial
No trabalho, encontrar exatamente as informações que você precisa, quando precisa delas, deve ser rápido e fácil. Como todo mundo usa muitos aplicativos para realizar seu trabalho e, como resultado, gera muitos dados e documentos, nem sempre é esse o caso. À medida que o “conhecimento” cresce exponencialmente e a natureza do trabalho se torna cada vez mais distribuída, leva cada vez mais tempo para encontrar o conhecimento existente. Em outras palavras, é muito difícil “procurar coisas” no trabalho.
Para ajudar os empregadores a resolver esse problema, Arvind Jain e sua equipe criaram o Glean, uma plataforma unificada de pesquisa de locais de trabalho com tecnologia de IA. Ele equipa os funcionários com um assistente de trabalho intuitivo que os ajuda a encontrar exatamente o que precisam e a descobrir de forma proativa o que devem saber.
A missão da empresa tem sido simples desde o início: ajudar as pessoas a encontrar respostas para todas as suas questões no local de trabalho com mais rapidez, com menos frustração e perda de tempo. Mas os resultados da empresa posteriormente se expandiram muito além da pesquisa. Por exemplo, o Glean não apenas pesquisa todos os aplicativos e bases de conhecimento do local de trabalho (Slack, Teams, Google Drive, Figma, Dropbox, Coda, etc.), mas também entende a linguagem natural e o contexto, com base nas funções das pessoas e dentro/fora da empresa. Os relacionamentos personalizam as interações do usuário. Ele exibe de forma inteligente as informações mais populares e verificadas da sua empresa, ajudando você a descobrir o que sua equipe sabe e a manter a consistência, tudo de maneira autorizada.
À medida que as organizações se tornam mais distribuídas e o conhecimento se torna mais fragmentado, assistentes de trabalho intuitivos como o Glean não são mais uma ferramenta interessante, mas sim uma ferramenta crítica para melhorar a produtividade dos funcionários. O crescimento da empresa quebrará barreiras que impedem o progresso e criará uma experiência de trabalho mais positiva e produtiva.
Além disso, a tecnologia de pesquisa da Glean permite trazer IA generativa para o local de trabalho, ao mesmo tempo em que segue as permissões estritas e os requisitos de gerenciamento de dados da empresa. Hoje, um dos principais obstáculos que impedem as empresas de colocar aplicações de IA em produção é a sua incapacidade de implementar controlos de governação adequados. Ao inserir permissões de dados em tempo real no ambiente local de uma empresa, o Glean tornou-se a solução ideal para ajudar as empresas a resolver problemas de governança em escala e permitir que as empresas aproveitem com confiança seus dados internos para treinamento e inferência de modelos, aproveitando assim uma experiência de nível empresarial. Plataforma de dados de IA/O papel do armazenamento vetorial.
3. Lança
Armazenamento e gerenciamento de dados multimodais
Todos nós já jogamos Midjourney e a maioria de nós viu uma demonstração do GPT-4. Midjourney (texto para imagem) e GPT-4 (imagem para texto/código) ilustram as possibilidades quando os modelos se tornam multimodais, fazendo a ponte entre diferentes formas de mídia, como texto, imagens e áudio. Embora grande parte da atual mania da IA gire em torno de modelos baseados em texto, os modelos multimodais são essenciais para a construção de representações mais precisas do mundo.
À medida que embarcamos na próxima onda de aplicações de IA em indústrias como a robótica, a saúde, a indústria transformadora, o entretenimento e a publicidade, cada vez mais empresas se basearão em modelos multimodais. Empresas como Runway e Flair.ai são bons exemplos de líderes emergentes nas suas áreas que registaram uma enorme procura dos utilizadores pelos seus produtos, enquanto empresas existentes como a Google começaram a lançar capacidades multimodais semelhantes.
Contudo, a utilização de modelos multimodais representa um desafio: como armazenar e gerir os dados? Os formatos de armazenamento tradicionais, como o Parquet, não são otimizados para dados não estruturados; portanto, grandes equipes de modelos de linguagem apresentam desempenho lento ao carregar, analisar, avaliar e depurar dados. Além disso, fluxos de trabalho de modelos de linguagem grandes são mais propensos a erros sutis devido à falta de uma única fonte de verdade. Lance é a mais recente empresa a surgir para enfrentar esse desafio. Empresas como Midjourney e WeRide estão convertendo conjuntos de dados em escala de petabytes para o formato Lance, que fornece melhorias significativas de desempenho e custos incrementais de armazenamento muito mais baixos em comparação com formatos tradicionais, como Parquet e TFRecords.
A Lance não para no armazenamento, eles reconheceram a necessidade de reconstruir toda a sua pilha de gerenciamento de dados para se alinhar melhor com o mundo para o qual estamos caminhando, onde os dados multimodais e não estruturados se tornarão o ativo mais valioso de uma empresa. Seu primeiro produto de plataforma, LanceDB (atualmente em versão beta privada), oferece uma experiência integrada perfeita para desenvolvedores que desejam incorporar funcionalidade multimodal em seus aplicativos.
4. Segurança anormal
Contendo a onda de ataques cibernéticos aprimorados por IA
Sou um otimista descarado quando se trata de IA generativa, mas não sou ingênuo no assunto. Por exemplo, estou preocupado com a proliferação de ataques de “engenharia social”, como o spear phishing, que muitas vezes utiliza e-mail para extrair informações confidenciais. Desde que o ChatGPT se tornou popular no ano passado, a incidência de tais ataques aumentou dramaticamente.
No ano passado, o número de ataques por 1.000 pessoas saltou de menos de 500 para mais de 2.500, segundo a Abnormal Security. A sofisticação dos ataques também está a aumentar dramaticamente. Assim como qualquer aluno pode usar o ChatGPT para escrever uma redação perfeita, o ChatGPT também pode ser usado para enviar mensagens fraudulentas perigosamente personalizadas e gramaticalmente perfeitas.
De acordo com o FBI, esses ataques direcionados de “comprometimento de e-mail comercial” causaram mais de US$ 50 bilhões em perdas desde 2013. E vai piorar. Todos os dias, inúmeros cibercriminosos e outros agentes mal-intencionados exploram ferramentas de chapéu preto como o “WormGPT”, um chatbot projetado para extrair dados de malware, a fim de orquestrar as campanhas fraudulentas mais convincentes e em grande escala.
Felizmente, os cofundadores da Abnormal, Evan Reiser e Sanjay Jeyakumar, estão trabalhando duro para usar inteligência artificial para combater essa ameaça. Você pode pensar nisso como usar IA para combater a IA. Historicamente, os sistemas de segurança de e-mail verificavam assinaturas de mau comportamento conhecido, como endereços IP específicos ou tentativas de acesso a informações de identificação pessoal (PII).
Aproveitando o poder da inteligência artificial, Abnormal subverte tudo isso. Como muitos ataques parecem legítimos graças à inteligência artificial, a abordagem da Abnormal é compreender completamente o bom comportamento conhecido, para que até mesmo desvios sutis sejam percebidos. A empresa usa modelos de linguagem em larga escala para construir representações detalhadas de seu funcionamento digital interno e externo, como quem normalmente fala entre si e com qual conteúdo é provável que interajam. Se meu parceiro Reid Hoffman me enviasse um e-mail e dissesse: "Ei, por favor, envie-me as informações mais recentes sobre Inflection.AI", o mecanismo de IA do Abnormal descobriria rapidamente. , Reed raramente começa com "ei", raramente envia uma única frase, e ele nunca me pediu para lhe enviar um arquivo sobre o Inflection.AI. (Como cofundador e membro do conselho da empresa, ele teve mais acesso a esses documentos do que eu!).
Não é de surpreender que, à medida que as preocupações de segurança em torno da IA generativa continuam a crescer, a procura dos clientes empresariais da Abnormal tenha acelerado. Acho que o sucesso da Abnormal é muito gratificante porque foi capaz de aproveitar a IA muito rapidamente para resolver problemas que estão sendo acelerados pela IA. Em períodos de mudanças tecnológicas disruptivas, os maus atores muitas vezes desfrutam de vantagens prolongadas como pioneiros. Afinal, eles podem tirar proveito da inovação sem ter que se preocupar com a qualidade do produto, a segurança ou os reguladores que ainda não promulgaram novas leis.
5. Poeira
Capacitar trabalhadores do conhecimento
É evidente que grandes modelos linguísticos melhorarão a eficiência dos trabalhadores do conhecimento. Mas não está claro exatamente como isso seria feito. Dust está tentando descobrir isso. Os gestores do conhecimento pouco ajudam na empresa se não conseguirem aceder aos dados internos. Assim, Dust construiu uma plataforma que indexa, incorpora e atualiza em tempo real os dados internos de uma empresa (Notion, Slack, Drive, GitHub) e os expõe a produtos alimentados por grandes modelos de linguagem.
Os cofundadores da Dust, Gabriel Hubert e Stanislas Polu, venderam uma empresa para a Stripe e trabalharam lá por cinco anos. Eles viram em primeira mão como as empresas em rápido crescimento lutam para ganhar escala. Eles viram em primeira mão o que é chamado de “dívida de informação” e agora estão focados na aplicação de grandes modelos de linguagem para resolver alguns dos principais problemas associados a ela. Atualmente, Dust está explorando os seguintes aplicativos em sua plataforma:
6. Caixa de etiqueta
Liberar dados comerciais
A “ascensão do big data” já dura há mais de 20 anos e, embora as empresas estejam continuamente a ingerir mais dados do que nunca, muitas empresas ainda lutam para utilizar esses dados para obter insights a partir de modelos de inteligência artificial. O processamento e a interpretação de dados continuam sendo as partes mais tediosas e caras do processo de IA, mas também as mais importantes para resultados de alta qualidade. Mesmo com o aumento de modelos de grandes linguagens pré-treinados, as empresas ainda precisarão se concentrar no uso de seus próprios dados proprietários (em múltiplas modalidades) para criar IA generativa posicionada de forma única para fornecer serviços e insights diferenciados e melhorar a eficiência operacional.
Labelbox resolve esse desafio simplificando a forma como as empresas alimentam conjuntos de dados em modelos de IA. Ele ajuda as equipes de dados e de aprendizado de máquina a encontrar os dados certos, processá-los e interpretá-los, enviar modelos para aplicativos e medir e melhorar continuamente o desempenho.
A nova plataforma da Labelbox aproveita a inteligência artificial generativa. O Model Foundry permite que as equipes experimentem rapidamente modelos básicos de IA de todos os principais fornecedores de código aberto e fechado, permitindo-lhes pré-rotular os dados e experimentar rapidamente com apenas alguns cliques. Dessa forma, eles podem entender qual modelo tem melhor desempenho em seus dados. O Model Foundry gera automaticamente métricas de desempenho detalhadas para cada experimento executado durante o versionamento dos resultados.
O impacto pode ser de longo alcance. Tradicionalmente, os humanos passam dias realizando uma tarefa simples, mas demorada, como classificar uma listagem de comércio eletrônico contendo vários parágrafos de texto. Com o GPT-4, esta tarefa pode ser concluída em horas. O Model Foundry permite que as empresas descubram essas formas eficientes por si mesmas.
Este não é o único exemplo. Os primeiros resultados mostram que mais de 88% das tarefas de etiquetagem podem ser aceleradas por um ou mais modelos básicos. O Labelbox permite que qualquer pessoa pré-etiquete os dados com apenas alguns cliques, sem a necessidade de codificação e inserção de dados em um modelo. Esta ferramenta foi projetada para capacitar as equipes a trabalhar de forma colaborativa e aproveitar o conhecimento multifuncional para manter a supervisão manual da garantia da qualidade dos dados. Esse recurso democratiza o acesso à inteligência artificial, permitindo que especialistas em modelos de linguagem e pequenas e médias empresas avaliem facilmente modelos, enriqueçam conjuntos de dados e colaborem para construir aplicativos inteligentes.
Está comprovado que o Labelbox reduz significativamente os custos e melhora a qualidade dos modelos para as maiores empresas do mundo, incluindo Walmart, Procter & Gamble, Genentech e Adobe.
7. Pista
Nova suíte criativa
A inteligência artificial está em toda parte e se tornando cada vez mais uma mercadoria. Na maioria dos casos, as empresas utilizam IA como chatbots para enriquecer as aplicações existentes. Poucas aplicações de IA estão a reinventar as experiências dos produtos, utilizando a tecnologia para mudar fundamentalmente a forma como interagimos com os produtos, tal como o motor de pesquisa do Google mudou a forma como navegamos na Internet ou o Instagram mudou a forma como partilhamos fotos dos nossos telefones. Da mesma forma. Essas aplicações de IA exigem um conhecimento profundo da experiência do usuário existente, pensamento visionário sobre produtos e tecnologia de ponta.
A Runway é um exemplo importante de empresa que usa pesquisa aplicada de IA para reimaginar experiências criativas e construir um conjunto criativo totalmente novo.
Desde outubro de 2022, a Runway desenvolveu mais de 30 “ferramentas mágicas” de IA que abrangem vídeo, imagens, 3D e texto, atendendo a todos os aspectos do processo criativo, da pré-produção à pós-produção. Sua base de clientes inclui empresas Fortune 500 e Global 2000, como The Late Show with Stephen Colbert da CBS, New Balance, Harbour Picture Video, Publicis) e Google. A plataforma também tem sido usada para editar filmes indicados ao Oscar, como o sucesso de Hollywood Everything Everywhere All at Once.
8. Novo Limite
Remodelando o destino celular
As células são os sistemas de computador mais complexos da Terra. Assim como os chips de computador, o DNA é composto de unidades básicas que criam funções complexas. Ao contrário dos códigos baseados em bits, os códigos baseados em átomos são aleatórios e hierárquicos. Um sistema depende de outro, que por sua vez depende de outros sistemas físicos, cada um afetado pelo calor, pela acidez e pelas moléculas do microambiente da célula.
Apesar dessas interdependências, o código de máquina celular (DNA) pode executar diferentes programas com eficiência. Embora as células do fígado e da pele contenham o mesmo genoma, esses tipos de células têm aparência, sensação e função diferentes. Por que? Porque eles estão executando diferentes programas epigenéticos.
Em 2006, Takahashi et al., usaram uma combinação de quatro proteínas de fator de transcrição (TF) para reprogramar células maduras em células-tronco, sendo pioneiros no campo da reprogramação epigenética. Fatores de transcrição são proteínas que regulam genes, alterando essencialmente o “programa” em execução. A descoberta de Takahashi e Yamanaka levou à criação de células-tronco pluripotentes induzidas (iPSCs) e lhes rendeu o Prêmio Nobel. Desde então, muitos grupos de pesquisa começaram a aplicar combinações únicas de TF para alterar os estados celulares, rejuvenescer células danificadas e restaurar fenótipos celulares jovens.
Embora a reprogramação epigenética esteja se tornando mais tratável, ainda não é uma questão trivial. A equipe teve que discernir qual combinação de TFs era eficaz na transição das células do estado A para o estado B desejado. Por exemplo, futuras combinações de TF poderão permitir-nos converter células doentes em células saudáveis, desenvolvendo assim uma nova classe de medicamentos. Precisamos de telas de reprogramação em grande escala porque a combinação exata de TFs não é conhecida para muitas áreas de aplicação. Existem mais de 1.500 TFs humanos nativos, portanto é necessário um método de pesquisa mais eficiente. Acreditamos que a NewLimit está projetando tal abordagem.
Impulsionada por avanços em sequenciamento unicelular e tecnologias de aprendizado de máquina, a NewLimit está transformando uma disciplina anteriormente manual em ciência orientada por dados. A empresa possui uma divisão saudável de trabalho entre biólogos moleculares e biólogos computacionais, estabelecendo as bases culturais necessárias para construir uma plataforma de circuito fechado cada vez mais eficiente. Combinando experiência e leituras multimodais (scRNA-Seq, scATAC-Seq, etc.), o NewLimit visa descobrir remodeladores terapêuticos para tratar doenças anteriormente intratáveis.
Em cada rodada de experimentos, a NewLimit utiliza tecnologia de linguagem de máquina para:
Além de sua excelente equipe, habilidade técnica e visão ambiciosa, também admiramos o espírito pragmático da NewLimit. Embora a empresa não tenha partilhado publicamente detalhes da sua estratégia comercial inicial, acreditamos que esta abordagem é criativa, reduz razoavelmente o risco e tem o potencial de ser transformadora para a humanidade. A equipa fundadora concorda que as plataformas biotecnológicas podem ser comparadas a projetos científicos dispendiosos sem gerar ativos a curto prazo. Para tal, a NewLimit tem sido transparente e catalogou o seu progresso tecnológico desde a sua criação.
9. À beira da piscina
Inteligência Artificial Básica para Desenvolvimento de Software
OpenAI concentra-se na inteligência artificial geral, DeepMind concentra-se na descoberta científica e o terceiro caso de uso fundamental da inteligência artificial é a compreensão e criação de software.
O GPT-4 está enraizado nos fluxos de trabalho de desenvolvedores experientes e novatos. Mas esta mudança de paradigma ainda está na sua infância. Extrapolando os últimos meses, a programação assistida por IA em breve se tornará onipresente. À medida que esta tendência se desenvolve, a linguagem natural se tornará a base abstrata sobre a qual o software é construído.
Embora outras empresas tenham lançado modelos de código puro em larga escala, como o StarCoder, nenhum método chegou perto do desempenho do GPT-4. Acho que isso ocorre porque um modelo treinado apenas em código não pode produzir fortes capacidades de desenvolvimento de software. Foi assim que conheci o Poolside. A empresa foi fundada por Jason Warner, ex-diretor de tecnologia do GitHub, e Eiso Kant, ex-fundador da source{d}, a primeira empresa de inteligência artificial de código de pesquisa do mundo.
Poolside é o único que adota a abordagem do modelo básico OpenAI, mas se concentra em apenas uma função: geração de código. A sua estratégia tecnológica depende do facto de o código poder ser executado, permitindo feedback imediato e automático durante o processo de aprendizagem. Isso permite o aprendizado por reforço por meio da execução de código, uma alternativa atraente ao aprendizado por reforço baseado em feedback humano (RLHF). Isso é algo que a Esso começou a explorar já em 2017.
10. Mistral
Concorrentes da OpenAI na França
Recentemente, Paris foi iluminada por uma explosão de projetos no campo da inteligência artificial generativa. Talvez você pergunte por quê? Minha opinião é que Paris tem o maior conjunto de talentos de classe mundial em IA generativa que está fora do horizonte de eventos da OpenAI. Destes projetos, o mais ousado é sem dúvida o Mistral. A Mistral foi fundada por Guillaume Lample, Arthur Mensch e Timothe Lacroix com a missão de construir os melhores modelos de linguagem de código aberto. O objetivo é construir um ecossistema próspero em torno desses modelos.
Conheço Guillaume há quatro anos e ambos estivemos profundamente envolvidos na aplicação de grandes modelos de linguagem a áreas da matemática, especialmente à matemática formal. Enquanto trabalhamos na OpenAI e na Meta, desenvolvemos um relacionamento competitivo amigável. Guillaume é um dos pesquisadores mais talentosos com quem já tive o prazer de trabalhar e tive o privilégio de vê-lo passar da pesquisa na Meta à fundação da Mistral. No processo, também conheci Arthur Mensch. Sempre fiquei impressionado com seu trabalho, especialmente Chinchilla, que redefiniu o que significa treinar com eficiência grandes modelos de linguagem, e RETRO, uma abordagem para modelagem de linguagem com recuperação aprimorada que, eu diria, ainda não foi totalmente explorada.
Agora, vamos descobrir o que torna o Mistral Mistral. A visão da startup é construir um ecossistema baseado no melhor modelo de código aberto da categoria. Este ecossistema servirá como plataforma de lançamento para projetos, equipes e empresas, acelerando o ritmo de inovação e uso criativo de grandes modelos de linguagem.
Tomemos como exemplo a aprendizagem por reforço baseada em feedback humano (RLHF). Normalmente, a realização de RLHF é demorada e, portanto, dispendiosa. Envolve “sinalização” manual de ações de IA, o que pode exigir muito trabalho. O esforço só valerá a pena se a promessa de um modelo de IA for suficientemente boa. Para uma grande empresa como a OpenAI, investir neste processo faz sentido e a empresa tem os recursos para que isso aconteça. Mas as comunidades tradicionais de código aberto geralmente precisam de um “líder” para dar um passo à frente e assumir esta importante responsabilidade.
A Mistral tem a oportunidade de fazer exatamente isso, investindo em um modelo de código aberto para RLHF. Ao fazê-lo, Mistral abrirá a porta a uma explosão cambriana de inovação. Os desenvolvedores de código aberto terão acesso a modelos claramente identificados que podem adaptar e personalizar para diferentes necessidades. O vencedor final será o mercado mais amplo e teremos acesso a casos de uso mais específicos e atraentes do que uma empresa fechada poderia produzir sozinha.
Quem tiver o melhor modelo de código aberto atrairá mais interesse e valor. Estou otimista em relação ao Mistral porque a equipe está ativamente ampliando a fronteira de eficiência/desempenho. Ao mesmo tempo, o talento da Mistral nesta área é de longe o melhor do mundo.
11. Sereagir
Robôs Industriais Mais Inteligentes
Frequentemente ouvimos previsões de que, a longo prazo, a inteligência artificial e a robótica aumentarão ou automatizarão as tarefas humanas. Hoje, isso se tornou cada vez mais um imperativo comercial urgente.
Até 2030, a população em idade ativa da Europa deverá diminuir em 13,5 milhões e os custos laborais estão a aumentar ao ritmo mais rápido em mais de 20 anos. Com a ascensão do comércio eletrónico, os armazéns estão sob mais pressão do que nunca e torna-se cada vez mais difícil para as empresas permanecerem competitivas.
55% das despesas operacionais do armazém provêm da recolha de encomendas, mas a situação não é optimista para as empresas que procuram migrar para sistemas automatizados. Nenhum dos aplicativos chamativos com os quais estamos familiarizados em SaaS (software como serviço) liderado por IA, ou a infinidade de produtos de código aberto que vemos em outras partes do ecossistema, ainda não foram aplicados à robótica.
Em vez disso, as empresas que procuram automatizar a recolha e embalagem enfrentam a escolha de soluções robóticas dispendiosas e inflexíveis. Eles devem navegar por uma série de interfaces proprietárias que exigem conhecimento e tempo de programação significativos. Esses sistemas também enfrentam dificuldades para lidar com mudanças na mistura de produtos, exigem intervenção humana regular e apresentam desempenho insatisfatório ao lidar com situações extremas.
Secret resolve esses problemas. Seu software é baseado em poderosos ambientes simulados, treinando braços robóticos para compreender as nuances espaciais e físicas de qualquer ambiente potencial do mundo real. Uma vez implantado, o sistema será otimizado aprendendo continuamente com dados do mundo real. Isso também significa que eles podem lidar com o desafio de pegar itens tradicionalmente difíceis, como eletrônicos, têxteis, frutas, azulejos e madeira.
O mais interessante é que sua pilha de robótica usa grandes modelos de linguagem para permitir o controle intuitivo da linguagem natural dos robôs. Eles desenvolveram um modelo de conversor chamado “PickGPT” que permite aos usuários dar instruções e feedback ao robô por voz ou texto. Dessa forma, qualquer pessoa pode solicitar ao robô a execução de uma tarefa desejada, independente do seu nível de conhecimento técnico.
A Secret combina as duas áreas de atuação de seus cofundadores. O CEO Ralf Gulde trabalhou na interseção entre inteligência artificial e robótica, enquanto o CTO Marc Tusher é especializado em aprendizagem profunda. A dupla conduziu pesquisas revisadas por pares sobre esses assuntos na Universidade de Stuttgart, uma das universidades mais prestigiadas da Alemanha em automação e fabricação industrial.
Apesar de ser uma empresa jovem, a Sereact já atraiu uma lista impressionante de parceiros, incluindo Daimler Truck, Schmalz, Zenfulfillment, Zimmer Group) e Material Bank. Isto indica que existe uma enorme oportunidade de mercado potencial na indústria de separação e embalagem.
Além dos casos de uso óbvios em armazéns de comércio eletrônico, seja na separação de pedidos ou na desembalagem de caixas, há uma série de outros casos de uso. Por exemplo, na fabricação tradicional, existe um processo demorado chamado montagem, que envolve a coleta laboriosa das peças delicadas necessárias para a montagem. Os braços robóticos têm historicamente lutado para agarrar peças pequenas e separar peças individuais em ambientes desordenados. O software da Sereact pode identificar essas peças e selecionar a pinça correta para selecioná-las.
12. Lamini
Mecanismo de modelo de linguagem em grande escala feito sob medida
Agora, todas as empresas estão tentando integrar a inteligência artificial aos negócios da empresa. As maiores empresas do mundo reconhecem o potencial da inteligência artificial, com 20% dos CEO do S&P 500 a mencionarem a IA durante as suas teleconferências de resultados do primeiro trimestre. Grandes modelos de linguagem podem melhorar significativamente a eficiência dos negócios, acelerando funções essenciais, como suporte ao cliente, vendas externas e codificação. Grandes modelos de linguagem também podem melhorar as experiências principais dos produtos, respondendo às perguntas dos clientes com assistentes baseados em IA ou criando novos fluxos de trabalho generativos de IA para encantar os clientes.
Dado que as grandes empresas tendem a ser lentas na adoção de novas tecnologias, ficámos surpreendidos com a rapidez com que as empresas começaram a construir com IA. Não é de surpreender que muitas empresas queiram construir internamente seus próprios modelos e soluções de IA. Cada empresa possui um acervo proprietário de dados de clientes, muitas vezes como parte de seu negócio principal. Essas empresas veem riscos ao enviar seus dados mais valiosos para APIs de modelos subjacentes ou startups cuja confiabilidade é incerta. Mesmo independentemente das questões de privacidade de dados, os modelos de linguagem pública de grande escala, como GPT-4 ou Claude, são inteiramente treinados em dados abertos e, portanto, carecem de capacidades de personalização para casos de uso e segmentos de clientes específicos da empresa.
Algumas empresas de tecnologia, como Shopify e Canva, formaram "AI Tiger Teams" internas para usar modelos de código aberto prontos para integrar inteligência artificial em todas as partes do negócio. No entanto, a maioria das empresas não tem recursos ou investigadores experientes em IA para construir e implementar modelos de linguagem proprietários em grande escala com base nos seus próprios dados. Eles percebem que esta onda de IA pode ser um momento de transformação para o futuro dos seus negócios, mas até agora não foram capazes de alavancar ou controlar o seu próprio desenvolvimento de IA.
É por isso que estamos tão entusiasmados com o que Sharon Zhou, Greg Diamos e sua equipe estão fazendo na Lamini. Lamini é um mecanismo de modelo de linguagem em grande escala que facilita aos desenvolvedores treinar, ajustar, implantar e melhorar rapidamente seus próprios modelos com feedback humano. Esta ferramenta proporciona uma experiência de desenvolvimento agradável que abstrai as complexidades dos modelos de IA e, mais importante ainda, permite que as empresas criem soluções de IA com base nos seus próprios dados, sem terem de contratar investigadores de IA ou correrem o risco de fuga de dados. Trabalhamos com Sharon e Greg pela primeira vez no outono passado. Desde então, tivemos a oportunidade de apoiar esta equipa fundadora tecnicamente proficiente e focada no cliente à medida que concretizam a sua visão ambiciosa de transformar a forma como as empresas adotam a IA.
Especificamente, a implantação de modelos privados de grandes linguagens com o Lamini oferece uma ampla gama de vantagens em comparação ao uso de soluções públicas. Ter uma equipe interna de engenharia cuidando do processo de construção garante a privacidade dos dados e permite maior flexibilidade na seleção do modelo e em toda a pilha de computação e dados. Os modelos feitos com Lamini também reduzem artefatos, reduzem a latência, garantem tempos de execução confiáveis e custos mais baixos em comparação com APIs disponíveis no mercado. Essas melhorias de desempenho vêm de insights técnicos básicos que a equipe Lamini incorpora ao produto com base em décadas de pesquisa e experiência no setor em torno de modelos de IA e otimização de GPU.
13. Fábrica
Seu “robô” de codificação
Hoje, se você quiser que um computador faça algo por você, você terá que traduzir seus pensamentos para uma “linguagem de computador”, um código de hipertexto que um compilador possa entender. Para se tornar um engenheiro, você precisa torcer seu cérebro como uma máquina. No entanto, estamos chegando a um ponto crítico em que a IA pode transformar a linguagem humana em código. A transição de engenheiros humanos para engenheiros digitais provavelmente se tornará um dos pontos de inflexão tecnológica mais importantes em nossas vidas.
Ainda estamos nos estágios iniciais dessa transformação. Ferramentas de inteligência artificial como BabyAGI e AutoGPT capturaram a imaginação do público. Mas embora assistentes de codificação como o Github Copilot representem uma melhoria, eles ainda são muito limitados, servindo principalmente como preenchimento automático para ideias já implementadas no código.
A fábrica é diferente. A empresa foi fundada em 2023 pelo ex-teórico de cordas Matan Grinberg e pelo engenheiro de aprendizado de máquina Eno Reyes. Quando conheci Mattan, fui imediatamente atraído por sua visão: um futuro onde os engenheiros possam tornar a construção divertida, delegando tarefas chatas e concentrando-se em problemas difíceis. Para fazer isso, Matan e Eno criaram “robôs” de codificação autônomos.
Os bots são engenheiros de inteligência artificial que lidam com tarefas diárias, como revisão de código, depuração e refatoração. Ao contrário dos produtos existentes, os bots do Factory não exigem que você faça nada; eles podem revisar códigos de forma independente, lidar com erros e responder perguntas. Você também pode usar bots como desenvolvedores juniores, usando-os para debater e compartilhar trabalhos de recursos. Os robôs possuem mecanismos de proteção poderosos e sua inteligência é direcionada às necessidades dos usuários, dificultando que eles “alucinem” respostas erradas.
A geração de código será uma das áreas mais transformadoras da revolução da IA, e a Factory possui todas as ferramentas necessárias para ter sucesso.
*Equipe. Mattan, o CEO da Factory, é um teórico de cordas na Universidade de Princeton, onde imaginou singularidades de buracos negros. Eno trabalhou como engenheiro de aprendizado de máquina na Hugging Face e cuidou pessoalmente do tedioso processo de engenharia. Esta é uma equipe única.
A história do desenvolvimento humano é a de descarregar tarefas repetitivas, permitindo-nos passar para tarefas mais complexas. Quando os humanos inventaram a agricultura, essencialmente libertaram a nossa capacidade de construir cidades. Após a Revolução Industrial, construímos foguetes que levaram humanos à Lua. A próxima geração tem a missão de libertar os humanos do trabalho penoso online e avançar ainda mais a fronteira tecnológica.
Tradutor: Jane