Büyük model kibirli ve kibirli. Yapay Zeka Ajanları olmadan yaşam veya ölümü tahmin etmek zordur.

Orijinal: Tibet Tilkisi

**Kaynak: **Beyin Kutup Gövdesi

AI Agent, büyük dil modeli LLM'yi devralıyor ve AI çemberindeki en sıcak konu haline geldi.

Şu anda yapay zeka risk sermayesi çemberindeki durum kabaca şöyle:

Büyük Fabrika Kulübü: OpenAI dahili çalışanları, AI Agent'ın OpenAI'nin yeni yönü olduğunu iddia ediyor; Microsoft, tipik bir AI Agent senaryosu olan yardımcı pilotu teşvik etmeye ve AI'nın asistan rolünü oynamasına izin vermeye çalışıyor; NVIDIA Voyager'ı başlattı; bu AI Agent, özerk olun "Minecraft" oyununa hakim olmak için kod yazın; yerli SenseTime ayrıca genel bir AI ajanı başlattı; Alibaba bir dijital çalışan başlattı...

Akademik çevre: Bu yılın Nisan ayında Stanford, 25 Yapay Zeka Temsilcisinin sanal kasabanın sanal alan ortamında insanları simüle etmesine ve diğer Yapay Zeka Ajanlarıyla aşık olmasına, parti yapmasına, işbirliği yapmasına, flört etmesine vb. izin veren bir Westworld kasabası oluşturdu. Buna ek olarak, bazı akademisyenler, çevrimiçi makaleleri otomatik olarak okumak ve kanser karşıtı ilaçları araştırmak da dahil olmak üzere karmaşık bilimsel deneyler tasarlamak için Yapay Zeka Ajanlarını kullanmaya başladı... Bu son teknoloji keşifler akıllara durgunluk veriyor.

Girişimcilik Çemberi: AI Agent sadece en iyi bilim adamlarına yönelik bir oyun değildir. Camel, AutoGPT, BabyAGI ve AgentGPT gibi birçok proje ortaya çıkmıştır. Ayrıca bu açık kaynak projelerini oluşturmak için kullanan çok sayıda açık kaynak topluluğu geliştiricisi ve girişimcisi de vardır. bazı pratik araçlar. Örneğin aomni, kullanıcıların ağ bilgilerini yakalamasına ve e-posta yoluyla göndermesine yardımcı olan bir AI Aracısı uygulamasıdır.

Yatırım çemberi: AI Agent, "genel yapay zeka (AGI) çağının başlangıcı" olarak kabul ediliyor ve salgını "sert". Bazı Silikon Vadisi girişimcileri, yatırımcılarla Jeneratif Ajanlar hakkında konuşurken herkesin sabırsızlıkla beklediğini söyledi. Ona daha fazlasını anlamayı, yaklaşmayı ve sonraki patlamalara daha hızlı tepki vermeyi umuyoruz.

Bu yargılara göre "AI Agent'ın büyük modellerin ikinci yarısını açtığını" söylemek için henüz çok erken, ancak "AI Agent'ın büyük modeller için ticari standart olduğu" açık olmalıdır.

Bu nedenle, bundan sonra daha fazla büyük üreticinin ve startup'ın AI Agent üzerinde daha fazla eyleme geçtiğini görmeliyiz.

Peki AI Agent tam olarak nedir? Büyük modellerin ticarileşmesi için neden gerekli bir koşul olduğu söyleniyor?

Büyük model kibirli ve kibirli ama kullanıcılar hâlâ para ödemiyor.

Burada öncelikle AI Agent'ı bir kenara bırakıp büyük modelin nasıl olduğuna bir göz atıyoruz.

Büyük modellerin vizyonu yüksek, yatırımı yüksek, eşiği yüksek bir şey olduğu konusunda çoğu okuyucunun hemfikir olduğuna inanıyorum. Duygusal açıdan bakıldığında genel yapay zekayı hayata geçirmek ve toplumu tamamen değiştirmek mümkün; laik açıdan bakıldığında ise işi yeniden inşa edebilir/ Ürün ve teknoloji şirketlerinin performansını artırmasına olanak tanıyor.

Ancak bunların hepsi, büyük modellerin gerçek anlamda ticarileştirilebileceği, Ar-Ge maliyetlerinin karşılanabileceği, sağlıklı ve sürdürülebilir kalkınmanın sağlanabileceği gerçeğine dayanıyor.

Geçtiğimiz birkaç ayda, büyük modeller için iki iş modeli daha etkili hale geldi: Biri, büyük modellerin hükümetler ve çeşitli sektörlerdeki kuruluşlar tarafından özelleştirilmiş yerel dağıtımı; diğeri ise büyük modelleri bulutlar, yapay zeka sunucuları aracılığıyla satmak için gereken bilgi işlem gücü. vb.

Şu anda yerli üreticiler ilgili iş raporlarını yayınladılar ve sektördeki özelleştirme talebinden on milyonlarca gelir elde ettiler.

Ancak ToB işi tek başına büyük ölçekli bir iş modelini destekleyemez.

Teknolojik bir devrimde, ekonomik değer yaratmak için temel teknolojinin dışarı çıkması ve milyarlarca sıradan kullanıcı tarafından kullanılması gerekir. Ev bilgisayarları, internet ve akıllı telefonlar kitleler arasında popüler hale geldikten sonra birçok teknoloji şirketinin piyasa değeri hızla yükseldi.

Günümüzde devler, büyük modellerin, özellikle de genellikle yüz milyarlarca veya trilyonlarca parametre ölçeğine sahip olan ve kitlesel kullanıcılar tarafından kullanılması gereken temel modellerin eğitimine çok fazla kaynak yatırımı yaptı.

Peki gerçek uygulama deneyimi nedir?

Sohbet, çizim, yaratıcılık gibi senaryoların hata tolerans oranı yüksektir. Yapay zeka soruyu yanlış cevaplasa bile kullanıcı onu yine de "sevimli" bulacaktır. Uygulamanın bu kısmı zaten çok karmaşık, örneğin " AI kimlik fotoğrafı". Çoğu senaryoda, daha ciddi görevleri yerine getirmenize, diğer çevresel koşullarla işbirliği yapmanıza ve uzun vadeli ve sürekli işlerle başa çıkmanıza otomatik olarak yardımcı olmak için yapay zekaya ihtiyaç vardır. Çok fazla hata yapmayın, aksi takdirde insanlar çok sayıda hataya katılmak zorunda kalacak, ve Verimliliği gerçekten artıramıyorum.

Açıkçası, bu tür bir senaryo şu anda büyük ve karmaşık bir genel amaçlı modelle iyi bir şekilde çözülemez.

Örnek olarak benim gibi bir yazarı ele alalım. Eğer büyük bir modelin benim için yazı yazmasına izin verirsem halüsinasyonlar görebilir. Bahsedilen olayları/haberleri/gazeteleri tekrar kontrol etmem gerekiyor ki bu, kendi başıma bilgi aramaktan daha zahmetli ve yeterince doğru değil. Bir fikir bulduğumda, bana uzun süre ilham verecek hızlı kelimeler kullanmam gerekiyor ve kullanılabilecek hiçbir şey olmayabilir. Yavaş ve yorucu, o yüzden yazsam iyi olur kendim.

Görevlerin tek adımda otomatik olarak tamamlanamaması, incelemeye çok sayıda insanın müdahale etmesini gerektirir.Bu, ciddi senaryolarda büyük modellerin uygulanmasında şu anda büyük bir zorluktur ve aynı zamanda büyük modelin uygulanması ve ticarileştirilmesinin ilerlemesini de doğrudan etkiler. .

Nasıl yapılır? Büyük modeller iyi performans göstermek istiyorsa acilen bir grup yardımcıya ihtiyaç duyarlar ve bu da Yapay Zeka Aracılarıdır.

Üretkenliği gerçekten özgürleştiriyor, AI Agent neden bu kadar muhteşem?

Hayal edin, eğer büyük bir model günde 24 saat, 7 gün, insan müdahalesi olmadan kendi başına çalışabiliyorsa, çeşitli görevleri kendi başına tamamlayabiliyorsa, insanların ara sıra bilgisayara ya da ofise dönüp nasıl çalıştığını görmeleri yeterli oluyor. Büyük bir model açmanın doğru yolu budur.

GPT-4 konferansında OpenAI, GPT4'ün web sayfaları oluşturmak için taslakları tanımasına izin vermek ve kendi kodundaki hataları adım adım düzeltmek gibi bazı görevleri otomatikleştirme yeteneğini gösterdi.

Peki bu yetenek geliştiriciler ve sıradan kullanıcılar tarafından nasıl kullanılabilir? Birçok geliştirici, doğrudan GPT4'ü kullanarak kod yazarsanız yine de kodun hatalarını ayıklamanız gerektiğini, doğrudan kullanım için kod oluşturmak amacıyla resimlere bakamayacağınızı, bazen onu kullanmamanın daha iyi olacağını söyledi.

Büyük model üreticileri de bir ikilem içinde. API'yi açtım. Daha profesyonel, hassas ve rafine yetenekler elde etmek için birinin onu daha da geliştirmesi gerekiyor, bu yüzden bayrağı AI Agent'a devrettim.

AI Agent, ortamdaki otomatikleştirilmiş bir AI varlığıdır ve dört temel özelliğe sahiptir:

  1. Çevredeki ortamı sensörler aracılığıyla algılayın. Bu ortam sandbox oyunları, simülasyon eğitim sistemleri, otonom sürüş simülatörleri vb. gibi sanal olabileceği gibi yollar, odalar, montaj hatları vb. gibi fiziksel de olabilir.

  2. Bağımsız olarak karar verebilme.

  3. Aktüatörler/efektörler harekete geçmek için birlikte çalışırlar.

  4. Performansı en üst düzeye çıkarmaya ve sonuçları optimize etmeye dayalı öğrenme ve ilerleme.

Bu açıdan bakıldığında, insanlar aslında bir tür "akıllı ajan" Yapay Zeka Ajanıdır. Dış ortamdaki değişiklikleri gözlerimiz, kulaklarımız, cildimiz vb. aracılığıyla hissedebiliriz ve ardından beynimiz aracılığıyla kararlar alabilir, ağzımızla konuşabiliriz. ve bacaklarımızla yürüyün.Harekete geçin ve ödül geribildirimine göre sürekli olarak dış ortama uyum sağlayın.

Aslında yapay zekadaki Ajanlar da aynı mantığa sahiptir. Örnek olarak otonom sürüş senaryosunda Yapay Zeka Aracısını ele alalım. Bilgi toplamak ve karayolu araçları ve yayalar gibi çevresel faktörleri algılamak için sensörlere ihtiyaç vardır. Sistem daha sonra otomatik olarak kararlar alacak ve buna göre yanıt verecek şekilde gaz pedallarını, frenleri ve diğer ekipmanları çalıştıracaktır. .

Bu aynı zamanda AI Agent'ın PEAS modeli olarak da bilinir. Bunu anlamanız için basit bir tablo yapalım:

Peki, özellikle büyük modellerde AI Agent nasıl bir etki yaratabilir? Temel olarak aşağıdaki temel işlevlere sahiptir:

İlk önce görevi parçalara ayırın.

Büyük modellerin belirli bir alanla birleştirilmesi gerekir ve karşılaştıkları kullanıcı ihtiyaçları nispeten geneldir ve süreç çoğu zaman birden fazla adımı içerir. Kullanıcının "ışık olması lazım" dediği gibi, izole edilmiş büyük bir model ortamda hangi lambaların olduğunu bilmiyor ve bunları nasıl kontrol edeceğini bilmiyor, dolayısıyla büyük bir modelle bile basit görünen bu işin üstesinden gelemiyor. ama aslında karmaşık bir görev.

Yapay Zeka Aracısı, görev planlama yeteneklerine sahiptir ve adımların nasıl planlanacağını, kaynakların nasıl tahsis edileceğini, kararların nasıl optimize edileceğini ve ardından talimatların nasıl tamamlanacağını otomatik olarak anlayıp karar verebilir, böylece büyük model işleme görevlerinin verimliliğini ve doğruluğunu artırabilir.

Google Brain araştırma ekibi tarafından hazırlanan bir makalede, büyük dil modelinden, görev adımlarını ayrıştırmaya yönelik akıl yürütme sürecini, yani "iç monologu" dile getirmesi ve ardından karşılık gelen eylemleri gerçekleştirmesi istendi; bu, aniden görev adımlarının doğruluğunu artırdı. Büyük modelin cevapları Çoklu veri setlerinde SOTA sonuçlarına ulaşarak büyük modellerin anlamsızlığını geliştirdi.

İkincisi, otomatik yürütme.

AI Agent, bağımsız düşünüp hareket edecek şekilde tasarlanmıştır. Kullanıcıların yalnızca ona bir görev vermesi ve işini yapmasına izin vermesi gerekir. AutoGPT'nin tipik bir örneği pizza siparişidir. Kullanıcının adresi girmesine veya lezzeti seçmesine gerek yoktur. AI Aracısı tüm sipariş adımlarını halleder ve bunları otomatik olarak yürütür. İnsanlar yan taraftan izleyebilir ve bunları düzeltebilir. herhangi bir hata yapılırsa zaman.

AI Agent yalnızca İnternet'i kullanmakla kalmaz, aynı zamanda fiziksel ortamda da çalışabilir, ekspres teslimatı sağlamak için robotları, sürücüsüz arabaları, otonom sürüşü vb. kontrol edebilir.

AI Agent ile kullanıcılar ve büyük modeller arasındaki etkileşim daha doğal, daha basit ve daha hızlı olacak, manuel katılımı azaltacak ve kalite ile verimliliği gerçek anlamda artıracak. Örneğin, oyun dünyasında AI Agent, oyuncularla otomatik olarak diyalog başlatabilir, açık etkileşim sağlayabilir ve oyuncu geri bildirimlerine dayalı olarak sonsuz olay örgüsü tasarlayabilir, böylece oyunu gerçekten binlerce kişi için daha erişilebilir hale getirebilir; fiziksel dünyada ise AI Agent Talimatları otomatik olarak üretebilir ve çalıştırabilir, mekanik gövdeyi çalıştırabilir, insanlara temizlik hizmetleri sağlayabilir ve fabrikalardaki işlemleri insan rehberliğine güvenmeden otomatikleştirebilir.

Üçüncüsü, kaynakları koruyun.

İnsanlar gibi AI Aracıları da daha karmaşık görevleri yerine getirmek için API'leri çağırma gibi araçları kullanabilir; bu da büyük modellerin yeteneklerini büyük ölçüde artırır ve kaynakların israfını ve aşırı tüketimini azaltır.

Örneğin, AutoGPT için kod yazarken özel bilgi kaynağı verilerine, bilgi işlem kaynaklarına vb. erişmeniz gerekir. Bu işlem sırasında AI Agent, çağrılacak uygun API'yi otomatik olarak bulabilir ve böylece diğer API tokenlarının israf edilmesini önleyebilir. Ayrıca bağımsız olarak öğrenebilir, sonuçları optimize edebilir ve memnun kalmazsanız API'yi tekrar arayabilirsiniz.

Genel olarak konuşursak, seyahat planlaması gibi net olmayan bir kullanıcı talimatını gerçekten tamamlamak için modelin sorunu çözmek üzere birden fazla API'yi çağırması gerekir.Güçlü otomasyona sahip bir AI Aracısı şüphesiz kaynakları koruyabilir, böylece kullanıcılar için maliyetten tasarruf edebilir ve AI'nin Uygulamalara erişmesine izin verebilir. daha çekici ve rekabetçi.

Dördüncüsü, geliştiricilerin ilgisini çekin.

Büyük modellerin ticarileştirilmesi için API modeli mümkün olduğu kadar çok geliştirici grubunun katılımını gerektirir ve endüstri modeli ayrıca ISV entegratörleri, yazılım servis sağlayıcıları vb. gerektirir. Büyük bir üreticinin temel modeliyle kazanmanın zor olduğunu herkes biliyor ve alt bölümlere ayrılmış üst düzey uygulamalarda fırsatlar bulmayı umuyoruz. AI Agent belirli sorunları çözebilir, model efektlerini iyileştirebilir ve dijital sistemleri ve fiziksel varlıkları yönlendirebilir; dolayısıyla süper uygulamalar oluşturmak için çok uygundur.

Yapay Zeka Aracısı yapay zeka yaşamının en küçük birimiyse, o zaman büyük model üreticileri yaşamı besleyen fabrikalardır ve geliştiriciler, yazılım satıcıları vb. onlara endüstriye bazı pratik ve farklı beceriler öğreten beceri eğitimi sınıfları gibidir. kullanıcılarla.

Bu nedenle, hangi büyük model AI Agent'ı daha iyi oluşturabilirse, daha büyük bir geliştirme ekosistemini çekecek ve ticari B-son kullanıcıları için daha yapışkan olacak ve AI platformu düzeyinde büyük bir fırsat oluşturacaktır.

Özetlemek gerekirse, AI Agent, büyük modellerin model etkisini, hizmet kalitesini, uygulama maliyetini ve ekolojik yeteneklerini doğrudan etkiler ve gelecekte çeşitli büyük modellerin rekabetinin anahtarı olacaktır.

AI Agent iyi iş çıkarırsa model vazgeçilmezdir.

O zaman şunu sorabilirsiniz: Nasıl iyi bir Yapay Zeka Aracısı oluşturabiliriz? Bu durum büyük modeller için ne gibi zorluklar yaratıyor?

AI Agent'ın uygulanabilmesi için büyük modellerin aşağıdaki görevleri yerine getirmesi gerektiğine inanıyoruz ve bu da gelecekte rekabetin odağı olacak:

  1. Temel model.

AI Agent'ın yetenekleri ve etkileri, temeldeki temel modelin yetenekleri tarafından belirlenir. AI Agent, temel modelin yeteneklerini kullanamayabilir ancak AI Agent, temel modelin sahip olmadığı yeteneklere sahip olmayabilir.

Örnek olarak dil görevlerini ele alırsak, GPT-4 güçlü doğal dil anlama yetenekleri sağlar, ancak şu anda bunların çok azı aslında AI Aracıları ve ürünlerinde konuşlandırılmıştır.Oyunlardaki bazı NPC'ler hala özerk kararlar verme yeteneğine sahip değildir.

Başka bir örnek olarak, GPT-4 çok modlu olmasına rağmen yalnızca dil API'sini açar. Bu nedenle, AI Aracıları oluşturmak için GPT4'ün çok modlu yeteneklerini kullanmak isteyen geliştiriciler henüz bunu yapamaz ve görüntü ve ses gibi diğer yöntemler de kullanılabilir. Bilginin durumuna göre, AI Aracısının çevreyi anlama ve etkisinin hâlâ iyileştirilmesi gerekmektedir.

Dolayısıyla ister açık kaynaklı bir model olsun, ister kapalı kaynaklı bir model olsun, API ekonomisi üzerinden ticarileştirmek istiyorsanız temel modelin yetenekleri, AI Agent'ın kalitesiyle doğrudan ilişkili olacaktır ve hala mevcut. iyileştirme için yer.

2. Veri bilgisi.

İyi bir Yapay Zeka Aracısı olmanın temel ön koşulu veri toplamak ve kullanmaktır. Geliştiriciler için dijital görevler için gereken veri miktarı artık sorun değil ancak fiziksel dünyada yapay zeka aracıları geliştirirken veri maliyetleri çok yüksek. Robot kontrol verileri genellikle yalnızca kendiniz tarafından, bir simülatör veya sahadaki fiziksel robot koleksiyonu aracılığıyla toplanabilir. Ama sonuçta simülatör gerçek bir ortam değil ve eğitim etkisi iyi olmayabilir. Ancak yollara çıkıp fabrikalara veri toplamak için yüzlerce robot ve drone satın almak, satın alma açısından çok fazla yatırım gerektiriyor. maliyetler, politika kısıtlamaları, fiili uygulama vb. Zorluklar.

Bu noktada Google ve Baidu'nun otonom sürüş avantajları ile Microsoft, Google, Sogou, Baidu ve diğer arama işletmelerinin veri avantajları gibi veri avantajlarına sahip büyük model üreticileri, geliştiricilerin AI Aracılarını keşfetmesinin önündeki bazı engelleri azaltabilir. ve aynı zamanda bu satıcıların büyük modellerinin önünde engeller oluşturacaktır.

  1. Ürün desteği.

AI Agent'ın temsil ettiği büyük model uygulama fırsatlarının henüz çok erken bir aşamada olduğu, teknolojinin henüz tam olarak olgunlaşmadığı ve ticari araştırmaların henüz küçük bir adım attığı kabul edilmelidir. Geliştiriciler, yazılım hizmeti sağlayıcıları vb. için AI Aracısının kodda nasıl uygulanacağından daha kritik ve daha erken dikkate alınması gereken şey, bir AI Aracısının nereye gitmesi gerektiğini hayal etmektir:

Nasıl görünmeli? Adın ne? Cinsiyet var mı? Kullanıcılarla konuşmak için ne tür bir kişiliği kullanıyorsunuz? Kullanım durumları nelerdir? Hangi spesifik zorluklarla karşılaşacaksınız? Bir AI Aracısının başarısı nasıl değerlendirilir?

Bunlar, ürün düzeyinde ve ticari düzeyde daha çok "tarafsız topraklardır". Geliştiricilerin hayal güçlerini serbest bırakmalarına ve çeşitli ortamlar ve görevlerde AI Aracıları oluşturmaya çalışmalarına olanak sağlamak için, büyük model üreticilerinin kendi iş ekosistemlerini açmaları ve daha zengin ve Daha uygun çözümler Geliştiriciler için deneme yanılma riskini azaltan, iş kullanıcılarıyla etkileşimin yoğunluğunu artıran ve daha fazla iş seçeneği ve uygulama durumu oluşturan işlevler.

Sonuç olarak, bu alan hala çok yeni ve AI Agent henüz büyük model endüstrisini net bir şekilde etkilemedi. Ancak AI Agent'ın insanlar ve AI sistemleri arasındaki çok sayıda hantal etkileşimi ortadan kaldıracağı kesin ve bu da oluyor. .

Daha fazla AI Aracısı topluluklara ve kullanıcılara sunuluyor. Öğreniyorlar, değişiyorlar ve gelişiyorlar. Belki birkaç ay içinde AI Agent'ların olgunluğunu ve patlamasını göreceğiz, bu da kaçınılmaz olarak büyük modeller alanında başka bir değişikliği tetikleyecek.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)