Model besar itu sombong dan sombong. Tanpa Agen AI, hidup atau mati sulit diprediksi.

Asli: Rubah Tibet

**Sumber: **Badan Kutub Otak

Agen AI mengambil alih model bahasa besar LLM dan telah menjadi topik terhangat di lingkaran AI.

Saat ini, situasi di lingkaran modal ventura AI kira-kira sebagai berikut:

Klub Pabrik Besar: Karyawan internal OpenAI mengklaim bahwa Agen AI adalah arah baru OpenAI; Microsoft mencoba mempromosikan kopilot dan membiarkan AI berperan sebagai asisten, yang merupakan skenario khas Agen AI; NVIDIA telah meluncurkan Voyager, Agen AI ini dapat menjadi mandiri Tulis kode untuk mendominasi permainan "Minecraft"; SenseTime dalam negeri juga meluncurkan agen AI generalis; Alibaba meluncurkan karyawan digital...

Lingkaran akademis: Pada bulan April tahun ini, Stanford menciptakan kota Westworld, memungkinkan 25 Agen AI untuk mensimulasikan manusia di lingkungan kotak pasir kota virtual, dan jatuh cinta, berpesta, berkolaborasi, berkencan, dll. dengan Agen AI lainnya. Selain itu, beberapa pakar telah mulai menggunakan Agen AI untuk merancang eksperimen ilmiah yang kompleks, termasuk membaca makalah secara online secara otomatis dan meneliti obat antikanker... Eksplorasi mutakhir ini sungguh menakjubkan.

Lingkaran Kewirausahaan: Agen AI bukan hanya permainan bagi para ilmuwan terkemuka. Banyak proyek seperti Camel, AutoGPT, BabyAGI, dan AgentGPT telah bermunculan. Ada juga sejumlah besar pengembang komunitas sumber terbuka dan pengusaha yang menggunakan proyek sumber terbuka ini untuk berkreasi beberapa alat praktis. . Misalnya, aomni adalah aplikasi Agen AI yang membantu pengguna menangkap informasi jaringan dan mengirimkannya melalui email.

Lingkaran investasi: Agen AI dianggap sebagai “awal dari era kecerdasan buatan umum (AGI)”, dan wabahnya “sangat kuat”. Beberapa pengusaha di Silicon Valley mengatakan bahwa ketika berbicara dengan investor tentang Agen Generatif, semua orang menantikannya. untuk itu dan berharap bahwa Memahami lebih banyak, lebih dekat, dan merespons lebih cepat terhadap ledakan berikutnya.

Dari penilaian ini, masih terlalu dini untuk mengatakan bahwa "Agen AI telah membuka paruh kedua model besar", namun harus jelas bahwa "Agen AI adalah standar komersial untuk model besar".

Oleh karena itu, selanjutnya kita akan melihat lebih banyak produsen dan startup besar mengambil tindakan lebih banyak terhadap Agen AI.

Jadi, apa sebenarnya Agen AI itu? Mengapa dikatakan sebagai syarat yang diperlukan untuk komersialisasi model besar?

Model besar sombong dan angkuh, tapi pengguna tetap tidak membayar.

Di sini kita mengesampingkan Agen AI terlebih dahulu dan melihat seperti apa model besarnya.

Saya yakin sebagian besar pembaca setuju bahwa model besar adalah sesuatu dengan visi tinggi, investasi tinggi, dan ambang batas tinggi. Dari perspektif sentimental, adalah mungkin untuk mewujudkan kecerdasan buatan umum dan mengubah masyarakat sepenuhnya; dari perspektif sekuler, model tersebut dapat merekonstruksi bisnis/ produk dan memungkinkan perusahaan teknologi untuk Kinerja melonjak.

Namun semua ini didasarkan pada fakta bahwa model-model besar dapat benar-benar dikomersialkan, menghemat biaya penelitian dan pengembangan, serta mencapai pembangunan yang sehat dan berkelanjutan.

Selama beberapa bulan terakhir, dua model bisnis untuk model besar telah menjadi lebih efektif: yang pertama adalah penerapan model besar secara lokal yang diprivatisasi oleh pemerintah dan perusahaan di berbagai industri; yang lainnya adalah daya komputasi yang diperlukan untuk menjual model besar melalui cloud, server AI. , dll. .

Saat ini, produsen dalam negeri telah merilis laporan bisnis terkait dan memperoleh pendapatan puluhan juta dari permintaan penerapan privatisasi di industri.

Namun, bisnis ToB saja tidak dapat mendukung model bisnis skala besar.

Dalam revolusi teknologi, teknologi inti harus mengalir dan digunakan oleh miliaran pengguna biasa untuk menciptakan nilai ekonomi. Setelah PC rumahan, Internet, dan ponsel pintar menjadi populer di kalangan masyarakat, nilai pasar banyak perusahaan teknologi melonjak.

Saat ini, raksasa telah menginvestasikan banyak sumber daya untuk melatih model besar, terutama model dasar, yang seringkali memiliki skala parameter ratusan miliar atau triliunan, dan harus digunakan oleh pengguna massal.

Jadi, apa pengalaman aplikasi sebenarnya?

Skenario seperti mengobrol, menggambar, dan kreativitas memiliki tingkat toleransi kesalahan yang tinggi. Bahkan jika AI menjawab pertanyaan dengan salah, pengguna akan tetap menganggapnya "imut". Bagian aplikasi ini sudah sangat rumit, seperti " foto ID AI". Dalam sebagian besar skenario, AI diperlukan untuk secara otomatis membantu Anda menangani tugas yang lebih serius, bekerja sama dengan kondisi lingkungan lainnya, dan menangani bisnis jangka panjang dan berkelanjutan. Jangan membuat terlalu banyak kesalahan, jika tidak, orang harus berpartisipasi dalam jumlah besar, dan Tidak dapat benar-benar meningkatkan produktivitas.

Jelasnya, skenario seperti ini tidak dapat diselesaikan dengan baik dengan model tujuan umum yang besar dan kompleks saat ini.

Ambil contoh penulis seperti saya. Jika saya membiarkan model besar menulis naskah saya untuk saya, itu mungkin halusinasi. Saya harus memeriksa ulang peristiwa/berita/surat kabar yang disebutkan, yang lebih merepotkan daripada mencari informasi sendiri dan kurang akurat. Saat saya mendapat ide, saya harus menggunakan kata-kata cepat untuk menginspirasi saya dalam waktu yang lama, dan mungkin tidak ada yang bisa digunakan. Lambat dan melelahkan, jadi sebaiknya saya menulis ini diriku.

Ketidakmampuan untuk menyelesaikan tugas secara otomatis dalam satu langkah memerlukan banyak manusia untuk campur tangan dalam peninjauan. Hal ini saat ini merupakan kesulitan besar dalam penerapan model besar dalam skenario yang serius, dan juga secara langsung mempengaruhi kemajuan implementasi dan komersialisasi model besar .

Bagaimana cara melakukannya? Jika model besar ingin berperforma baik, mereka sangat membutuhkan sekelompok pembantu, dan itu adalah Agen AI.

Benar-benar membebaskan produktivitas, mengapa AI Agent begitu menakjubkan?

Bayangkan saja, jika sebuah model berukuran besar dapat bekerja sendiri 24 jam sehari, 7 hari sehari, tanpa campur tangan manusia, maka ia dapat menyelesaikan berbagai tugas dengan sendirinya.Orang hanya perlu sesekali kembali ke komputer atau kantor untuk melihat kinerjanya. Ini adalah cara yang benar untuk membuka model berukuran besar.

Pada konferensi GPT-4, OpenAI mendemonstrasikan kemampuannya untuk mengotomatisasi beberapa tugas, seperti membiarkan GPT4 mengenali sketsa untuk menghasilkan halaman web, dan memperbaiki kesalahan dalam kodenya sendiri selangkah demi selangkah.

Namun bagaimana kemampuan ini bisa digunakan oleh pengembang dan pengguna biasa? Banyak pengembang menjawab bahwa jika Anda menulis kode langsung menggunakan GPT4, Anda masih harus melakukan debug sendiri. Anda tidak dapat melihat gambar untuk menghasilkan kode untuk digunakan langsung. Terkadang lebih baik tidak menggunakannya.

Produsen model besar juga berada dalam dilema. Saya telah membuka API. Untuk mencapai kemampuan yang lebih profesional, tepat, dan halus, seseorang perlu mengembangkannya lebih lanjut, jadi saya menyerahkan tongkat estafet kepada Agen AI.

Agen AI adalah entitas AI otomatis di lingkungan yang memiliki empat karakteristik inti:

  1. Merasakan lingkungan sekitar melalui sensor. Lingkungan ini dapat bersifat virtual, seperti permainan kotak pasir, sistem pelatihan simulasi, simulator mengemudi otonom, dll., atau dapat bersifat fisik, seperti jalan, ruangan, jalur perakitan, dll.

  2. Mampu mengambil keputusan secara mandiri.

  3. Aktuator/efektor bekerja sama untuk melakukan tindakan.

  4. Pembelajaran dan kemajuan berdasarkan pada memaksimalkan kinerja dan mengoptimalkan hasil.

Dari sudut pandang ini, manusia sendiri sebenarnya adalah sejenis Agen AI "agen cerdas". Kita dapat merasakan perubahan di lingkungan luar melalui mata, telinga, kulit, dll., lalu mengambil keputusan melalui otak, berbicara dengan mulut, dan berjalan dengan kaki kita. Ambil tindakan dan terus sesuaikan dengan lingkungan eksternal berdasarkan umpan balik penghargaan.

Faktanya, Agen di AI memiliki logika yang sama. Ambil contoh Agen AI dalam skenario mengemudi otonom. Sensor diperlukan untuk mengumpulkan informasi dan merasakan faktor lingkungan seperti kendaraan jalan raya dan pejalan kaki. Sistem kemudian akan secara otomatis membuat keputusan dan menggerakkan akselerator, rem, dan peralatan lainnya untuk merespons dengan tepat. .

Ini juga dikenal sebagai model Agen AI PEAS. Mari kita buat tabel sederhana agar Anda dapat merasakannya:

Jadi, khususnya pada model besar, dampak apa yang dapat ditimbulkan oleh Agen AI? Ini terutama memiliki fungsi utama berikut:

Pertama, bongkar tugasnya.

Model besar perlu digabungkan dengan bidang tertentu, dan kebutuhan pengguna yang mereka hadapi relatif umum, dan prosesnya sering kali melibatkan beberapa langkah. Seperti yang dikatakan pengguna "harus ada cahaya", model besar yang terisolasi tidak mengetahui lampu apa yang ada di lingkungannya, juga tidak tahu cara mengendalikannya. Oleh karena itu, bahkan dengan model besar, model tersebut tidak dapat menangani hal yang tampaknya sederhana ini. tapi sebenarnya tugas yang rumit.

Agen AI memiliki kemampuan perencanaan tugas dan dapat secara otomatis memahami dan memutuskan bagaimana merencanakan langkah-langkah, mengalokasikan sumber daya, mengoptimalkan keputusan, dan kemudian menyelesaikan instruksi, meningkatkan efisiensi dan akurasi tugas pemrosesan model besar.

Dalam sebuah makalah yang ditulis oleh tim peneliti Google Brain, model bahasa besar diminta untuk mengungkapkan proses penalaran penguraian langkah-langkah tugas, yaitu "monolog batin", dan kemudian mengambil tindakan yang sesuai, yang secara tiba-tiba meningkatkan keakuratan tugas. jawaban model besar. Ini telah mencapai hasil SOTA pada beberapa kumpulan data, sehingga menyempurnakan model besar yang tidak masuk akal.

Kedua, eksekusi otomatis.

Agen AI dirancang untuk berpikir dan bertindak secara mandiri. Pengguna hanya perlu memberinya tugas dan membiarkannya melakukan tugasnya. Contoh khas AutoGPT adalah memesan pizza. Pengguna tidak perlu memasukkan alamat atau memilih rasa. Agen AI menangani semua langkah pemesanan dan menjalankannya secara otomatis. Orang dapat menonton dari samping dan memperbaikinya waktu jika ada kesalahan yang dilakukan.

Agen AI tidak hanya dapat menggunakan Internet, tetapi juga bekerja di lingkungan fisik, mengendalikan robot untuk mengirimkan pengiriman ekspres, mobil tanpa pengemudi, mengemudi otonom, dll.

Dengan AI Agent, interaksi antara pengguna dan model besar akan menjadi lebih alami, sederhana, dan cepat, mengurangi partisipasi manual dan benar-benar meningkatkan kualitas dan efisiensi. Misalnya, di dunia game, Agen AI dapat secara otomatis memulai dialog dengan pemain, memberikan interaksi terbuka, dan merancang alur cerita tanpa batas berdasarkan umpan balik pemain, sehingga membuat game lebih mudah diakses oleh ribuan orang; di dunia fisik, Agen AI dapat secara otomatis menghasilkan instruksi dan Mengoperasikan, menggerakkan badan mekanis, memberikan layanan tata graha kepada manusia, dan mengotomatiskan operasi di pabrik tanpa bergantung pada bimbingan manusia.

Ketiga, hemat sumber daya.

Seperti manusia, Agen AI dapat menggunakan alat, yaitu memanggil API, untuk menangani tugas yang lebih kompleks, yang sangat memperluas kemampuan model besar dan mengurangi pemborosan serta konsumsi sumber daya yang berlebihan.

Misalnya, saat menulis kode untuk AutoGPT, Anda perlu mengakses data sumber informasi kepemilikan, sumber daya komputasi, dll. Selama proses ini, Agen AI dapat secara otomatis menemukan API yang sesuai untuk dipanggil, sehingga menghindari pemborosan token API lainnya. Anda juga dapat belajar secara mandiri, mengoptimalkan hasilnya, dan memanggil API kembali jika Anda kurang puas.

Secara umum, untuk benar-benar menyelesaikan instruksi pengguna yang tidak jelas, seperti perencanaan perjalanan, model perlu memanggil beberapa API untuk menyelesaikan masalah. Agen AI dengan otomatisasi yang kuat tidak diragukan lagi dapat menghemat sumber daya, sehingga menghemat biaya bagi pengguna, sehingga membuat Aplikasi AI menjadi lebih menarik. dan kompetitif.

Keempat, menarik pengembang.

Untuk komersialisasi model besar, model API memerlukan partisipasi sebanyak mungkin kelompok pengembang, dan model industri juga memerlukan integrator ISV, penyedia layanan perangkat lunak, dll. Semua orang tahu bahwa sulit untuk menang dengan model dasar dari pabrikan besar, dan kami berharap dapat menemukan peluang dalam aplikasi tingkat atas yang terbagi. Agen AI dapat memecahkan masalah tertentu, meningkatkan efek model, dan menggerakkan sistem digital dan entitas fisik, sehingga sangat cocok untuk membangun aplikasi super.

Jika Agen AI seperti unit terkecil dari kehidupan AI, maka produsen model besar adalah pabrik yang membiakkan kehidupan, dan pengembang, vendor perangkat lunak, dll. seperti kelas pelatihan keterampilan, mengajari mereka beberapa keterampilan praktis dan berbeda dalam industri. dengan pengguna.

Oleh karena itu, model besar mana pun yang dapat membangun Agen AI dengan lebih baik akan menarik ekosistem pengembangan yang lebih besar dan lebih melekat pada pengguna B-end komersial, sehingga membentuk peluang besar di tingkat platform AI.

Singkatnya, Agen AI secara langsung mempengaruhi efek model, kualitas layanan, biaya implementasi, dan kemampuan ekologis model besar, dan akan menjadi kunci persaingan berbagai model besar di masa depan.

Jika Agen AI bekerja dengan baik, model sangat diperlukan.

Lalu Anda mungkin bertanya, bagaimana kita bisa menghasilkan Agen AI yang baik? Tantangan apa yang ditimbulkan hal ini bagi model berukuran besar?

Kami percaya bahwa agar Agen AI dapat diimplementasikan, model besar perlu melakukan tugas-tugas berikut, yang juga akan menjadi fokus kompetisi di masa depan:

  1. Model dasar.

Kemampuan dan efek Agen AI ditentukan oleh kemampuan model dasar yang mendasarinya. Agen AI mungkin tidak dapat menggunakan kemampuan model dasar, namun Agen AI mungkin tidak memiliki kemampuan yang tidak dimiliki model dasar.

Mengambil tugas bahasa sebagai contoh, GPT-4 memberikan kemampuan pemahaman bahasa alami yang kuat, namun saat ini hanya sedikit dari kemampuan tersebut yang benar-benar diterapkan pada Agen dan produk AI. Beberapa NPC dalam game masih belum memiliki kemampuan untuk mengambil keputusan secara mandiri.

Contoh lain, meskipun GPT-4 bersifat multi-modal, ia hanya membuka API bahasa. Oleh karena itu, developer yang ingin menggunakan kemampuan multi-modal GPT4 untuk membangun Agen AI belum dapat melakukannya, dan modalitas lain seperti gambar dan audio tidak dapat dilakukan. Berdasarkan informasi yang ada, pemahaman dan dampak Agen AI terhadap lingkungan masih perlu ditingkatkan.

Oleh karena itu, apakah itu model sumber terbuka atau model sumber tertutup, jika ingin dikomersialkan melalui ekonomi API, kemampuan model dasar akan berhubungan langsung dengan kualitas Agen AI, dan masih ada ruang untuk perbaikan.

2. Pengetahuan data.

Untuk menjadi Agen AI yang baik, mengumpulkan dan menggunakan data adalah prasyarat dasar. Bagi pengembang, jumlah data yang diperlukan untuk tugas-tugas digital tidak lagi menjadi masalah, namun ketika mengembangkan agen AI di dunia fisik, biaya data menjadi sangat tinggi. Data kendali robot umumnya hanya dapat dikumpulkan sendiri, melalui simulator atau kumpulan robot fisik di tempat. Namun bagaimanapun juga, simulator tersebut bukanlah lingkungan nyata, dan efek pelatihannya mungkin tidak baik. Namun, membeli ratusan robot dan drone untuk benar-benar digunakan di jalan raya dan ke pabrik untuk mengumpulkan data memerlukan banyak investasi dalam hal pengadaan. biaya, batasan kebijakan, implementasi aktual, dll. Kesulitan.

Pada titik ini, produsen model besar dengan keunggulan data, seperti keunggulan mengemudi otonom Google dan Baidu, serta keunggulan data dari Microsoft, Google, Sogou, Baidu, dan bisnis pencarian lainnya, mungkin dapat mengurangi beberapa hambatan bagi pengembang untuk mengeksplorasi Agen AI , dan juga akan Membangun penghalang untuk model besar dari vendor tersebut.

  1. Dukungan produk.

Harus diakui bahwa peluang penerapan model besar yang diwakili oleh Agen AI masih dalam tahap awal, teknologinya belum sepenuhnya matang, dan eksplorasi komersial baru saja mengambil langkah kecil. Bagi pengembang, penyedia layanan perangkat lunak, dll., hal yang lebih penting dan perlu dipertimbangkan lebih awal daripada cara mengimplementasikan Agen AI dalam kode adalah membayangkan ke mana Agen AI harus pergi:

Seperti apa tampilannya? Siapa namamu? Apakah ada jenis kelaminnya? Kepribadian seperti apa yang Anda gunakan untuk berbicara dengan pengguna? Apa saja kasus penggunaannya? Kesulitan spesifik apa yang akan Anda temui? Bagaimana cara mengevaluasi keberhasilan Agen AI?

Ini lebih merupakan "tanah tak bertuan" di tingkat produk dan tingkat komersial. Untuk memungkinkan pengembang melepaskan imajinasi mereka dan mencoba menciptakan Agen AI di berbagai lingkungan dan tugas, produsen model besar perlu membuka ekosistem bisnis mereka sendiri dan menyediakan layanan yang lebih kaya dan solusi yang lebih nyaman, berfungsi untuk mengurangi risiko trial and error bagi pengembang, meningkatkan intensitas docking dengan pengguna bisnis, dan menghasilkan lebih banyak pilihan bisnis dan kasus implementasi.

Secara keseluruhan, bidang ini masih sangat baru, dan Agen AI belum memberikan dampak yang jelas terhadap industri model besar. Namun, Agen AI dapat dipastikan akan menghilangkan sejumlah besar interaksi rumit antara manusia dan sistem AI, dan hal ini sedang terjadi. .

Semakin banyak Agen AI yang didorong ke komunitas dan pengguna. Mereka belajar, berubah, dan berkembang. Mungkin dalam beberapa bulan, kita akan melihat kematangan dan ledakan Agen AI, yang pasti akan memicu perombakan lain di bidang model besar.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)