Pindai untuk Mengunduh Aplikasi Gate
qrCode
Opsi Unduhan Lainnya
Jangan ingatkan saya lagi hari ini

Kemajuan AI Sekarang Bergantung pada 'Model Dunia' yang Memahami Realitas Fisik

Singkatnya

  • Profesor Ilmu Komputer Stanford, Fei-Fei Li, mengatakan bahwa kemajuan AI sekarang dibatasi oleh sistem yang tidak dapat memahami ruang fisik.
  • Model dunia dirancang untuk mensimulasikan lingkungan dan memprediksi bagaimana adegan berubah seiring waktu.
  • Prototipe awal seperti Marble menunjukkan bagaimana model-model ini dapat mengubah pekerjaan kreatif, robotika, dan ilmu pengetahuan.

Pusat Seni, Fashion, dan Hiburan Decrypt.


Temukan SCENE

Robot dan kecerdasan buatan multimodal masih belum dapat memahami dunia fisik, sebuah kekurangan yang menurut salah satu peneliti terkemuka sekarang menjadi hambatan terbesar di bidang ini.

Fei-Fei Li, ilmuwan komputer dari Stanford yang dianggap sebagai pelopor visi komputer modern, mengatakan bahwa kesenjangan antara AI dan realitas fisik telah menjadi masalah paling mendesak dalam teknologi dan berargumen bahwa menutupnya memerlukan sistem yang dibangun di sekitar penalaran spasial daripada hanya bahasa.

AI semakin mendekati batas pembelajaran berbasis teks, dan kemajuan akhirnya akan bergantung pada “model dunia,” kata Li dalam sebuah laporan yang diterbitkan pada hari Senin.

“Di inti dari mengunlock kecerdasan spasial adalah pengembangan model dunia—sejenis AI generatif baru yang harus menghadapi seperangkat tantangan yang secara fundamental berbeda dibandingkan LLMs,” tulis Li di X. “Model-model ini harus menghasilkan dunia yang konsisten secara spasial yang mematuhi hukum fisika, memproses masukan multimodal dari gambar hingga tindakan, dan memprediksi bagaimana dunia tersebut berkembang atau berinteraksi seiring waktu.”

Apa sebenarnya model-model ini?

Konsep “model dunia” berasal dari awal 1940-an, ketika filsuf dan psikolog Skotlandia Kenneth Craik melakukan penelitian ilmu kognitif.

Ide tersebut muncul kembali dalam AI modern setelah makalah David Ha dan Jürgen Schmidhuber pada tahun 2018 menunjukkan bahwa jaringan saraf dapat mempelajari model internal yang kompak dari suatu lingkungan dan menggunakannya sebagai simulator untuk perencanaan dan kontrol.

Li berpendapat bahwa model dunia itu penting karena robot dan sistem multimodal masih kesulitan dengan penalaran spasial yang terhubung, sehingga mereka tidak mampu menilai jarak dan perubahan pemandangan, atau memprediksi hasil fisik dasar.

“Robot sebagai kolaborator manusia, baik yang membantu ilmuwan di meja lab atau membantu lansia yang hidup sendirian, dapat memperluas sebagian dari angkatan kerja yang sangat membutuhkan lebih banyak tenaga kerja dan produktivitas,” tulis Li. Lingkungan nyata mengikuti aturan yang tidak dapat ditangkap oleh mesin saat ini, argumen Li.

Dari gravitasi yang membentuk gerakan hingga material yang mempengaruhi cahaya, menyelesaikan ini memerlukan sistem yang mampu menyimpan memori spasial dan memodelkan adegan dalam lebih dari dua dimensi.

Pada bulan September, perusahaan Li, World Labs, merilis beta untuk Marble, sebuah model dunia awal yang menghasilkan lingkungan tiga dimensi yang dapat dijelajahi dari teks atau gambar sebagai prompt.

Pengguna dapat menjelajahi dunia ini tanpa batasan waktu atau pergeseran adegan, dan lingkungan tetap konsisten bukannya berubah bentuk atau hancur, klaim perusahaan.

“Marble hanyalah langkah pertama kami dalam menciptakan model dunia yang benar-benar cerdas secara spasial,” tulis Li. “Seiring percepatan kemajuan, peneliti, insinyur, pengguna, dan pemimpin bisnis mulai menyadari potensi luar biasa ini. Generasi berikutnya dari model dunia akan memungkinkan mesin untuk mencapai kecerdasan spasial pada tingkat yang sama sekali baru—sebuah pencapaian yang akan membuka kemampuan penting yang masih sebagian besar tidak ada dalam sistem AI saat ini.”

Li mengatakan bahwa kasus penggunaan model dunia mencakup mendukung berbagai aplikasi karena mereka memberikan AI pemahaman internal tentang bagaimana lingkungan berperilaku.

Para pembuat dapat menggunakannya untuk menjelajahi adegan secara real-time, robot dapat mengandalkannya untuk bernavigasi dan menangani objek dengan lebih aman, dan peneliti di bidang sains dan kesehatan dapat menjalankan simulasi spasial atau meningkatkan pencitraan dan otomatisasi laboratorium.

Li mengaitkan penelitian kecerdasan spasial kembali ke studi biologi awal, mencatat bahwa manusia belajar untuk mempersepsi dan bertindak jauh sebelum mereka mengembangkan bahasa.

“Jauh sebelum bahasa tulisan, manusia menceritakan kisah—melukisnya di dinding gua, meneruskannya melalui generasi, membangun seluruh budaya berdasarkan narasi yang dibagikan,” tulisnya. “Kisah adalah cara kita memahami dunia, terhubung melintasi jarak dan waktu, mengeksplorasi apa artinya menjadi manusia, dan yang paling penting, menemukan makna dalam hidup dan cinta dalam diri kita sendiri.”

Li mengatakan AI memerlukan dasar yang sama untuk berfungsi di dunia fisik dan berargumen bahwa perannya seharusnya untuk mendukung orang, bukan menggantikan mereka. Namun, kemajuan akan tergantung pada model yang memahami bagaimana dunia bekerja daripada hanya mendeskripsikannya.

“Frontier berikutnya dari AI adalah Kecerdasan Spasial, sebuah teknologi yang akan mengubah penglihatan menjadi penalaran, persepsi menjadi tindakan, dan imajinasi menjadi kreasi,” kata Li.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)