Stanford Bilgisayar Bilimleri Profesörü Fei-Fei Li, yapay zekanın ilerlemesinin artık fiziksel alanı anlayamayan sistemlerle sınırlı olduğunu söyledi.
Dünya modelleri, ortamları simüle etmek ve sahnelerin zamanla nasıl değişeceğini tahmin etmek için tasarlanmıştır.
Marble gibi erken prototipler, bu modellerin yaratıcı çalışmaları, robotik ve bilimi nasıl yeniden şekillendirebileceğine dair ipuçları veriyor.
Decrypt'in Sanat, Moda ve Eğlence Merkezi.
SCENE'i Keşfet
Robotlar ve çok modlu yapay zeka hala fiziksel dünyayı kavrayamıyor; bu, önde gelen bir araştırmacının söylediğine göre, alanın şu anda en büyük engeli.
Stanford bilgisayar bilimcisi ve modern bilgisayarla görmenin öncüsü olarak kabul edilen Fei-Fei Li, AI ile fiziksel gerçeklik arasındaki farkın teknolojinin en acil sorunu haline geldiğini söyledi ve bunun kapatılmasının yalnızca dil değil, aynı zamanda mekansal akıl yürütme etrafında inşa edilmiş sistemler gerektireceğini savundu.
AI, metin tabanlı öğrenmenin sınırlarına hızla yaklaşıyor ve ilerleme nihayetinde "dünya modelleri"ne bağlı olacak, dedi Li, Pazartesi günü yayınlanan bir raporda.
“Mekansal zekayı açmanın merkezinde dünya modellerinin geliştirilmesi var—LLM'lerden tamamen farklı bir dizi zorluğu karşılamak zorunda olan yeni bir nesil üretken AI,” Li, X'te yazdı. “Bu modeller, fiziksel yasalara uyan mekansal olarak tutarlı dünyalar üretmeli, görüntülerden eylemlere kadar çok modlu girdileri işlemesi ve bu dünyaların zamanla nasıl evrileceğini veya onlarla nasıl etkileşimde bulunulacağını tahmin etmelidir.”
Bu modeller neyin nesi?
“Dünya modelleri” kavramı, İskoç filozof ve psikolog Kenneth Craik'in bilişsel bilim araştırmaları yaptığı 1940'ların başlarına kadar uzanmaktadır.
David Ha ve Jürgen Schmidhuber'in 2018 tarihli makalesinin, bir sinir ağının bir ortamın kompakt bir iç modelini öğrenip bunu planlama ve kontrol için bir simülatör olarak kullanabileceğini göstermesinin ardından, modern yapay zekada fikir yeniden gündeme geldi.
Li, dünya modellerinin önemli olduğunu savundu çünkü robotlar ve çok modlu sistemler hâlâ yerleşik mekansal akıl yürütme ile mücadele ediyor, bu da onların mesafeleri ve sahne değişikliklerini değerlendirmelerini veya temel fiziksel sonuçları tahmin etmelerini engelliyor.
“İnsan işbirlikçileri olarak robotlar, ister laboratuvar masasında bilim insanlarına yardım etsinler, ister yalnız yaşayan yaşlılara destek versinler, iş gücünün daha fazla iş gücüne ve verimliliğe ihtiyacı olan bir kısmını genişletebilir,” diye yazdı Li. Gerçek ortamlar, mevcut makinelerin yakalayamadığı kuralları takip eder, diye savunuyor Li.
Ağırlığın hareketi şekillendirmesinden, malzemelerin ışığı etkilemesine kadar, bunu çözmek, mekansal hafızayı depolayabilen ve sahneleri iki boyuttan daha fazla boyutta modelleyebilen sistemler gerektirir.
Eylül ayında, Li'nin şirketi World Labs, metin veya görsel istemlerden keşfedilebilir üç boyutlu ortamlar üreten Marble'ın beta sürümünü piyasaya sürdü.
Kullanıcılar, bu dünyalarda zaman sınırlamaları veya sahne kaymaları olmadan dolaşabilirler ve şirketin iddiasına göre, ortamlar değişmeden ve parçalanmadan tutarlı kalmıştır.
“Mermer, gerçekten mekansal olarak zeki bir dünya modeli oluşturma yolunda yalnızca ilk adımımızdır,” diye yazdı Li. “İlerleme hızlandıkça, araştırmacılar, mühendisler, kullanıcılar ve iş liderleri onun olağanüstü potansiyelini tanımaya başlıyor. Gelecek nesil dünya modelleri, makinelerin mekansal zekayı tamamen yeni bir seviyede elde etmesini sağlayacak—bu, günümüz yapay zeka sistemlerinden hala büyük ölçüde eksik olan temel yetenekleri açığa çıkaracak bir başarıdır.”
Li, dünya modeli kullanım durumlarının, çevrelerin nasıl davrandığına dair AI'ya içsel bir anlayış kazandırdığı için bir dizi uygulamayı desteklemeyi içerdiğini söyledi.
Yaratıcılar, bunları gerçek zamanlı olarak sahneleri keşfetmek için kullanabilir, robotlar bunlara güvenerek nesneleri daha güvenli bir şekilde yönlendirebilir ve bilim ve sağlık alanındaki araştırmacılar, mekansal simülasyonlar gerçekleştirebilir veya görüntüleme ve laboratuvar otomasyonunu geliştirebilir.
Li, mekansal zeka araştırmalarını erken biyolojik çalışmalara bağlayarak, insanların dil geliştirmeden çok önce algılayıp hareket etmeyi öğrendiğini belirtti.
“Yazılı dilden çok önce, insanlar hikayeler anlattı—bunları mağara duvarlarına boyadılar, nesiller boyunca aktardılar, paylaşılan anlatılar üzerine tamamen kültürler inşa ettiler,” diye yazdı. “Hikayeler, dünyayı anlamanın, mesafeler ve zaman boyunca bağlantı kurmanın, insan olmanın ne anlama geldiğini keşfetmenin ve en önemlisi, hayatın ve sevginin içinde anlam bulmanın yoludur.”
Li, AI'nın fiziksel dünyada işlev görebilmesi için aynı temele ihtiyaç duyduğunu söyledi ve rolünün insanları desteklemek, yerlerine geçmek değil olması gerektiğini savundu. Ancak ilerleme, dünyanın nasıl çalıştığını anlayan modellerin varlığına bağlı olacak, yalnızca onu tanımlamakla kalmayacak.
“Yapay zekanın bir sonraki sınırı Mekansal Zeka, görmeyi akla, algıyı harekete ve hayali yaratmaya dönüştürecek bir teknoloji,” dedi Li.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Yapay Zeka’nın İlerleyişi Artık Fiziksel Gerçekliği Kavrayan ‘Dünya Modelleri’ne Bağlıdır
Kısaca
Decrypt'in Sanat, Moda ve Eğlence Merkezi.
SCENE'i Keşfet
Robotlar ve çok modlu yapay zeka hala fiziksel dünyayı kavrayamıyor; bu, önde gelen bir araştırmacının söylediğine göre, alanın şu anda en büyük engeli.
Stanford bilgisayar bilimcisi ve modern bilgisayarla görmenin öncüsü olarak kabul edilen Fei-Fei Li, AI ile fiziksel gerçeklik arasındaki farkın teknolojinin en acil sorunu haline geldiğini söyledi ve bunun kapatılmasının yalnızca dil değil, aynı zamanda mekansal akıl yürütme etrafında inşa edilmiş sistemler gerektireceğini savundu.
AI, metin tabanlı öğrenmenin sınırlarına hızla yaklaşıyor ve ilerleme nihayetinde "dünya modelleri"ne bağlı olacak, dedi Li, Pazartesi günü yayınlanan bir raporda.
“Mekansal zekayı açmanın merkezinde dünya modellerinin geliştirilmesi var—LLM'lerden tamamen farklı bir dizi zorluğu karşılamak zorunda olan yeni bir nesil üretken AI,” Li, X'te yazdı. “Bu modeller, fiziksel yasalara uyan mekansal olarak tutarlı dünyalar üretmeli, görüntülerden eylemlere kadar çok modlu girdileri işlemesi ve bu dünyaların zamanla nasıl evrileceğini veya onlarla nasıl etkileşimde bulunulacağını tahmin etmelidir.”
Bu modeller neyin nesi?
“Dünya modelleri” kavramı, İskoç filozof ve psikolog Kenneth Craik'in bilişsel bilim araştırmaları yaptığı 1940'ların başlarına kadar uzanmaktadır.
David Ha ve Jürgen Schmidhuber'in 2018 tarihli makalesinin, bir sinir ağının bir ortamın kompakt bir iç modelini öğrenip bunu planlama ve kontrol için bir simülatör olarak kullanabileceğini göstermesinin ardından, modern yapay zekada fikir yeniden gündeme geldi.
Li, dünya modellerinin önemli olduğunu savundu çünkü robotlar ve çok modlu sistemler hâlâ yerleşik mekansal akıl yürütme ile mücadele ediyor, bu da onların mesafeleri ve sahne değişikliklerini değerlendirmelerini veya temel fiziksel sonuçları tahmin etmelerini engelliyor.
“İnsan işbirlikçileri olarak robotlar, ister laboratuvar masasında bilim insanlarına yardım etsinler, ister yalnız yaşayan yaşlılara destek versinler, iş gücünün daha fazla iş gücüne ve verimliliğe ihtiyacı olan bir kısmını genişletebilir,” diye yazdı Li. Gerçek ortamlar, mevcut makinelerin yakalayamadığı kuralları takip eder, diye savunuyor Li.
Ağırlığın hareketi şekillendirmesinden, malzemelerin ışığı etkilemesine kadar, bunu çözmek, mekansal hafızayı depolayabilen ve sahneleri iki boyuttan daha fazla boyutta modelleyebilen sistemler gerektirir.
Eylül ayında, Li'nin şirketi World Labs, metin veya görsel istemlerden keşfedilebilir üç boyutlu ortamlar üreten Marble'ın beta sürümünü piyasaya sürdü.
Kullanıcılar, bu dünyalarda zaman sınırlamaları veya sahne kaymaları olmadan dolaşabilirler ve şirketin iddiasına göre, ortamlar değişmeden ve parçalanmadan tutarlı kalmıştır.
“Mermer, gerçekten mekansal olarak zeki bir dünya modeli oluşturma yolunda yalnızca ilk adımımızdır,” diye yazdı Li. “İlerleme hızlandıkça, araştırmacılar, mühendisler, kullanıcılar ve iş liderleri onun olağanüstü potansiyelini tanımaya başlıyor. Gelecek nesil dünya modelleri, makinelerin mekansal zekayı tamamen yeni bir seviyede elde etmesini sağlayacak—bu, günümüz yapay zeka sistemlerinden hala büyük ölçüde eksik olan temel yetenekleri açığa çıkaracak bir başarıdır.”
Li, dünya modeli kullanım durumlarının, çevrelerin nasıl davrandığına dair AI'ya içsel bir anlayış kazandırdığı için bir dizi uygulamayı desteklemeyi içerdiğini söyledi.
Yaratıcılar, bunları gerçek zamanlı olarak sahneleri keşfetmek için kullanabilir, robotlar bunlara güvenerek nesneleri daha güvenli bir şekilde yönlendirebilir ve bilim ve sağlık alanındaki araştırmacılar, mekansal simülasyonlar gerçekleştirebilir veya görüntüleme ve laboratuvar otomasyonunu geliştirebilir.
Li, mekansal zeka araştırmalarını erken biyolojik çalışmalara bağlayarak, insanların dil geliştirmeden çok önce algılayıp hareket etmeyi öğrendiğini belirtti.
“Yazılı dilden çok önce, insanlar hikayeler anlattı—bunları mağara duvarlarına boyadılar, nesiller boyunca aktardılar, paylaşılan anlatılar üzerine tamamen kültürler inşa ettiler,” diye yazdı. “Hikayeler, dünyayı anlamanın, mesafeler ve zaman boyunca bağlantı kurmanın, insan olmanın ne anlama geldiğini keşfetmenin ve en önemlisi, hayatın ve sevginin içinde anlam bulmanın yoludur.”
Li, AI'nın fiziksel dünyada işlev görebilmesi için aynı temele ihtiyaç duyduğunu söyledi ve rolünün insanları desteklemek, yerlerine geçmek değil olması gerektiğini savundu. Ancak ilerleme, dünyanın nasıl çalıştığını anlayan modellerin varlığına bağlı olacak, yalnızca onu tanımlamakla kalmayacak.
“Yapay zekanın bir sonraki sınırı Mekansal Zeka, görmeyi akla, algıyı harekete ve hayali yaratmaya dönüştürecek bir teknoloji,” dedi Li.