Meta Memperkenalkan DINOv3: Model Penglihatan Mandiri Canggih Untuk Analisis Visual yang Skalabel dan Presisi Tinggi

Secara Singkat

DINOv3 adalah model visi komputer mandiri yang canggih di mana satu backbone yang dibekukan menghasilkan fitur gambar resolusi tinggi dan melampaui solusi khusus di berbagai tugas prediksi padat yang sudah mapan.

Meta Memperkenalkan DINOv3: Model Visibilitas Mandiri Lanjutan yang Mengungguli Solusi Khusus dalam Tugas Prediksi Padat

Divisi riset perusahaan teknologi Meta, yang mengembangkan teknologi AI dan augmented reality, Meta AI telah memperkenalkan DINOv3, sebuah model visi komputer umum yang canggih yang dilatih menggunakan pembelajaran mandiri (SSL) untuk menghasilkan fitur visual berkualitas tinggi. Untuk pertama kalinya, satu backbone visi beku melampaui model-model khusus dalam berbagai tugas prediksi padat yang telah ditetapkan, termasuk deteksi objek dan segmentasi semantik.

DINOv3 mencapai kinerja ini melalui metode SSL canggih yang menghilangkan kebutuhan akan data berlabel, mengurangi waktu pelatihan dan kebutuhan sumber daya sambil memungkinkan model untuk skala hingga 1,7 miliar gambar dan 7 miliar parameter. Pendekatan bebas label ini membuat model cocok untuk aplikasi di mana anotasi terbatas, mahal, atau tidak tersedia. Misalnya, backbone DINOv3 yang dilatih sebelumnya pada citra satelit telah menunjukkan hasil yang kuat pada tugas-tugas hilir seperti estimasi tinggi kanopi.

Model ini diharapkan dapat meningkatkan aplikasi saat ini dan memungkinkan aplikasi baru di berbagai sektor seperti kesehatan, pemantauan lingkungan, kendaraan otonom, ritel, dan manufaktur, menawarkan akurasi dan efisiensi yang lebih baik dalam pemahaman visual skala besar.

DINOv3 dirilis dengan serangkaian backbone open-source lengkap di bawah lisensi komersial, termasuk backbone yang fokus pada satelit yang dilatih menggunakan citra MAXAR. Sebuah subset dari kepala evaluasi hilir juga dibagikan untuk memungkinkan peneliti mereproduksi dan memperluas hasilnya. Buku catatan contoh dan dokumentasi rinci disediakan untuk membantu komunitas mulai bekerja dengan DINOv3 segera.

DINOv3: Membuka Aplikasi Berpengaruh Tinggi Melalui Pembelajaran Mandiri

Menurut Meta AI, DINOv3 merupakan kemajuan yang signifikan dalam pembelajaran mandiri (SSL), menunjukkan untuk pertama kalinya bahwa model SSL dapat melampaui kinerja model yang diawasi lemah di seluruh rangkaian tugas yang luas. Sementara versi DINO sebelumnya telah menghasilkan hasil yang kuat dalam tugas prediksi padat seperti segmentasi dan estimasi kedalaman monokular, DINOv3 membangun di atas fondasi ini dan mencapai tingkat kinerja yang lebih tinggi.

DINOv3: Membuka Aplikasi Berdampak Tinggi Melalui Pembelajaran Mandiri

DINOv3 mengembangkan algoritma DINO asli dengan menghilangkan kebutuhan akan input metadata, menggunakan lebih sedikit komputasi pelatihan dibandingkan pendekatan sebelumnya, sambil tetap memproduksi model dasar visi berkinerja tinggi. Peningkatan dalam DINOv3 memungkinkan hasil mutakhir pada tugas hilir seperti deteksi objek, bahkan ketika bobot model tetap beku, menghilangkan kebutuhan akan penyetelan halus spesifik tugas dan memungkinkan aplikasi yang lebih serbaguna dan efisien.

Karena metodologi DINO tidak terikat pada jenis gambar tertentu, ia dapat diterapkan di berbagai domain di mana pelabelan mahal atau tidak praktis. Iterasi sebelumnya, seperti DINOv2, telah memanfaatkan sejumlah besar data yang tidak terlabel untuk aplikasi medis, termasuk histologi, endoskopi, dan pencitraan. Untuk citra satelit dan udara, di mana volume dan kompleksitas data membuat pelabelan manual tidak mungkin, DINOv3 memungkinkan pelatihan satu model backbone yang dapat diterapkan di berbagai sumber satelit, mendukung kasus penggunaan yang lebih luas dalam pemantauan lingkungan, perencanaan kota, dan respons bencana.

DINOv3 sudah menunjukkan dampak praktis. World Resources Institute (WRI) menggunakan model ini untuk memantau deforestasi dan membimbing upaya restorasi, memungkinkan kelompok lokal untuk lebih baik melindungi ekosistem. Dengan menganalisis citra satelit untuk mendeteksi kehilangan pohon dan perubahan penggunaan lahan, DINOv3 meningkatkan akurasi verifikasi pembiayaan iklim, mengurangi biaya transaksi dan mempercepat pendanaan untuk proyek kecil dan lokal. Dalam satu contoh, menggunakan DINOv3 yang dilatih pada citra satelit dan udara mengurangi rata-rata kesalahan dalam mengukur tinggi kanopi pohon di suatu wilayah di Kenya dari 4,1 meter menjadi 1,2 meter, memungkinkan WRI untuk meningkatkan dukungan bagi ribuan petani dan inisiatif konservasi dengan lebih efektif.

VSN-2.08%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)