Qwen3.5-Omni model multimodal lengkap Alibaba Qianwen telah diluncurkan

BlockBeatNews

Pesan BlockBeats, 30 Maret, Alibaba Qianwen mengumumkan peluncuran model large multimodal Qwen3.5-Omni. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran, yaitu Plus, Flash, dan Light, mendukung konteks panjang 256k; model mendukung input audio lebih dari 10 jam dan input audio-visual lebih dari 400 detik pada 720P (1FPS). Model melakukan pretraining multimodal native pada volume besar data teks, visual, serta audio-visual yang melebihi 100 juta jam; model ini menunjukkan kemampuan persepsi dan generasi multimodal yang sangat baik. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan, mampu mendukung pengenalan suara untuk 113 bahasa dan dialek serta pembangkitan suara untuk 36 bahasa dan dialek. (Jin10)

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar