Pesan BlockBeats, 30 Maret, Alibaba Qianwen mengumumkan peluncuran model large multimodal Qwen3.5-Omni. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran, yaitu Plus, Flash, dan Light, mendukung konteks panjang 256k; model mendukung input audio lebih dari 10 jam dan input audio-visual lebih dari 400 detik pada 720P (1FPS). Model melakukan pretraining multimodal native pada volume besar data teks, visual, serta audio-visual yang melebihi 100 juta jam; model ini menunjukkan kemampuan persepsi dan generasi multimodal yang sangat baik. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan, mampu mendukung pengenalan suara untuk 113 bahasa dan dialek serta pembangkitan suara untuk 36 bahasa dan dialek. (Jin10)