Mô hình đa phương thức toàn diện của Alibaba Qwen3.5-Omni đã ra mắt

DeepFlowTech · 2026-03-30T13:49:22+00:00

Alibaba Qianwen ra mắt mô hình đa phương thức toàn diện Qwen3.5-Omni, hỗ trợ ngữ cảnh dài 256k và đầu vào âm thanh hơn 10 giờ, thể hiện khả năng cảm nhận và sinh tạo đa phương thức xuất sắc, nâng cao chức năng đa ngôn ngữ, hỗ trợ nhận diện giọng nói 113 loại và sinh giọng 36 loại.

DeepFlowTech

2026-03-30 13:49:22

Đang tạo bản tóm tắt

Tin nhắn của Deep Tide TechFlow, ngày 30 tháng 3, theo báo cáo của Jinfo Data, Alibaba Qianwen đã công bố việc ra mắt mô hình đa phương thức toàn năng Qwen3.5-Omni. Dòng Qwen3.5-Omni bao gồm phiên bản Instruct với ba kích thước Plus, Flash và Light, hỗ trợ ngữ cảnh dài 256k. Mô hình hỗ trợ đầu vào âm thanh hơn 10 giờ và đầu vào video và âm video 720P (1FPS) dài hơn 400 giây. Mô hình được huấn luyện đa phương thức nguyên bản trên khối lượng dữ liệu văn bản, hình ảnh lớn và dữ liệu âm video có hơn 100 triệu giờ, thể hiện khả năng cảm nhận và tạo đa phương thức xuất sắc. So với Qwen3-Omni, năng lực đa ngôn ngữ của Qwen3.5-Omni được tăng cường đáng kể, có thể hỗ trợ nhận dạng giọng nói cho 113 ngôn ngữ và phương ngữ, và tạo giọng nói cho 36 ngôn ngữ và phương ngữ.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.