Qwen3-Omni-Flash: китайская модель догнала Gemini 2.5 Pro по аудио — и стоит в 3 раза дешевле

Wait 5 sec.

Alibaba выпустила обновленную версию Qwen3-Omni-Flash — мультимодальную модель, которая понимает текст, изображения, аудио и видео, а также отвечает голосом в реальном времени. По ключевым аудио-бенчмаркам она догоняет Gemini 2.5 Pro и обгоняет GPT-4o (до сих пор используется как основной голосовой ассистент в ChatGPT). Читать далее