Alibaba выпустила мультимодальный ИИ Qwen3.5-Omni — он пишет код по видеозаписи экрана

Wait 5 sec.

Команда Qwen (Alibaba Cloud) представила Qwen3.5-Omni — новое поколение мультимодальной модели, которая принимает на вход текст, изображения, аудио и видео, а на выходе генерирует текст и речь в реальном времени. Модель выпущена в трех размерах — Plus, Flash и Light — и доступна через Offline API и Realtime API. Читать далее