Разработчики Kandinsky выложили в открытый доступ KVAE-2.0. KVAE-2.0 представляет собой семейство токенизаторов для диффузионных моделей генерации изображений и видео. Как сообщили информационной службе Хабра в пресс‑службе «Сбера», новое решение позволяет сжимать видео до четырёх раз сильнее по сравнению с предыдущей версией. При этом качество восстановления изображения становится только лучше. Для разработчиков и исследователей это означает, что обучение диффузионных моделей ускоряется на порядок. Сами решения на базе искусственного интеллекта работают качественнее. Требования к вычислительной инфраструктуре снижаются. Читать далее