В России ускорили генерацию изображений нейросетями до долей секунды

НИУ ВШЭ: предложен новый метод ускорения диффузионных моделей нейросетей

Shutterstock

Ученые НИУ ВШЭ совместно с Yandex Research разработали метод, позволяющий значительно ускорить работу диффузионных моделей — одного из ключевых инструментов генерации изображений. Об этом «Газете.Ru» сообщили в пресс-службе образовательного учреждения.

Диффузионные модели сегодня задают стандарт в задачах генерации изображений, однако их широкое применение ограничено высокой вычислительной нагрузкой: обычно для создания одного изображения требуется десятки последовательных шагов.

Новый метод, получивший название Scale-wise Distillation of Diffusion Models (SwD), позволяет сократить это время до 0,3–0,4 секунды без потери качества.

Подход основан на том, что на ранних этапах генерации формируется лишь общая структура изображения, а детали появляются позже. Исследователи предложили сначала работать с изображением в низком разрешении, постепенно уточняя его по мере снижения шума. Это позволяет избежать лишних вычислений.

Второй ключевой элемент — дистилляция моделей. В этом процессе более простая «модель-студент» обучается воспроизводить результат сложной «модели-учителя», такой как FLUX или Stable Diffusion 3.5. В результате число шагов генерации сокращается с десятков до 4–6.

Для обучения ученые использовали новую функцию потерь — Maximum Mean Discrepancy (MMD). Она сравнивает внутренние представления изображений в моделях-учителях и студентах, не требуя дополнительных вспомогательных нейросетей. Это упрощает обучение и ускоряет его: в экспериментах время одной итерации сократилось в семь раз.

По словам разработчиков, предложенный метод делает современные генеративные модели быстрее и дешевле в использовании, что открывает путь к их более широкому применению — от дизайна и медиа до научных задач.

Ранее российские ученые разработали метод управления группами малых спутников с использованием электрического заряда.