Размер шрифта
Новости Спорт
Выйти
Операция США в Венесуэле и захват МадуроГибель детей в роддоме НовокузнецкаПротесты в Иране — 2026
Новости технологий

В Microsoft показали, как созданная нейросетью Мона Лиза читает рэп

arXiv: ИИ-инструмент VASA-1 превращает изображения в реалистичную анимацию
{
    "_essence": "video",
    "media_position": "top",
    "uid": "_id_video_media_22830854_rnd_8",
    "video_id": "record::138414a3-b057-4824-a3b9-ab2c68848a6d"
}

Команда исследователей искусственного интеллекта Research Asia компании Microsoft разработала приложение искусственного интеллекта (ИИ), преобразующее неподвижное изображение человека в правдоподобную анимацию. При наложении звуковой дорожки получившийся цифровой аватар проговорит или пропоет текст с правильной мимикой. Результаты работы опубликованы на портале научных материалов arXiv.

Новую нейросеть назвали VASA-1. Создатели проекта отметили, что ИИ может работать как с фотографиями, так и с рисунками. В качестве демонстрации возможностей группа представила ряд видеороликов, на которых созданные VASA-1 цифровые аватары поют и разговаривают. А «Мону Лизу» Леонардо да Винчи алгоритмы заставили зачитать рэп.

В каждой анимации выражение лица меняется вместе со словами, подчеркивая сказанное. Исследователи также отметили, что, несмотря на реалистичность видео, более пристальное рассмотрение может выявить недостатки и свидетельства того, что они были созданы искусственно.

По словам специалистов, инструмент генерирует видео разрешением 512 на 512 пикселей со скоростью 45 кадров в секунду, а для использования достаточно мощности потребительской видеокарты. Например, создание ролика с помощью графического процессора Nvidia RTX 4090 занимает около двух минут.

Команда отметила, что VASA-1 можно использовать для создания дипфейков, поэтому система пока не будет общедоступной.

Ранее стало известно о первом в мире конкурсе красоты среди цифровых аватаров нейросетей.


 
Офер есть, а работы нет: почему компании тянут резину после собеседования и что с этим делать