В НИЯУ МИФИ разработана интеллектуальная система, способная понять, не является ли запись человеческого голоса голосовым дипфейком. Разработанный продукт получил название «Сипуха» — в честь ночной птицы, отличающейся особенно острым слухом. Об этом «Газете.Ru» рассказали в университете.

В основе системы лежит нейросеть, обученная различать дипфейки. В качестве данных для обучения нейросети использовалось более 200 тыс. записей человеческих голосов, среди которых были как подлинные записи, так и дипфейки, сгенерированные различными алгоритмами. Выявление дипфейков происходит благодаря анализу так называемых кепстральных коэффициентов — так специалисты по акустике называют некоторые важнейшие математические характеристики аудиосигналов, обычно рассчитываемые для коротких фрагментов аудиозаписей длительностью от 20 до 40 микросекунд.

Сегодня задачей разработчиков «Сипухи» является создание облачного сервиса, который позволит легко и быстро подключать функцию распознания дипфейков к любой нуждающейся в этом публичной или коммерческой системе коммуникации — например к кол-центру или мессенджеру. Заинтересованность в использовании сервиса уже подтвердили такие известные российские компании, как Т-Банк и «Информзащита».

В перспективе также необходимо создание исследовательской лаборатории, в которой на регулярной основе будет совершенствоваться нейронная сеть — ведь постоянно появляются новые алгоритмы синтеза дипфейков. Ученые надеются, что проект получит поддержку со стороны соответствующих структур правительства Москвы.

Ранее россиянам рассказали, как отличить паническую атаку от сердечного приступа.