Исследователи Лаборатории языковой конвергенции НИУ ВШЭ – Санкт-Петербург составили эмоциональный словарь для искусственного интеллекта, так называемый «мультимодальный эмоциональный датасет». Об этом сообщает пресс-служба НИУ ВШЭ.

Словарь для ИИ состоит из различных фрагментов видео, которые при обработке позволят программам более точно распознавать то, что чувствует человек. Искусственный интеллект будет использовать для этих целей звук, текст, и визуальные данные – сообщают ученые.

«То, что раньше делал лингвист на основе словаря, теперь делают вычислительные модели, только их словарь должен быть организован по-другому. Вместо пары «слово – толкование» используется пара «текстовый фрагмент – эмоциональная метка», – рассказала заведующая Лабораторией языковой конвергенции Анастасия Колмогорова.

Созданный датасет – это не просто набор данных, заявляют в НИУ ВШЭ. Он решает сразу несколько важных задач: служит надежным источником для обучения новых моделей, становится инструментом для оценки уже существующих систем и выступает в роли «золотого стандарта» для исследований в области эмоциональной речи на русском языке.

