На сайте используются cookies. Продолжая использовать сайт, вы принимаете условия
Ok
1 Подписывайтесь на Газету.Ru в MAX Все ключевые события — в нашем канале. Подписывайтесь!
Все новости
Новые материалы +

Языковые модели от SberDevices стали лучшими в мире по пониманию текстов на русском языке

Текстовая модель ruRoberta-large finetune, которую разработал SberDevices, стала лучшей по пониманию текста в соответствии с оценкой главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, уступая по точности только человеку, сообщает пресс-служба банка.

Также в шестерку лидеров вошли еще 4 модели от SberDevices: ruT5-large-finetune, ruBert-large finetune, ruT5-base-finetune, ruBert-base finetune.

«Лучшие специалисты Сбера несколько лет занимаются совершенствованием нейросетей для русского языка. Для их объективной оценки существует лидерборд Russian SuperGLUE, который четко показывает прогресс в данной работе. Наша конечная цель — создание надежных интеллектуальных систем для решения разноплановых задач на русском языке, которые могут стать предшественниками сильного искусственного интеллекта отечественной сборки», — сказал исполнительный вице-президент СберБанка, СТО Сбера, руководитель блока «Технологии» Давид Рафаловский.

ruRoBERTa является улучшенной версией ruBERT, обученный на большом корпусе текста, только на задачу восстановления маскированных токенов, на большом батч-сайзе и с токенизатором BBPE от нейросети ruGPT-3.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) – первый рейтинг нейросетей для русского языка. Рейтинг модели зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание текста.

Оценка общего понимания языка начинается с набора тестов, отражающих различные языковые явления. Модель ruRoberta-large finetune не просто запоминает задания или угадывает результат, а также выучивает особенности и осваивает разнообразие феноменов русского языка.

Каждая модель также оценивается посредством различных заданий, среди которых DaNetQA — набор вопросов на здравый смысл и знание, с ответом «да» или «нет», RCB (Russian Commitment Bank) — классификация наличия причинно-следственных связей между текстом и гипотезой из него, PARus (Plausible Alternatives for Russian) — целеполагание, выбор из альтернативных вариантов на основе здравого смысла и другие.

Новости и материалы
В Волгограде прогремела серия взрывов
Названы причины, почему россияне не могут накопить на первый взнос по ипотеке
Россиянам рассказали, как снизить холестерин при помощи одного продукта
В России вводятся новые программы для автошкол
В Госдуме рассказали о внедрении новой системы оплаты труда бюджетников
В Норвегии рассказали о модернизации инфраструктуры на границе с Россией
Светлана Ходченкова в шубе отметила 43-летие в Альпах
Губернатор Тульской области рассказал о последствиях аварии на железной дороге
8-летняя дочь Ирины Шейк вышла на публику в Париже с сумкой за 125 тысяч рублей
В Госдуме предложили увеличить сумму взыскания приставов
Пэрис Хилтон вышла в свет в платье с экстремальным разрезом
Правительство наметило план по достижению «цифровой зрелости»
Стало известно о процессе борьбы с огнем в резервуарах портового терминала в Кубани
Приставы открыли производства об аресте имущества 12 бывших топ-менеджеров «Роснано»
Plus-size модель Эшли Грэм снялась без макияжа с иглами в лице
Депутаты хотят ограничить число домашних животных в квартирах
Тина Канделаки показала редкие фото дочери: «Начнем утро с красоты»
«Барселона» одержала волевую победу над «Славией» в Лиге чемпионов
Все новости