На сайте используются cookies. Продолжая использовать сайт, вы принимаете условия
Ok
1 Подписывайтесь на Газету.Ru в MAX Все ключевые события — в нашем канале. Подписывайтесь!
Все новости
Новые материалы +

Языковые модели от SberDevices стали лучшими в мире по пониманию текстов на русском языке

Текстовая модель ruRoberta-large finetune, которую разработал SberDevices, стала лучшей по пониманию текста в соответствии с оценкой главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, уступая по точности только человеку, сообщает пресс-служба банка.

Также в шестерку лидеров вошли еще 4 модели от SberDevices: ruT5-large-finetune, ruBert-large finetune, ruT5-base-finetune, ruBert-base finetune.

«Лучшие специалисты Сбера несколько лет занимаются совершенствованием нейросетей для русского языка. Для их объективной оценки существует лидерборд Russian SuperGLUE, который четко показывает прогресс в данной работе. Наша конечная цель — создание надежных интеллектуальных систем для решения разноплановых задач на русском языке, которые могут стать предшественниками сильного искусственного интеллекта отечественной сборки», — сказал исполнительный вице-президент СберБанка, СТО Сбера, руководитель блока «Технологии» Давид Рафаловский.

ruRoBERTa является улучшенной версией ruBERT, обученный на большом корпусе текста, только на задачу восстановления маскированных токенов, на большом батч-сайзе и с токенизатором BBPE от нейросети ruGPT-3.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) – первый рейтинг нейросетей для русского языка. Рейтинг модели зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание текста.

Оценка общего понимания языка начинается с набора тестов, отражающих различные языковые явления. Модель ruRoberta-large finetune не просто запоминает задания или угадывает результат, а также выучивает особенности и осваивает разнообразие феноменов русского языка.

Каждая модель также оценивается посредством различных заданий, среди которых DaNetQA — набор вопросов на здравый смысл и знание, с ответом «да» или «нет», RCB (Russian Commitment Bank) — классификация наличия причинно-следственных связей между текстом и гипотезой из него, PARus (Plausible Alternatives for Russian) — целеполагание, выбор из альтернативных вариантов на основе здравого смысла и другие.

Новости и материалы
В нескольких районах Киева пропали свет, вода и отопление
Овечкин прервал личную антирекордную серию без голов в НХЛ
Овечкин обновил очередной рекорд в НХЛ
Дед Мороз рассказал, что привез с собой из России в США
Уролог рассказал, когда упражнения Кегеля бесполезны при недержании мочи
Развеян один из главных мифов о грудных имплантах
Гол Овечкина принес «Вашингтону» победу над «Нью-Джерси»
На Западе сравнили позиции Макрона и Мерца по России
Стало известно, что изображено на картине, которую Лукашенко подарил Путину на Валааме
Подполковник Дэвис заявил, что Россия не согласится на украинский мирный план
Названа средняя цена детского сладкого подарка в России на Новый год
Силы ПВО за ночь пресекли атаку двух десятков украинских беспилотников
СМИ: Зеленский может пойти на большие уступки, чем говорит
Зеленский выставил Западу счет в сотни миллиардов
«Своеобразная форма отъема бизнеса»: Лавров рассказал о планах Запада относительно Тайваня
В России спрогнозировали рост банкротств в 2026 году
Маск заявил о произошедшем «великом замещении» населения Европы
Полиция Парижа задержала 40 человек после запуска фейерверков
Все новости