На сайте используются cookies. Продолжая использовать сайт, вы принимаете условия
Ok
1 Подписывайтесь на Газету.Ru в MAX Все ключевые события — в нашем канале. Подписывайтесь!
Все новости
Новые материалы +

Языковые модели от SberDevices стали лучшими в мире по пониманию текстов на русском языке

Текстовая модель ruRoberta-large finetune, которую разработал SberDevices, стала лучшей по пониманию текста в соответствии с оценкой главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, уступая по точности только человеку, сообщает пресс-служба банка.

Также в шестерку лидеров вошли еще 4 модели от SberDevices: ruT5-large-finetune, ruBert-large finetune, ruT5-base-finetune, ruBert-base finetune.

«Лучшие специалисты Сбера несколько лет занимаются совершенствованием нейросетей для русского языка. Для их объективной оценки существует лидерборд Russian SuperGLUE, который четко показывает прогресс в данной работе. Наша конечная цель — создание надежных интеллектуальных систем для решения разноплановых задач на русском языке, которые могут стать предшественниками сильного искусственного интеллекта отечественной сборки», — сказал исполнительный вице-президент СберБанка, СТО Сбера, руководитель блока «Технологии» Давид Рафаловский.

ruRoBERTa является улучшенной версией ruBERT, обученный на большом корпусе текста, только на задачу восстановления маскированных токенов, на большом батч-сайзе и с токенизатором BBPE от нейросети ruGPT-3.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) – первый рейтинг нейросетей для русского языка. Рейтинг модели зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание текста.

Оценка общего понимания языка начинается с набора тестов, отражающих различные языковые явления. Модель ruRoberta-large finetune не просто запоминает задания или угадывает результат, а также выучивает особенности и осваивает разнообразие феноменов русского языка.

Каждая модель также оценивается посредством различных заданий, среди которых DaNetQA — набор вопросов на здравый смысл и знание, с ответом «да» или «нет», RCB (Russian Commitment Bank) — классификация наличия причинно-следственных связей между текстом и гипотезой из него, PARus (Plausible Alternatives for Russian) — целеполагание, выбор из альтернативных вариантов на основе здравого смысла и другие.

Новости и материалы
Стало известно, что Зеленский внезапно изменил график поездки в Варшаву
Стало известно, что три украинских города попали под массированный удар
Между лидерами ЕС нет согласия по поводу конфискации российских активов
Стало известно, сколько будет стоить доллар на следующей неделе
Россияне увеличивают траты на свидания в декабре
Планы Мерца по изъятию российских активов привели к скандалу в бундестаге
Власти Камчатки повысят стоимость патента на трудовую деятельность для мигрантов
США ударили по «судну наркоторговцев» в Тихом океане, есть жертвы
В Госдуме предложили не штрафовать россиян за елки и гирлянды в подъездах
Четыре российских города введут туристический налог с 2026 года
Стало известно, сколько выступлений Долиной состоится перед Новым годом
Трамп обсудил с юристом возможность своего третьего срока
Город в Хабаровском крае завалило снегом
Названы популярные, но бесполезные методы борьбы с похмельем
Россиянам объяснили, как не получить штраф в 15 тыс. руб. за украшение рабочего места
СМИ: британские компании страхуют заходящие в Венесуэлу танкеры вопреки санкциям США
Мэр сообщил о последствиях атаки БПЛА по Ростову-на-Дону
Администрация Трампа хочет возвращения американских нефтяных компаний в Венесуэлу
Все новости