НЕЙРОСЕТЬ «СБЕРА» ЗНАЕТ РУССКИЙ ЛУЧШЕ

Нейросеть «Сбера» знает русский лучше
Дата публикации: 09.02.2023

Языковая модель от «Сбера» и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5) стала лучшей в мире по пониманию текста на русском языке, об этом сообщила пресс-служба компании, ссылаясь на результаты тестов главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE. По точности она уступает только человеку.

«Сбер» давно работает с трансформерными моделями - ещё в 2019 году были научены русскоязычные модели ruBERT и ruGPT-2, ну а в 2020 году с подачи суперкомпьютера Christofari была создана ruGPT-3. Эта модель существует в различных вариантах, и самый большой из них насчитывает 13 млрд параметров. В отличие от моделей супружества GPT, состоящих только из декодирующих блоков трансформера, модель FRED-T5 содержит также кодирующие блоки, что позволяет ей гораздо эффективнее иметь в себе разные задачи в сфере обработки природного языка.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) - первый рейтинг нейросетей для русского языка. Место в рейтинге может зависеть вследствие того что, насколько качественно нейросеть выполняет задания на логику, здоровый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются исследователи данных, работающие с русскоязычными нейросетями.

Архитектурно модель FRED-T5 реализована на базе нейросети T5 и имеет 1,7 миллиарда параметров и 24 слоя. Модель обучалась на задачах восстановленья случайно удалённых фрагментов текста на суперкомпьютере Christofari Neo. Это заняло шесть недель и потребовало использования обучающей выборки, содержавшей около 300 ГБ текста. В кругу профессионалов по автоматической обработке природного языка эту задачу нарекают MoD (Mixture of Denoisers). Этот подход был предложен ранее командой из Google в модели UL2.

В «Сбере» реализовали данный подход с рядом существенных изменений, основанных на результатах собственных исследований.

Сергей Марков, директор Управления экспериментальных систем машинного обучения SberDevices:

«Ведущие исследовательские центры в сфере машинного обучения в в наше время творят всё более и поболее крупные нейронные языковые модели. Количество параметров самых крупных монолитных нейросетей уже перевалило за 500 миллиардов и продолжает создавать себе подобных. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании всё более непомерных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при этом же количестве параметров интеллектуально превосходят своих предшественников. Хорошим образцом этого эффекта является нейросеть FRED-T5, которая при сравнительно стыдливом по теперешним меркам числе параметров стала лидером в понимании русского языка».

Рекомендуем:

Комментарии
Для того, чтобы добавить комментарий необходимо
войти на сайт
Пока материал никто не комментировал.
Новости
НТВ запустил собственный ЦОД DCN1
Телеканал НТВ запустил собственный центр обработки данных (ЦОД) DCN1. Это первый ЦОД, расположенный в бизнес-центре класса А в 5-ти минутах от ТТК – рядом с Останкинской башней в новом Телекомплексе НТВ.Инфраструктура DCN1 полностью автономна от остального здания Технопарка. В ЦОД размещены 1020 IT-стоек.
Дата публикации: 05.06.2025
«Иртея» идет в Белоруссию
Российский производитель базовых станций связи «Иртея» выходит за кордон. Об этом пишут «Ведомости». Летом 2025 года «Иртея» планирует запустить тестирование своего оборудования стандарта 5G в Белоруссии. Об этом «Ведомостям» в кулуарах конференции «Цифровая индустрия промышленной России» (ЦИПР-2025) рассказал генеральный директор «Иртеи» Дмитрий Лаконцев.
Дата публикации: 05.06.2025
1234...
Статьи
МегаФон стал партнёром финансовой платформы Банки.ру
1 июня 2023 МегаФон и финансовая платформа Банки.ру (АО «Цифровые технологии») запускают партнёрство. Первый совместный проект позволит предоставить клиентам доступ к финансовым предложениям любого российского банка?участника платформы, независимо от наличия его отделения поблизости.
Автор: prteammf
Дата публикации: 30.07.2023
«МегаФон Облако» поможет учебным заведениям совершенствовать образовательный процесс
14 июня 2023 МегаФон предоставил виртуальную инфраструктуру Институту развития образования Свердловской области. Преподаватели, сотрудники и слушатели образовательного учреждения получили дополнительные возможности для развития дистанционных программ в безопасной облачной среде.
Автор: prteammf
Дата публикации: 30.07.2023
МегаФон разработает систему экомониторинга морской акватории Камчатского края
23 июня 2023 МегаФон стал партнёром Правительства Камчатского края в области обеспечения экологической безопасности морской среды. Оператор поможет внедрить технологии мониторинга для сохранения и восстановления морской экосистемы, а также предотвращения возможных природных и техногенных катастроф.
Автор: prteammf
Дата публикации: 30.07.2023
1234...
Вопросы
Отзывы
Информация
Разработка программ и автоматизация вашего бизнеса это основные направления нашей компании. Наше основное отличие это доступность и качество автоматизации.

Copyright © 2025
www.softbusiness.net
Контакты
Написать в отдел технической поддержки пользователей
По всем вопросам
обращаться
по телефону:
+7(918)3883-585