НЕЙРОСЕТЬ «СБЕРА» ЗНАЕТ РУССКИЙ ЛУЧШЕ

Нейросеть «Сбера» знает русский лучше
Дата публикации: 09.02.2023

Языковая модель от «Сбера» и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5) стала лучшей в мире по пониманию текста на русском языке, об этом сообщила пресс-служба компании, ссылаясь на результаты тестов главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE. По точности она уступает только человеку.

«Сбер» давно работает с трансформерными моделями - ещё в 2019 году были научены русскоязычные модели ruBERT и ruGPT-2, ну а в 2020 году с подачи суперкомпьютера Christofari была создана ruGPT-3. Эта модель существует в различных вариантах, и самый большой из них насчитывает 13 млрд параметров. В отличие от моделей супружества GPT, состоящих только из декодирующих блоков трансформера, модель FRED-T5 содержит также кодирующие блоки, что позволяет ей гораздо эффективнее иметь в себе разные задачи в сфере обработки природного языка.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) - первый рейтинг нейросетей для русского языка. Место в рейтинге может зависеть вследствие того что, насколько качественно нейросеть выполняет задания на логику, здоровый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются исследователи данных, работающие с русскоязычными нейросетями.

Архитектурно модель FRED-T5 реализована на базе нейросети T5 и имеет 1,7 миллиарда параметров и 24 слоя. Модель обучалась на задачах восстановленья случайно удалённых фрагментов текста на суперкомпьютере Christofari Neo. Это заняло шесть недель и потребовало использования обучающей выборки, содержавшей около 300 ГБ текста. В кругу профессионалов по автоматической обработке природного языка эту задачу нарекают MoD (Mixture of Denoisers). Этот подход был предложен ранее командой из Google в модели UL2.

В «Сбере» реализовали данный подход с рядом существенных изменений, основанных на результатах собственных исследований.

Сергей Марков, директор Управления экспериментальных систем машинного обучения SberDevices:

«Ведущие исследовательские центры в сфере машинного обучения в в наше время творят всё более и поболее крупные нейронные языковые модели. Количество параметров самых крупных монолитных нейросетей уже перевалило за 500 миллиардов и продолжает создавать себе подобных. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании всё более непомерных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при этом же количестве параметров интеллектуально превосходят своих предшественников. Хорошим образцом этого эффекта является нейросеть FRED-T5, которая при сравнительно стыдливом по теперешним меркам числе параметров стала лидером в понимании русского языка».

Рекомендуем:

Комментарии
Для того, чтобы добавить комментарий необходимо
войти на сайт
Пока материал никто не комментировал.
Новости
Дневная аудитория Rutube выросла в 3,2 раза
По итогам периода за январь-август 2025 года средний показатель дневной аудитории (DAU) национального видеохостинга Rutube составил 17 миллионов человек, что в 3,2 раза выше показателя за подобный период минувшего года - 5,3 миллиона пользователей.
Дата публикации: 04.09.2025
ППК «Роскадастр» и «Авито Недвижимость» подписали на ВЭФ соглашение об информационном взаимодействии
ППК «Роскадастр» и технологическая платформа «Авито Недвижимость» в масштабах Восточного экономического форума во Владивостоке заключили соглашение об информационном взаимодействии в целях развития цифровых сервисов в области недвижимости.
Дата публикации: 04.09.2025
1234...
Статьи
МегаФон стал партнёром финансовой платформы Банки.ру
1 июня 2023 МегаФон и финансовая платформа Банки.ру (АО «Цифровые технологии») запускают партнёрство. Первый совместный проект позволит предоставить клиентам доступ к финансовым предложениям любого российского банка?участника платформы, независимо от наличия его отделения поблизости.
Автор: prteammf
Дата публикации: 30.07.2023
«МегаФон Облако» поможет учебным заведениям совершенствовать образовательный процесс
14 июня 2023 МегаФон предоставил виртуальную инфраструктуру Институту развития образования Свердловской области. Преподаватели, сотрудники и слушатели образовательного учреждения получили дополнительные возможности для развития дистанционных программ в безопасной облачной среде.
Автор: prteammf
Дата публикации: 30.07.2023
МегаФон разработает систему экомониторинга морской акватории Камчатского края
23 июня 2023 МегаФон стал партнёром Правительства Камчатского края в области обеспечения экологической безопасности морской среды. Оператор поможет внедрить технологии мониторинга для сохранения и восстановления морской экосистемы, а также предотвращения возможных природных и техногенных катастроф.
Автор: prteammf
Дата публикации: 30.07.2023
1234...
Вопросы
Отзывы
Информация
Разработка программ и автоматизация вашего бизнеса это основные направления нашей компании. Наше основное отличие это доступность и качество автоматизации.

Copyright © 2025
www.softbusiness.net
Контакты
Написать в отдел технической поддержки пользователей
По всем вопросам
обращаться
по телефону:
+7(918)3883-585