НЕЙРОСЕТЬ «СБЕРА» ЗНАЕТ РУССКИЙ ЛУЧШЕ

Нейросеть «Сбера» знает русский лучше
Дата публикации: 09.02.2023

Языковая модель от «Сбера» и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5) стала лучшей в мире по пониманию текста на русском языке, об этом сообщила пресс-служба компании, ссылаясь на результаты тестов главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE. По точности она уступает только человеку.

«Сбер» давно работает с трансформерными моделями - ещё в 2019 году были научены русскоязычные модели ruBERT и ruGPT-2, ну а в 2020 году с подачи суперкомпьютера Christofari была создана ruGPT-3. Эта модель существует в различных вариантах, и самый большой из них насчитывает 13 млрд параметров. В отличие от моделей супружества GPT, состоящих только из декодирующих блоков трансформера, модель FRED-T5 содержит также кодирующие блоки, что позволяет ей гораздо эффективнее иметь в себе разные задачи в сфере обработки природного языка.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) - первый рейтинг нейросетей для русского языка. Место в рейтинге может зависеть вследствие того что, насколько качественно нейросеть выполняет задания на логику, здоровый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются исследователи данных, работающие с русскоязычными нейросетями.

Архитектурно модель FRED-T5 реализована на базе нейросети T5 и имеет 1,7 миллиарда параметров и 24 слоя. Модель обучалась на задачах восстановленья случайно удалённых фрагментов текста на суперкомпьютере Christofari Neo. Это заняло шесть недель и потребовало использования обучающей выборки, содержавшей около 300 ГБ текста. В кругу профессионалов по автоматической обработке природного языка эту задачу нарекают MoD (Mixture of Denoisers). Этот подход был предложен ранее командой из Google в модели UL2.

В «Сбере» реализовали данный подход с рядом существенных изменений, основанных на результатах собственных исследований.

Сергей Марков, директор Управления экспериментальных систем машинного обучения SberDevices:

«Ведущие исследовательские центры в сфере машинного обучения в в наше время творят всё более и поболее крупные нейронные языковые модели. Количество параметров самых крупных монолитных нейросетей уже перевалило за 500 миллиардов и продолжает создавать себе подобных. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании всё более непомерных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при этом же количестве параметров интеллектуально превосходят своих предшественников. Хорошим образцом этого эффекта является нейросеть FRED-T5, которая при сравнительно стыдливом по теперешним меркам числе параметров стала лидером в понимании русского языка».

Рекомендуем:

Комментарии
Для того, чтобы добавить комментарий необходимо
войти на сайт
Пока материал никто не комментировал.
Новости
Атомный ледокол доставил оборудование «Триколор» в самый северный поселок России
«Триколор» при поддержке госкорпорации «Росатом» реализовал гуманитарную акцию для обитателей самого северного населенного пункта страны - поселка Диксон Красноярского края. На борту атомного ледокола «Урал» в поселок было доставлено спутниковое оборудование, телевизоры и саундбары «Триколор» для безвозмездной предачи в социальные учреждения.
Дата публикации: 23.01.2026
Т2 предотвратила два миллиарда спам-звонков в 2025 году
T2 предотвратила более двух миллиардов нежелательных звонков. Это эквивалентно 380 годам времени, которые клиенты могли бы истратить на разговоры с роботами и рекламными агентами. В финале 2025 года Т2 завершила распространение бесплатного голосового ассистента на все номера оператора. По конечным итогам года Т2 уберегла своих абонентов от 12 млрд секунд нежелательного телефонного взаимодействия.
Дата публикации: 23.01.2026
1234...
Статьи
МегаФон стал партнёром финансовой платформы Банки.ру
1 июня 2023 МегаФон и финансовая платформа Банки.ру (АО «Цифровые технологии») запускают партнёрство. Первый совместный проект позволит предоставить клиентам доступ к финансовым предложениям любого российского банка?участника платформы, независимо от наличия его отделения поблизости.
Автор: prteammf
Дата публикации: 30.07.2023
«МегаФон Облако» поможет учебным заведениям совершенствовать образовательный процесс
14 июня 2023 МегаФон предоставил виртуальную инфраструктуру Институту развития образования Свердловской области. Преподаватели, сотрудники и слушатели образовательного учреждения получили дополнительные возможности для развития дистанционных программ в безопасной облачной среде.
Автор: prteammf
Дата публикации: 30.07.2023
МегаФон разработает систему экомониторинга морской акватории Камчатского края
23 июня 2023 МегаФон стал партнёром Правительства Камчатского края в области обеспечения экологической безопасности морской среды. Оператор поможет внедрить технологии мониторинга для сохранения и восстановления морской экосистемы, а также предотвращения возможных природных и техногенных катастроф.
Автор: prteammf
Дата публикации: 30.07.2023
1234...
Вопросы
Отзывы
Информация
Разработка программ и автоматизация вашего бизнеса это основные направления нашей компании. Наше основное отличие это доступность и качество автоматизации.

Copyright © 2026
www.softbusiness.net
Контакты
Написать в отдел технической поддержки пользователей
По всем вопросам
обращаться
по телефону:
+7(918)3883-585