Дата публикации: 03.06.2024
«Яндекс» разрабатывает единую нейросеть для речи и текста. Об этом пишет «Коммерсант». «Яндекс» нанимает сотрудников для работы над мультимодальной моделью SpeechGPT, которая, согласно описанию вакансии, обязана будет воспринимать текст и звук и отвечать при их же поддержки. Нейросетевые сервисы компании уже обрабатывают как речь, так и текст, но процесс происходит с преображением данных из одного вида в другой. Мультимодальные сети призваны улавливать детали, которые теряются при такой конвертации, - например, эмоции и сарказм. Некоторые нейросетевые сервисы «Яндекса» уже позволяют принимать вводные данные различных видов. С ассистентом «Алиса» можно общаться как голосом, так и текстом; в начале декабря 2023 года компания сделала отдельный подраздел сайта с текстовым чатом. В последних числах мая «Яндекс» схожим образом расширил функциональность сервиса Yandex SpeechSense: изначально предназначенный для анализа работы колл-центров сервис получил возможность открывать доступ и текстовые известия. Возможность открывать доступ единовременно текст и картинки есть в сервисе «Нейро». Фото: Freepik.com
Пока материал никто не комментировал.
|
|