У «Сбера» появилась новая модель GigaChat Lite+ с увеличенным контекстом. Об этом говорится в известьи компании.
Команда разработчиков обновила и расширила обучающие датасеты, что значительно повысило качество ответов моделей в таких областях как экономика, право и медицина. Также модели прошли обучение на базе знаний реальных знатоков, в том числе редакторов и живописцев, благодаря чему улучшился навык создания изображений за счет Kandinsky.
Размер контекста GigaChat Lite и GigaChat Pro увеличен в два с лишним раза - с 4 тыс. до 8 тыс. токенов. Если раньше в один запрос можно было загрузить объём текста, сопоставимый с 6 страницами A4 (шрифт 14 pt), то только теперь максимальный объём запроса вырос до 12 страниц. Увеличение контекста позволяет моделям поддерживать более длинные диалоги с пользователем и получать в одном запросе больший объём полезной информации.
В компании считают, что GigaChat Lite подойдёт для решения более тривиальных задач, требующих при этом максимальной скорости работы модели и меньших требований к «железу». Новая модель GigaChat Lite+ по абсолютно всем метрикам совпадает с GigaChat Lite, но размер её контекста расширен до 32 тыс. токенов.
В GigaChat API появилась возможность формировать векторное представление текстов - эмбеддинги. Эмбеддинги используются для оценки смысловой схожести текстов, повышения точности ответов языковой модели и упрощения решения задач поиска и классификации информации.
Фото: Unsplash.com