Бизнес и разработчики получили открытый доступ к обновлённой модели для создания векторных представлений текста - Giga-Embeddings, а также модели для генерации видео Kandinsky Video Lite. Обе модели распространяются по открытой лицензии, допускающей вольное использование в коммерческих проектах любого масштаба.
«Научная команда Сбера активно публикует разные модели генеративного искусственного интеллекта. Так, в открытый доступ выложены все модели линейки Kandinsky, супружество акустических моделей для русского языка GigaAM, которые находятся «под капотом» нашего сервиса GigaChatЙ, - говорил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.
Kandinsky Video Lite позволяет создавать краткие видео длительностью до 10 секунд на основании текстового запроса (промпта). Это компактная модель, содержащая всего два миллиарда параметров. При этом по внутренним тестам Kandinsky Video Lite превосходит по общему качеству (которое включает в себя оценки качества следования промпту, визуала и динамики) гораздо более громоздкие модели, таких как Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, и сравнима по визуальному качеству с моделью Wan 2.2 A14B, которая больше Kandinsky в 13-14 раз.
Разработчикам и бизнесу также стала доступна в open-source обновлённая модель, преобразующая текстовую информацию в эффективные векторные представления - Giga-Embeddings. Giga-Embeddings обеспечивает построение высокоэффективных RAG-систем (Retrieval-Augmented Generation), гарантирующих надёжность и достоверное событие ответов искусственного интеллекта.
Фото: Freepik