Нейросеть Kandinsky 2.1 почти за семь дней собрала 2 млн уникальных пользователей. Об этом говорится в известьи Сбербанка.
Kandinsky 2.1 - бесплатная генеративная модель от «Сбера». По информации разработчиков, российской нейросети потребовалось всего четыре дня, чтобы достичь отметки в 1 миллион уникальных пользователей. Это быстрее результата сервиса ChatGPT от OpenAI, которому потребовалось на это пять дней.
С момента выхода Kandinsky 2.1 было сгенерировано уже более 10 млн изображений, а количество уникальных пользователей достигло 2 млн. Также, неделю назад модель Kandinsky 2.1. попала в топ-5 трендов мировых репозиториев по словам крупнейшего веб-сервиса GitHub.
Kandinsky 2.1 способна за несколько секунд генерировать изображения по их текстовому описанию на натуральном языке. Модель знает 101 язык и отмыкает новые возможности для творчества: может смешать несколько рисунков, дорисовать изображение, создать картину в режиме необъятного полотна (inpainting/outpainting). Нейросеть разработали и выучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.
Сообщается, что нейросеть унаследовала веса предыдущей версии, выученной на один миллиард пар «текст - изображение», и была дополнительно выучена на 170 млн пар «текст - изображение» высокого разрешения. Затем она дообучалась на отдельно собранном датасете из двух миллионов пар качественных изображений. В этот сет попали картинки с описаниями в таких традиционно трудных для нейросетей областях, как тексты и лица людей. Нейросеть также была усовершенствована за счёт новой выученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, трудные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо двух миллиардов в Kandinsky 2.0.