Программа умеет за считанные секунды образовывать изображения в высоком качестве по их текстовому трактовке. Известно, что новую версию Kandinsky 2.1 разработчики дополнительно обучили на 170 млн пар «текст — изображение» высокого разрешения к уже действующему набору в 1 млрд пар «текст — изображение».
Нейросеть способна смешивать, например, два рисунка, преобразовывать их по текстовому описанию, генерировать картинки, которые похожи на заданное, дорисовывать нехватающие части. Модель распознает запросы на 101 языке и может рисовать в разных стилях.
Нейросеть создали и обучили специалисты Sber AI вместе с учеными из Института искусственного интеллекта AIRI.
Рекомендуемые комментарии
Комментариев нет
Присоединяйтесь к обсуждению
Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.