Microsoft научила нейросеть рисовать сложные изображения на основе текстового описания

20 июня 2019, в 17:32
Слушать новость: Макс

Исследовательская группа Microsoft представила нейросеть, способную рисовать сложные изображения на основе текстового описания. Ранее подобные алгоритмы ограничивались только простейшими объектами.

Сложность заключалась в том, чтобы научить нейросеть не просто генерировать предметы, но понимать их отношение друг к другу в рамках одной композиции. Чтобы, например, создать картинку по описанию «Женщина в шлеме сидит на лошади», алгоритму предстояло «понять» по смыслу слов взаимоотношение между всеми этими объектами.

Microsoft научила нейросеть рисовать сложные изображения на основе текстового описания

В основе лежит нейросеть ObjGAN, которая анализирует текст и выделяет слова-объекты, располагая каждый из них на изображении. И если ранее алгоритмы создавали картинки, контролируя их качество, то эта сеть дополнительно анализирует реалистичность объектов и насколько они соотносятся друг к другу в рамках композиции на основе описания.

Microsoft научила нейросеть рисовать сложные изображения на основе текстового описания

Найти его можно в открытом доступе на GitHub.

Предшественник под названием AttnGAN также был разработан Microsoft. Алгоритм позволяет создавать изображения по более простым текстовым описаниям. Технология призвана облегчить жизнь дизайнеров и художников во время работы над эскизами.

Подпишись на VGTimes в Youtube — новости недели, баги и приколы каждую неделю в видеоформате: https://www.youtube.com/user/VGTimesRu/

🔑 Бесплатные Steam-ключи
Читайте и обсуждайте свежие новости видеоигр там, где вам удобно:
Комментарии
(гость)
Зарегистрируйтесь, чтобы всегда оставлять комментарии под своим именем, без модерации и без капчи
3 недели назад
облегчить жизнь дизайнерам? спасибо, но такой дизайн нам не нужОн
Ответить Цитировать выделенное
0