Google создала нейросеть по превращению текста в фото. Результаты странные

 
8300
25 мая 2022 в 9:57
Источник: Клим Иванов

Интернет-гигант рассказал о нейросети под названием Imagen. Она умеет создавать фотореалистичные изображения на основе текстовых запросов. В Google утверждают, что ее нейросеть создает более точные и достоверные изображения, чем конкуренты вроде DALL-E 2.

«Милый корги в домике из суши»
«Величественная картина маслом, на которой изображена королева енотов в красном королевском платье. Картина висит на богато украшенной стене, оклеенной обоями»
«Мраморная статуя диджея Коалы с мраморной статуей проигрывателя. Коала в больших мраморных наушниках»
«Инопланетный осьминог проплывает через портал, читая газету»

В основе Imagen лежит метод диффузии. Сначала по текстовому запросу создается схематичный рисунок размером 32×32 пикселя. Затем картинка последовательно увеличивается до разрешения 1024×1024 пикселя, при этом дополняясь новыми элементами.

«Мишка Тедди плывет на Олимпийских играх баттерфляем»
«Гигантская кобра из кукурузы на ферме»
«Фотография енота в шлеме астронавта, выглядывающего из окна ночью»

Пока Imagen недоступна для пользователей. Тем не менее Google показала примеры работы нейросети.


15.6" 1920 x 1080 IPS, 60 Гц, несенсорный, AMD Ryzen 5 5600H 3300 МГц, 8 ГБ DDR4, SSD 512 ГБ, видеокарта NVIDIA GeForce GTX 1650 4 ГБ GDDR6, без ОС, цвет крышки черный
15.6" 1920 x 1080 IPS, 144 Гц, несенсорный, Intel Core i5 11400H 2700 МГц, 8 ГБ DDR4, SSD 512 ГБ, видеокарта NVIDIA GeForce RTX 3050 4 ГБ, без ОС, цвет крышки черный
15.6" 1920 x 1080 IPS, 165 Гц, несенсорный, Intel Core i5 10500H 2500 МГц, 16 ГБ DDR4, SSD 512 ГБ, видеокарта NVIDIA GeForce RTX 3050 Ti 4 ГБ, Windows 10, цвет крышки черный

Наш канал в Telegram. Присоединяйтесь!

Есть о чем рассказать? Пишите в наш телеграм-бот. Это анонимно и быстро

Источник: Клим Иванов