Apple и специалисты Калифорнийского университета (США) создали ИИ-модель под названием MGIE. Она предназначена для редактирования изображений через текстовые команды, пишет VentureBeat.
MGIE отличается открытым исходным кодом и использует мультимодальные большие языковые модели (MLLM). Проще говоря, ИИ интерпретирует команды от пользователя, которые он вводит в форме текста, чтобы отредактировать картинку. Так, модель умеет изменять яркость, резкость и контрастность и применять некоторые «художественные эффекты».
В арсенале числится возможность изменения формы, цветов и текстуры как отдельных объектов, так и областей на изображении. Из функций попроще выделяется, например, обрезка картинки или изменение ее размера. Как модель работает с более сложными задачами вроде изменения фона и/или вырезки объектов, пока точно неизвестно (хотя, если верить разработчикам, справиться MGIE должна и здесь).
Попробовать MGIE можно на сайте Hugging Face Spaces или на GitHub.
Есть о чем рассказать? Пишите в наш телеграм-бот. Это анонимно и быстро