Планета переживает ИИ-лихорадку, новые нейросети в последние годы появляются как грибы после дождя, а эксперты предупреждают, что если искусственный интеллект и не заменит нас на работе, то учиться применять его точно необходимо. Чтобы вы не утонули в пучине ИИ-сервисов, мы собрали наиболее популярные и полезные из них и разложили по полочкам — по типу генерируемого контента и задач, которые они могут выполнять.
Самым популярным и многофункциональным ИИ-сервисом остается ChatGPT от компании OpenAI. «Чатик», как его называют в народе, может помочь с очень большим спектром задач.
Чаще всего ChatGPT используется для работы с текстом и информацией. С помощью нейросети удобно искать ответы на комплексные вопросы, что бывает более эффективно, чем просто гуглить. Например, если вам нужен быстрый и краткий экскурс в историю, можно сделать ИИ-запрос: «Коротко расскажи историю жизни и главных завоеваний Наполеона». Через считанные секунды получите быстрый и внятный ответ — и не нужно штудировать огромные статьи из «Википедии» или других источников.
Можно с «чатиком» и просто разговаривать вслух — для этого существует специальный голосовой режим, который уже пугающе близок к естественной человеческой речи. Будут те же ответы, но не в виде текста, а в формате беседы. Очень удобно, например, учить иностранные языки. Некоторые и вовсе общаются с языковой моделью как с психологом, но эффективность такой практики спорная, лучше все-таки обращаться к специалистам-людям.
В общем, если у вас есть какие-то рутинные задачи или нужна помощь в работе с информацией, скорее всего, вы сможете найти ChatGPT полезное применение. Нейросеть улучшается постоянно и для многих уже стала незаменимым помощником в быту и на работе. Единственный нюанс: сервис официально недоступен в Беларуси, однако это не сильно мешает использовать ИИ-чат-бот многим жителям нашей страны.
Но не забывайте, что не стоит «скармливать» ИИ-сервису персональные и чувствительные данные, а также лучше всегда перепроверять информацию из ответов.
• Читайте также: До сих пор гуглите? 10 полезных сценариев, как использовать ChatGPT в повседневной жизни
Составить конкуренцию флагманскому продукту OpenAI пытается ИИ от Google — Gemini. И стоит сказать, что это ему неплохо удается. У нейросети практически все те же возможности, что и у ChatGPT, со сравнимой эффективностью. Но у Gemini есть киллер-фича — интеграция с сервисами Google, с которыми многие работают регулярно.
В такой связке нейросеть от Google может работать как полезный ассистент, который лучше вас разбирается в тонне файлов в облаке и сотнях писем на электронной почте. Например, вам нужно быстро получить данные о поездках — Gemini легко найдет все нужные билеты и предоставит информацию в любом удобном виде.
В четких задачах, особенно в работе с Google-сервисами, Gemini очень хорош, однако он уступает ChatGPT в креативности — если нужны более творческие запросы или генерация идей, лучше выбрать ИИ от OpenAI или что-то еще.
Нюанс для белорусов все тот же: официально Gemini не представлен в нашей стране, однако включенный VPN легко решает эту проблему.
В качестве альтернативы ChatGPT и Gemini можно попробовать Grok — ИИ от компании xAI Илона Маска — или ставший в последнее время популярным Claude от Anthropic. Также есть еще ИИ-сервис Perplexity — единственный из описанных, что официально доступен в Беларуси.
Ранее компания OpenAI разрабатывала параллельно текстовый ChatGPT и отдельную нейросеть DALL·E для генерации изображений. Но позднее DALL·E интегрировали прямо в ChatGPT, и таким образом продукты объединились. Теперь генератор изображений называется ChatGPT Images.
В апреле OpenAI обновила ИИ-модель — визуальная нейросеть стала лучше и теперь хорошо справляется с текстом на изображениях, хотя раньше это было слабым местом, что даже порождало мемы.
Проверим разные ИИ-генераторы изображений на примере одного промпта и сравним полученные результаты.
Создай изображение в гипереалистичном стиле и в альбомной ориентации, на котором изображено Минское море, его пляжи и красивый закат с отдыхающими людьми.
Вот какой результат выдал ChatGPT Images.
А вот пример работы с текстом. В запросе была просьба сгенерировать главную страницу сайта Onlíner. Как видим, даже с русским текстом ИИ теперь справляется прекрасно и совсем без ошибок.
Генератор изображений прямо в «чатике» очень эффективен, когда вы обсуждаете с ИИ какой-то продукт или работу, а потом на основе этого просите создать иллюстрации. ChatGPT учитывает весь контекст из беседы и выдает хороший результат. Например, вы разрабатываете меню для ресторана, обсуждаете с ИИ, какие блюда включить и какие цены выставить, а в конце просите нарисовать дизайн меню.
Google шла похожим путем, отдельно развивая Gemini и нейросеть для создания изображений Imagen, которые тоже впоследствии объединились в один мультимодальный ИИ-сервис.
За это время у визуальной нейросети от Google появилось сразу несколько разных названий, что может сбить с толку. Imagen — маркетинговое название всего семейства генераторов изображений, Gemini Flash Image — это техническое или официальное наименование моделей, а еще есть Nano Banana — это было кодовое название во время разработки все той же нейросети, которое стало известно широкой публике. Если видите какое-то из трех названий, знайте, что это генератор изображений, встроенный в Gemini.
Вот как визуальный ИИ от Google справился с нашим запросом нарисовать Минское море.
Забавно, что Imagen выбрала очень похожий ракурс и сделала практически идентичную по форме береговую линию. А вот людей и деталей на изображении от Google гораздо больше.
Большинство простых задач по созданию изображений могут быть закрыты этими ИИ-сервисами, однако лимиты небольшие, для постоянной генерации придется перейти на платный тариф. Помимо нейросетей от OpenAI и Google, популярным остается Midjourney, но сервис стал полностью платным. Также некоторые дизайнеры и пользователи еще рекомендуют Leonardo AI, Flux и NightCafe Studio.
• Смотрите также: «Это очень страшно». Попробуйте отличить ИИ-подделки от реальных фотографий
Один из самых популярных ИИ для создания видео от одноименной компании. Инструмент способен сотворить кинематографические ролики, а промптами можно управлять камерой, визуальными эффектами и персонажами.
Вот свежий пример с YouTube-канала компании с демонстрацией, на что сегодня способен Runway.
Как сообщают некоторые медиа, ИИ — генераторы видео уже широко применяются в Голливуде для создания фильмов, однако немногие признаются в этом. Известно, например, что при производстве фильма «Все везде и сразу», ставшего лучшим на «Оскаре» в 2023 году, специалист по визуальным эффектам использовал именно Runway.
Может ИИ-сервис генерировать и изображения, но творческая свобода у него гораздо выше, чем у ChatGPT и Gemini. Вот как нейросеть справилась с нашим запросом нарисовать пейзаж с Минским морем. Людей Runway рисовать не стал, тем не менее очень просто спутать такую картинку с реальным фото.
Есть подобный инструмент и у Google, и он, по мнению многих, один из лучших по качеству генерируемых видео. Veo позволяет создавать видеоролики продолжительностью до 60 секунд с реалистичными движениями людей и объектов в кадре и с соблюдением физических законов.
Также ИИ-генератор от Google может добавлять аудио — например, озвучить персонажей и синхронизировать речь с движением губ.
Еще один популярный ИИ для создания видео, который разрабатывает китайская компания Kuaishou. Kling AI хорошо справляется с отрисовкой людей, которые двигаются в сгенерированных видео натурально даже в динамических сценах.
Самая свежая на данный момент версия 3.0 способна генерировать ролики по 2—3 минуты в формате 4K, но для этого потребуется платная подписка.
Возможности Kling AI продемонстрированы в забавном видео о пропавшем котике.
Также неплохо генерируют видеосервисы Luma Dream Machine, Seedance и Hailuo.
• Читайте также: Кринж или наступившее будущее? Как белорусы зарабатывают на ИИ-контенте
В этой нише самый популярный сервис — Suno AI, детище одноименной американской компании. И это совершенно заслуженно, ведь возможности этого ИИ-инструмента впечатляют. С помощью Suno вы сможете воплотить в жизнь любую вашу музыкальную фантазию в считанные минуты и даже без глубоких навыков композиторства.
В недавнем тексте о том, как искусственный интеллект захватывает музыкальные стриминги, мы в качестве эксперимента попробовали создать трек в Suno с помощью всего одного простого промпта. И вот что получилось.
В Suno можно включить запись голоса, напеть любую мелодию и превратить это в качественно звучащий любой музыкальный инструмент. Более того, полученные треки можно экспортировать отдельными дорожками, чтобы отдельно затем редактировать барабаны, бас, гитару и прочее — как в полноценном профессиональном софте для звукозаписи.
Еще один ИИ-инструмент, в котором можно делать музыку, но известен ElevenLabs Music, в первую очередь, возможностью синтезировать невероятно реалистичные голоса. Можно создавать их с нуля, также есть опция клонировать свой собственный, генерируя затем речь на разных языках, но звучащих, будто это говорите вы.
Ресурс Podcast Index недавно подсчитал количество сгенерированных подкастов, вышедших за промежуток в девять дней, — оказалось, что в 39% из них разговаривали не люди, а нейросети.
Среди других ИИ-сервисов по созданию аудио также выделяют Udio и Mureka AI.
• Читайте также: Никаких больше Beatles. Как ИИ-слоп захватывает музыку
Есть о чем рассказать? Пишите в наш телеграм-бот. Это анонимно и быстро
Перепечатка текста и фотографий Onlíner без разрешения редакции запрещена. ga@onliner.by