31 мая 2022 в 8:00
Автор: Антон Мерзляков. Фото: Сергей Ноздренков

Белоруска ушла из Facebook и основала IT-компанию, создающую аватаров. Их не отличить от реальных людей!

Алиса Потоцкая живет и работает в Лондоне. Девушка — основатель IT-компании, занимающейся созданием AI-видео с аватарами, почти неотличимыми от настоящих людей. До этого Алиса окончила БГУ, работала во французском научно-исследовательском институте атомной и альтернативных видов энергии, а также достигла высокой позиции в Facebook. Мы спросили предпринимательницу, почему она отказалась от мечты о научных исследованиях, как алгоритм генерирует ролики с виртуальными лицами и при чем тут метавселенные.


Работала на коллайдере, хотела стать ученым, разочаровалась и ушла в IT

— Расскажите о себе: откуда вы, где учились?

— Я из Барановичей, в школу ходила еще там. Потом поступила в минский Лицей БГУ, дальше отучилась на факультете прикладной математики и информатики, а также в Политехническом институте Гренобля (высшее учебное заведение во Франции. — Прим. Onlíner).

— В каких компаниях успели попробовать себя до старта собственного проекта?

— В Беларуси работала только в двух компаниях. Немногим больше года трудилась в Softeq на должности Software Engineer (разработчик программного обеспечения. — Прим. Onlíner), потом перешла в Wargaming — там тоже пробыла чуть больше года.

Остальное время работала уже в Европе — сначала в CEA (Комиссариат по атомной и альтернативным видам энергии, французский научно-исследовательский институт. — Прим. Onlíner), в том числе на коллайдере. Правда, я просто была в лаборатории, где к коллайдеру был доступ, но занималась совсем другим проектом, взаимодействовать непосредственно с ним не приходилось.

— Чем не понравилась работа рядом с коллайдером?

— У меня была мечта, что я стану исследователем и буду заниматься ресерчем (исследовательской деятельностью. — Прим. Onlíner). Причем хотела попасть именно в эту лабораторию. Но на самом деле я сильно разочаровалась. В бизнесе все происходит динамичнее, требования куда понятнее. В общем, быстро поняла: ресерч — это не мое.

«Машинное обучение нравилось больше: там много математики»

— Что было после CEA?

— Ненадолго перешла в финансовую компанию в Мюнхене, а затем — в лондонское подразделение Facebook.

— На всех этих позициях оставались программистом?

— Да, и практически все задачи были так или иначе связаны с machine learning (машинное обучение. — Прим. Onlíner).

— Почему остановились на этом направлении? Machine learning считается одной из самых сложных областей.

— Машинное обучение нравилось мне больше из-за того, что там нужно больше математики, если сравнивать с другими направлениями программирования. А математика мне всегда давалась. А еще я отучилась в ШАД (Школа анализа данных от «Яндекса». — Прим. Onlíner). Курс дал сильный старт для карьеры — не меньший, чем ФПМИ.

— Расскажите про Facebook — чем занимались там?

— В Facebook я проработала четыре с половиной года. Там меня повысили, в итоге я стала техлидом. Работала с технологиями как дополненной (AR), так и виртуальной (VR) реальности, в том числе в команде Oculus (подразделение нынешней Meta, выпускающее гарнитуры виртуальной реальности. — Прим. Onlíner). Но поняла, что мне нужно нечто большее. В конце концов решилась основать компанию.

«Можно взять и симулировать целого человека?»

— Поговорим про вашу компанию, Immersive Fox. С помощью алгоритмов искусственного интеллекта создаются видео, в которых генерируются аватары, практически неотличимые от лиц реальных людей. Как вы пришли к этому?

На фото команда Immersive Fox (слева направо): Яна Абрамова (инвестор Pretiosum VC), Гийом Бушар (отраслевой советник), Алиса Потоцкая (CEO), Евгений Поляков (руководитель исследования и разработки)

— Идею подал мой друг, владелец видеопродакшен-студии. Однажды он спросил: «Можно ли взять и симулировать целого человека?» Сначала я подумала: это вряд ли. Но идея запала в голову. Около трех месяцев я проводила исследование и пыталась понять, что вообще сейчас думают про это на рынке и насколько подобное может сработать как идея для бизнеса. Ведь одно дело — делать исследование «в стол», другое — когда создаешь продукт, который готовы купить.

В итоге я начала собирать команду. Первым присоединился мой знакомый, работавший в Google. Мы с ним продолжили исследования, появился еще один сотрудник. В итоге сейчас в команде десять человек, мы подняли несколько раундов инвестиций.

— Как технология действует на практике?

— Нам нужна пятиминутная запись лица человека. И чем лучше качество записи, тем красивее и точнее получится сам аватар. Для компаний, готовых вкладываться, имеет смысл записывать реально качественные видео. Нам часто присылают студийные ролики.

— В Immersive Fox работают только с корпоративными клиентами? Или можно создать аватар самого себя?

— Да, сейчас мы работаем в B2B. Процесс выглядит примерно так: компания присылает видео с лицом актера, алгоритм обрабатывает его около двух с половиной дней. После этого можно создавать бесконечное количество AI-контента. Также можно изменить голос или в автоматическом режиме перевести текст, на котором говорят в ролике, на другой язык (их поддерживается 25, в том числе русский).

— Для чего это может быть полезно бизнесу?

— Есть несколько сценариев. Например, для обучающих видео. Сейчас мы делаем курс лекций для одного университета. Следующий вариант — корпоративный контент вроде ежемесячных отчетов для команды или презентаций. Генерировать такие AI-ролики, а не снимать их в студии дешевле, плюс это экономит время. Третий сценарий — продажи. Вместо отправления «холодных» электронных сообщений текст конвертируется в видео, получается более персонализированно, конверсия выше. Последний кейс — клиентские коммуникации. Речь про ролики в чат-ботах, демонстрациях продукта компании.

— На ум приходит параллель с технологией Deepfake. В сети немало роликов, в которых политики говорят белиберду, а после оказывается, что видео фейковое.

— Это загрязняет рынок. Клиентам нужно доказывать, что лица актеров не будут использоваться где-то еще. Мы заключаем контракты с реальными моделями, где прописаны все соглашения на использование их лиц в конкретных проектах. Или, если записи лиц предоставляет заказчик, владельцами аватаров становятся они.

«Лет через 5—10 везде будут симуляции»

— Какие у вас планы? Уже есть понимание, к чему это может привести в будущем?

— К полноценной симуляции, включая не только лицевую мимику, но и движения тела. Берешь человека, сканируешь и делаешь его полную виртуальную копию. Но рынок очень молодой. Большинство компаний, работающих в этой сфере, начало появляться два-три года назад. Технология передовая, пока этим мало кто занимается.

— Это связано с развитием метавселенных?

— В том числе. Но мы нацелены делать аватары реалистичными, а не анимированными. Я верю, что уже лет через 5—10 мы вообще перестанем использовать камеры, а придем к симуляциям. С ними можно добиться большего. Мой генерированный персонаж говорит куда четче, чем я. И без акцента.

15.6" 1920 x 1080 IPS, 60 Гц, несенсорный, AMD Ryzen 5 5600H 3300 МГц, 8 ГБ DDR4, SSD 512 ГБ, видеокарта NVIDIA GeForce GTX 1650 4 ГБ GDDR6, без ОС, цвет крышки черный
15.6" 1920 x 1080 IPS, 144 Гц, несенсорный, Intel Core i5 11400H 2700 МГц, 8 ГБ DDR4, SSD 512 ГБ, видеокарта NVIDIA GeForce RTX 3050 4 ГБ, без ОС, цвет крышки черный
15.6" 1920 x 1080 IPS, 165 Гц, несенсорный, Intel Core i5 10500H 2500 МГц, 16 ГБ DDR4, SSD 512 ГБ, видеокарта NVIDIA GeForce RTX 3050 Ti 4 ГБ, Windows 10, цвет крышки черный

Наш канал в Telegram. Присоединяйтесь!

Есть о чем рассказать? Пишите в наш телеграм-бот. Это анонимно и быстро

Перепечатка текста и фотографий Onlíner без разрешения редакции запрещена. ng@onliner.by

Автор: Антон Мерзляков. Фото: Сергей Ноздренков