Наш человек в Facebook. Как парень из БГУ тренирует искусственный интеллект в США

Автор: Виталий Олехнович. Фото: из личного архива, facebook.com
27 июня 2017 в 8:00
Ослепительные скидки в Каталоге Onlíner

Если ты крутой специалист, то даже из маленькой Беларуси сможешь пробраться в самое сердце Facebook, где твоими продуктами будут пользоваться не миллионы, а миллиарды людей. Таким достижением может похвастаться Денис Ярец — Research Engineer в крупнейшей мировой соцсети. Корреспонденту Onliner.by он рассказал о приглашении в США после учебы, работе с искусственным интеллектом и встрече с Марком Цукербергом.

В Facebook Денис работает без малого год. Туда парень перешел из Quora, где возглавлял подразделение по машинному обучению. В Штаты же переехал почти шесть лет назад, когда практически сразу после окончания учебы получил приглашение от Microsoft.

Из БГУ в Сиэтл

Парня в 2011 году, после окончания факультета прикладной математики и информатики, несколько часов на английском языке собеседовали хедхантеры, специально приехавшие в Москву. Там они искали специалистов для работы над Bing — интернет-поисковиком, который должен был стать конкурентом Google. Но этот проект уже в прошлом, как и сложная карьерная лестница в Microsoft.

— Facebook на данный момент — лучшее место, где я работал. Здесь все сделано для людей, нет бюрократии, которая была присуща Microsoft. Именно поэтому и не задержался там: чтобы расти, нужно было играть в политику, что мне неинтересно.


Сейчас Денис трудится в лаборатории Facebook AI Research, которая занимается исследованием искусственного интеллекта и машинным обучением нейросетей. Парень без зазрения совести называет эту группу специалистов одной из лучших как в Америке, так и во всем мире. Лаборатория состоит из трех офисов, расположенных в Париже, Нью-Йорке и Менло-Парке в штаб-квартире Facebook (штат Калифорния).

— Я учился в БГУ на факультете прикладной математики и информатики. Участвовал в различных олимпиадах по программированию — как в белорусских, так и в международных. Тогда же заинтересовался искусственным интеллектом, машинным обучением. С тех пор все развилось невероятным образом и нейросети вышли на первый план в технологической индустрии.

Еще в студенческое время я начал работать в «Яндексе» над картами, разрабатывал алгоритмы по прогнозированию загруженности дорог. А потом знакомый рассказал, что в Москву приедут люди из Microsoft, и я решил записаться на собеседование.


Затем был переезд в Сиэтл, работа над интернет-поисковиком. Через некоторое время Денис попал в Facebook. Там уже работали знакомые, которые и помогли выйти на собеседование по устройству в компанию.

Как ИИ Дениса научился лгать

— Перед лабораторией стоит цель понять, как в ближайшие 10—20 лет можно создать алгоритм, который умеет думать. На данный момент машинное обучение в большинстве своем умеет хорошо находить и запоминать паттерны в обучающей выборке. Даешь данные, говоришь правильный ответ, и нейросети научаются воспроизводить этот ответ. В некоторых задачах такой алгоритм обучения работает отлично. При распознавании образов на фотографиях нейросеть справляется даже лучше человека. Но задачи, связанные с языком и речью, пока даются хуже. Алгоритмы не умеют переносить навыки из одной предметной области на другую. Ребенку не нужно много раз дотрагиваться до чего-то горячего, чтобы до конца жизни запомнить, что к горящей спичке или горячему чайнику лучше не прикасаться.

— Буквально несколько дней назад мировую прессу облетели заголовки: в Facebook разработали чат-боты, которые создали собственный язык. Что же там случилось на самом деле?

— Один из важных аспектов коммуникации людей — это умение договариваться. Вот надо вам с собеседником договориться о встрече, и вы уделяете время переписке или созвону, приводите аргументы, чтобы прийти к компромиссу. Было бы здорово, если бы для этого был бот, который назначал бы встречу с определенным человеком в удобное для вас время.

Для начала мы свели это к задаче попроще. В частности, решили научить двух агентов (алгоритмы) делить между собой объекты: например, мячи, шляпы и книги. При этом каждый агент знает, что хочет только мяч или только книгу, но не знает, что хочет его коллега, для них эта информация скрыта. Используя английский язык, они должны договориться, прийти к компромиссу, чтобы с выгодой для обоих разделить предметы. Если они не договариваются, то ничего не получают — это провал.

В ходе исследования всплыли два побочных эффекта. Мы уделяли им мало внимания, но мировая пресса их подхватила. Все начали паниковать: ИИ заговорил на собственном языке, научился хитрить. Есть два человека, которые работают над одним заданием и повторяют процесс тысячу раз. Естественно, что они выработают какие-то новые слова, которые будут понимать только они. Что-то вроде профтерминов. Похожий эффект мы увидели и в нашей работе.

Перед нейросетями стояла задача как можно выгоднее договориться, эффективнее разделить объекты, а не придерживаться английского языка. А потому они начали придумывать конструкции, которые не поймет человек, но поймут два этих агента.

— А что понимается под словами о хитрости со стороны нейросетей?

— Вот этот второй побочный эффект для нас оказался куда интереснее. Можно сказать, что в некоторых случаях агенты обманывали и шли на уловки. С точки зрения человека это выглядит так: я хочу взять книгу, но моему собеседнику тоже нужна книга. Я говорю, что хочу книгу и мяч, хотя последний для меня совсем не важен. Начинаем торговаться, и после переговоров я соглашаюсь отдать мяч и взять только книгу. А собеседник думает, как здорово ему удалось договориться. Нечто подобное демонстрировали и наши алгоритмы. Это сложно назвать настоящей ложью, но выглядело довольно интересно.


Дети учатся лгать в три года. До этого возраста они обычно всегда говорят правду. Процесс лжи довольно сложный, он связан с планированием и моделированием реакций и ситуаций. Человек приходит к этому не сразу. А потому довольно удивительно было видеть, как агенты используют эти приемы в своих диалогах. Но тут стоит быть аккуратным и не пускать все на самотек, потому как в прошлом году Microsoft запустил чат-бота в Twitter, который за сутки превратился в нациста.

— Для чего может понадобиться подобный чат-бот, который умеет вести переговоры и торговаться?

— Нашу задачу с мячами и книгами в будущем можно обобщить и использовать для планирования встреч, выбора рейсов и фильмов, которые можно посмотреть с друзьями. Алгоритм подберет такой вариант, чтобы все остались довольны.

Больше, чем банальный программист

— В Facebook много внимания уделяется чат-ботам, коммуникациям с людьми. Над этой научной статьей трудились пять авторов, но основную работу делали я и мой коллега. Остальные являются профессорами, своеобразными менторами, которых Facebook пригласил поработать по контракту. Команда у нас немаленькая, но большинство (60—70%) — это ученые, профессора из университетов. Таких экспертов в мире единицы, их очень сложно собрать и переманить. Они потратили на свою сферу 20 лет трудов, и, естественно, их зарплата будет выше, чем у рядового программиста, который только начинает свою карьеру.

По сути, мы занимаемся научной работой, создаем алгоритмы и рассылаем статьи на научные конференции, в специализированные журналы. Можно сказать, что машинное обучение само по себе ближе к науке, чем к программированию. Очень много математики, теории вероятности, важны численные методы, математический анализ, оптимизация и т. д.

Естественно, в Facebook работают над множеством задач. В парижском отделении разрабатывают проект, который поможет людям справляться с депрессиями. Это будет чат-бот, который даст выговориться и сумеет утешить, подбодрить собеседника.

— Выглядит так, словно эти разработки совсем не близкого будущего и весьма отдаленно связаны с соцсетью.

— Наша команда не зависит от Facebook. Другие ребята работают непосредственно над обслуживанием соцсети, ее функционалом, тогда как наша работа связана с исследованиями. Да, мы скорее ориентируемся на будущее, на то, что будет использоваться в Facebook через пять лет. Но два месяца назад, например, наша команда разработала лучший алгоритм для машинного перевода, который по разным метрикам сумел опередить аналогичный от Google. По сути, все, что сейчас переводится в Facebook, работает через наш алгоритм. Примерно 2 млрд людей сегодня могут им пользоваться через кнопку «Показать перевод», под которой лежит огромная нейронная сеть.


У Facebook свои кластеры с GPU для обсчета таких сетей. И их должно быть действительно очень много под большое количество экспериментов. Хорошо, что все дата-центры у нас на возобновляемой, «зеленой» энергетике.

— Не могу не спросить: доводилось ли уже пересекаться с Марком Цукербергом? Не мучает ли тоска по родине и родной речи?

— Было дело, разговаривал с ним однажды, но совсем немного. Цукерберг человек занятой, у него куча встреч. Наша группа AI Research довольно важна, считается приоритетной. А потому мы очень тесно работаем с техническим директором Facebook Майком Шрепфером, который когда-то возглавлял разработку браузера Firefox.


В соседних командах работает несколько ребят, с которыми я вместе учился в БГУ. Вообще, здесь достаточно много русских, поэтому поговорить есть с кем. Команда Facebook, да и сама Калифорния — многонациональные, здесь не заскучаешь.

— Не планируешь ли получить ученую степень в довесок к карьерной лестнице?

— Задумывался над этим. Но мне кажется, что выгоднее остаться в таком месте, как лаборатория Facebook. Не у всех университетов есть такие ресурсы, как здесь. В первую очередь это касается машин, на которых можно обучать нейросети. Это большие деньги, которые могут себе позволить только компании уровня Google и Microsoft. Технологические гиганты переманили к себе и лучших специалистов, хотя те продолжают сотрудничество с университетами.

Перед собой я поставил задачу получить знания и развиться в этой области за следующие пять лет. И куда эффективнее это будет в лаборатории с прикладными задачами, чем в университете. К тому же область очень быстро развивается, и за пять лет, пока ты будешь получать PhD, все очень быстро поменяется.

Моноблоки в каталоге Onliner.by

Читайте также:

Перепечатка текста и фотографий Onliner.by запрещена без разрешения редакции. nak@onliner.by