Искусственный интеллект, научившись болтать, построил отношения лучше людей

22 января 2018 15:31
Часто задача игрока состоит в том, чтобы убедить партнёра сотрудничать. GLP
Интересы игроков, как правило, совпадают лишь частично. Это справедливо и в игре, и в жизни. GLP
Разработан алгоритм, который в условиях конфликта интересов устанавливает долгосрочное сотрудничество с людьми лучше, чем это получается у самих людей. Как ни странно, в этом ему помогает пустословие.

Международная команда исследователей разработала алгоритм, который в условиях конфликта интересов устанавливает долгосрочное сотрудничество с людьми лучше, чем это получается у самих людей. Как ни странно, в этом ему помогает пустословие, или "дешёвые разговоры". Детали исследования описаны в статье, вышедшей в журнале Nature Communications.

Уже на заре искусственного интеллекта программисты стремились научить компьютер играть в шахматы, шашки и так далее. Эти человеческие забавы в математике известны как игры с нулевой суммой. Классический пример – это игра в карты на деньги. Победитель выигрывает ровно столько денег, сколько теряют проигравшие. Для компании за карточным столом сумма выигранного, взятого со знаком плюс, и проигранного, взятого со знаком минус, строго равна нулю, отсюда и название.

Но существуют игры и с ненулевой суммой, где можно получить выигрыш не за счёт другого игрока. Например, если команда совместно собирает яблоки, которые потом по правилам игры делит поровну. Любое действие, которое повышает эффективность какого-нибудь сборщика, выгодно всем, ведь каждому достанутся дополнительные фрукты. Играть в такие игры искусственный интеллект тоже учили.

Однако в реальной жизни всё, как правило, сложнее. Интересы игроков частично совпадают, а частично противоречат друг другу. Здесь простейшим примером могут быть отношения работника и работодателя. Всякая фирма заинтересована в том, чтобы работник делал как можно больше, а получал как можно меньше. Понятно, что у сотрудника интерес прямо противоположный. С другой стороны, работник и работодатель нужны друг другу, поэтому им приходится искать компромисс.

Сотрудничество необходимо, но приходится искать наилучший компромисс, согласовывать интересы, следить за тем, чтобы не остаться в дураках, да ещё и зачастую убеждать партнёра принять твоё предложение. Эта сложная ситуация в математике моделируется с помощью стохастических игр. Искусственный интеллект, играющий в такие игры, – популярная тема новейших исследований.

В своей статье Джейкоб Кренделл (Jacob Crandall) из Университета Бригама Янга вместе с коллегами выполнил масштабный обзор алгоритмов машинного обучения, предназначенных для игр с частичным совпадением интересов.

Интересы игроков, как правило, совпадают лишь частично. Это справедливо и в игре, и в жизни.

Авторы предъявляли к таким разработкам весьма строгие требования. Во-первых, алгоритм должен хорошо работать в самых разных начальных ситуациях. Во-вторых, ведомый алгоритмом компьютер должен устанавливать эффективные отношения с другими игроками, не зная заранее, как они поведут себя. Под эффективностью здесь подразумевается, что искусственный интеллект налаживает сотрудничество, когда оно необходимо, но не позволяет другим игрокам эксплуатировать его в угоду их интересам. Кроме того, он должен уметь уговорить недоверчивого партнёра сотрудничать. В-третьих, всему этому компьютер должен научиться очень быстро, буквально за несколько раундов игры.

Подробно обсудив огромные технические проблемы, которые порождаются столь масштабными ожиданиями, авторы проводят обширный анализ на соответствие этим требованиям уже существующих алгоритмов. Затем они описывают свой собственный алгоритм, который они назвали S#, и по результатам испытаний признают его лучшим.

Помимо новой технологии машинного обучения козырем нового алгоритма стали "дешёвые разговоры" (cheap talk). Это сообщения, которые не несут никакой полезной информации (например, о ситуации "на доске", планируемых ходах и так далее), а просто укрепляют эмоциональную связь между игроками. Мы сами в своём рабочем коллективе или другой команде передаём такие сообщения, когда говорим "спасибо", "я рад тебя видеть" или "мы справимся".

Разумеется, у компьютера нет эмоций, но он может учитывать, что они есть у человека, и соответствующим образом составлять свои сообщения, а также анализировать чужие. Как уточняет пресс-релиз исследования, новый алгоритм в нужных местах говорил собеседнику "мы выиграем" или даже "ты поплатишься за это!".

В результате алгоритм превзошёл в налаживании эффективных отношений с другими игроками не только своих искусственных "коллег", но даже и людей. Как отмечают авторы, предыдущим алгоритмам это было не под силу.

Когда-то начав с шахмат и вывода теорем, искусственный интеллект всё глубже вторгается в сферу "человеческого, слишком человеческого". Возможно, недалёк тот час, когда молодой человек будет спрашивать у смартфона, как ему строить отношения с девушкой, и получать при этом компетентные советы.

К слову, "Вести.Наука" (nauka.vesti.ru) ранее писали об искусственной морали, разработанной для беспилотных автомобилей, а также о том, как компьютер научили писать музыку и песни.