Искусственный интеллект впервые обыграл человека в го
Китайская логическая игра го считается одной из самых древних и самых сложных настольных игр на планете. Она на порядок сложнее, чем шахматы. Тем не менее, по некоторым данным, в неё играют около 40 миллионов человек по всему миру (хотя большинство людей всё же признаются, что понять го почти невозможно). Самые мощные суперкомпьютеры мира также не могли играть в го выше простейшего уровня. До настоящего времени.
Исследователи Google разработали программу искусственного интеллекта под названием AlphaGo, которая способна конкурировать с профессиональными игроками. Не так давно эта программа обошла действующего трёхкратного чемпиона Европы по игре в го Фань Хуэя (Fan Hui) со счётом пять-ноль.
Как когда-то после победы суперкомпьютера Deep Blue над чемпионом по шахматам Гарри Каспаровым, это достижение можно считать переломным моментом в истории развития искусственного интеллекта и суперкомпьютеров. Кроме того, система AlphaGo освоила игру на своём собственном опыте.
Исследователь подразделения компании Google DeepMind Демис Хассабис (Demis Hassabis) пишет в своём блоге, что для ориентации в сложной игре программа AlphaGo использует технологию нейронных сетей – систему, которая работает подобно человеческому мозгу. Как пояснили разработчики, играя в го, система проигрывает в своём "мозгу" все возможные сценарии дальнейшей игры заранее.
У AlphaGo нейронных сетей две: одна из них оценивает позицию на доске, вторая – разрабатывает стратегии дальнейших действий, чтобы выбрать оптимальный следующий шаг.
"Мы очень рады, что система смогла освоить го, ведь таким образом мы решили одну из главнейших проблем искусственного интеллекта, – рассказывает Хассабис. – Наиболее важным аспектом этого достижения мы считаем тот факт, что AlphaGo использовала общие методы машинного обучения, чтобы понять, как следует играть в го".
Хассабис и проектная группа готовили программу, используя 30 миллионов записей партий, сыгранных экспертами-людьми. После этого они позволили искусственному интеллекту создавать свои собственные стратегии, проигрывая тысячи партий между своими нейронными сетями, содержащими 12 слоёв из миллионов соединений, похожих на человеческие нейроны.
После того как AlphaGo одержал 99,8% побед, играя против других программ (со счётом 499 к 1), системе была предоставлена возможность сразиться с чемпионом мира Ли Седолем (Lee Sedol), который считается лучшим игроком в го за последнее десятилетие.
Их состязание пройдёт в Сеуле в марте 2016 года. Победитель получит один миллион долларов США (в случае если выиграет AlphaGo, деньги пойдут на благотворительность).
"Я был польщён предложением сыграть с противником, который становится всё сильнее с каждой пройденной партией, – говорит Седоль. – Однако я уверен, что смогу одержать победу как минимум в первый раз".
К слову, эксперты также считают, что шансы одержать победу у Седоля по-прежнему достаточно велики.
"Мы надеемся, что в будущем методы, используемые нами при обучении AlphaGo, помогут нам решать множество насущных глобальных проблем, от климатического моделирования до комплексного анализа заболеваний", – добавил Хассабис.
Подробнее об искусственном интеллекте Google можно прочитать в научной статье журнала Nature.