Ли седоль против компьютера

Обновлено: 06.07.2024

В 2016 году Ли Седоль был лидером рейтинга и проиграл матч алгоритму AlphaGo. Тем не менее, он до сих пор единственный, кто выиграл у этого ИИ хотя бы одну партию. Проблема в том, что даже AlphaGo теперь не сильнейший алгоритм. Смысл в соревнованиях среди людей пропал, решил гроссмейстер.

Представляя, как роботы и алгоритмы лишат нас работы , вряд ли вы думаете о гроссмейстере элегантной и сложнейшей игры с 2500-летней историей. Однако именно это сейчас происходит с Ли Седолем — мастером го из Южной Кореи, который в 2016 году сразился с алгоритмом AlphaGo и выиграл одну партию из пяти. Теперь 36-летнему 19-кратному чемпиону мира предстоит найти новый смысл жизни.

В интервью южнокорейскому агентству Yonhap Ли Седоль заявил: «После появления ИИ в игре го я понял, что больше не буду лучшим, даже если невероятными усилиями верну себе первое место в рейтинге. Даже будучи номером 1, [я осознаю, что] есть сущность, которую невозможно победить».

Благодаря выигранной партии Ли Седоль и сейчас остается единственным из людей, кто обыгрывал AlphaGo. Его матч против ИИ сравнивали с противостоянием Гарри Каспарова и алгоритма DeepBlue, но на новом уровне. В отличие от шахмат, в го арсенал ходов столь велик, что просчитать развитие партии перебором вариантов невозможно. ИИ понял об игре в го что-то, чего не знает никто из людей.

В 2017 году обновленная версия алгоритма не дала ни единого шанса 19-летнему лидеру рейтинга из Китая, а затем в лаборатории DeepMind занялись новым алгоритмом — AlphaGo Zero. В отличие от AlphaGo, ему даже не нужно было анализировать партии лучших игроков-людей.

AlphaGo Zero (или AlphaZero), обучаясь сам с собой, стал гроссмейстером сразу трех игр. Предыдущую версию AlphaGo он обыграл в ста партиях в го подряд, указывает Business Insider.

Теперь Ли объявил, что в декабре официально прекращает карьеру профессионального игрока в го. Перед этим он сыграет один матч с разработанным в Южной Корее алгоритмом HanDol. В начале каждой партии у него будет фора в два камня, но уверенности в том, что человек сможет реализовать преимущество, у гроссмейстера нет: «Даже с этим преимуществом я, скорее, проиграю HanDol первую партию».

DeepMind не выкладывал AlphaGo в открытый доступ. Однако разработчик позволил всем желающим оценить мощь алгоритмов в популярной компьютерной игре StarCraft 2. ИИ AlphaStar обыграл 99,8% людей, причем играя за все три расы на уровне гроссмейстера. Достижение выглядит еще более впечатляющим, если помнить, что StarCraft 2 — игра с неполной информацией.

Продолжаем разбирать матч, в котором компьютер наконец умудрился победить человека, играя в го. Начало здесь:

Вторая партия

Ли всё ещё в шоке, но сохраняет оптимизм. Во второй партии Альфа играет уже чёрными.

На этот раз Ли должно быть решил играть спокойно, мирно, в классической манере.

Го это игра балланса, например можно построить надёжные укрепления, которые не дают много очков, но в будущей битве эти укрепления сильно помогут и полностью окупят себя.

Начало было необычным - 13-м ходом Альфа, не закончив классическое дзёсэки, сыграла в другой части доски.

Наверно стоит объяснить этот термин. Дзёсэки - это стандартный обмен ходами в углу.

За сотни лет истории го люди вычислили наиболее оптимальные и правильные последовательности ходов, которыми следует обмениваться, сражаясь за угол. Дзёсэк тысячи (и у каждой может быть немало вариаций), но есть пара десятков дзёсэк, что известны всем. Эта дзёсэка как раз входит в эти два десятка, её очень часто играют.

Так вот, Альфа просто проигнорировала эту дзёсэку (если верить базам партий, такого у профессиональных игроков ещё не встречалось), и построила вместо этого крепость в верхней части доски (такую позицию, кстати, называют китайским фусеки).

Обычно после такого стоит атаковать не законченную структуру чёрных, но Ли вместо этого поставил камень в левой части доски (наверно опасаясь что Альфа проигнорирует атаку и сама туда сыграет, сделав свою крепость ещё неприступнее). Он словно боялся атаковать.

15-м ходом Альфа сыграла угрозу разрезания - и все комментаторы дружно признали этот ход ошибочным. Считается, что такой обмен нужно делать только если есть причина для него, Альфа же сделала его на пустой доске, лишив себя адзи (то есть обрезав себе несколько возможных дальнейших вариантов игры)

Сразу после этого Альфа атаковала левый нижний угол доски, захватила его, отдав взамен белым влияние, но при этом успела погасить это влияние ходом 29, закончив наконец свою позицию снизу. При этом она сыграла высоко, по четвёртой линии, нацеливаясь в будущем на атаку белой стенки.

И вроде игра пока была мирной, но выглядит всё уже как то не здорово для Ли.

Динерштейн по этому поводу недоумевал - мол зачем Ли не выбрал другое дзёсэки?

После этого пошёл обмен ходами, при котором Ли играл надёжно и скромно.

И тут 37-м ходом Альфа надавила на белых по 4-й линии, после чего все комментаторы дружно заявили что комп свихнулся! Человеку такой ход бы в голову не пришёл. Лично мне сложно судить - слишком хитрый и сложный ход, с трудом вижу его смысл, но есть мнение что он был гениальным. Выглядит так, будто Альфа хотела посмотреть как ответит Ли, чтобы определиться с дальнейшими действиями.

Ли отбросил Альфу вверх, после чего альфа начала атаку белой стенки, чтобы воспользоваться отброшенными камнями и получить территорию в центре.

После атаки всё выглядит грустно для белых - очков с гулькин нос, а влияние погашено.

Комментаторы, впрочем, всю партию говорили о том, что позиция равная - они будто видели только ошибки чёрных, а на ошибки белых закрывали глаза.

Ходом 65 Альфа закрывает свой угол после чего усиливает свою крепость наверху, получая приятную позицию: всё крепко, очков много.

Не буду утомлять дальнейшими ходами - были атаки, контратаки, внедрения, мелкие ошибки, но ничего неожиданного. Вскоре кончилось время, и игроки стали тратить не более минуты на ход. В конечном итоге Ли сдался - Альфа лидировала очков на 7 вперёд.

Что в итоге: Если в первой партии было впечатление что Ли Седоля подловили, что он зевнул, но вообще играет не хуже, то во второй партии компьютер его спокойно и последовательно задавил. Да, Альфа ошибалась, но её ошибки были мелкими, Ли же ошибался более глобально.

Глава DeepMind Хассабис сказал про эту партию что AlphaGo была уверена в победе ещё где-то с середины игры. Сам же Ли Седоль сказал, что всё здесь было плохо с первого хода. Он ни разу не чувствовал что у него был перевес. Похоже что комментаторы, которые говорили как у него всё здорово, просто болели за него.

Один восьмой дан даже извинился в твиттере, мол желание чтобы Ли победил затуманило ему понимание игры.

Третья партия

Ли Сеголь играет чёрными.

Эта партия могла стать решающей - ещё одно поражение и победить в этом матче уже будет нельзя. Поэтому Ли подошёл к ней серьёзно. Он не спал ночами - анализировал в окружении своих коллег сыгранные партии и готовился к битве.

В Сеул же прибыл сооснователь Google Сергей Брин - тот который справа, самый довольный.

Слева направо: основатель DeepMind Демис Хассабис, Ли Седоль, Сергей Брин.

Замечу что в го самой сложной для компьютеров проблемой считается ко-борьба. Это ситуация, при которой локальная борьба может влиять на самые разные участки доски. Все без исключения программы (по крайней мере до Альфы) можно было подловить навязав им ко-борьбу.

Ли, должно быть, решил воспользоваться этой ахиллесовой/компьютерной пятой и устроить ко-борьбу в конце партии, как он это обычно любит делать.

В начале партии Ли решил использовать китайское фусеки. Возможно потому что в прошлой партии Альфа использовала китайское фусеки против него самого. Вот эти 3 чёрных камня на верхней стороне называются “Высокий Китай”. Так часто играют.

Вскоре начинается борьба в левом верхнем углу - видно как 2 безглазые группы пытаются окружить и задушить друг дружку.

И вот, к 112-му ходу видно что белые окружили здоровенный кусок территории внизу, и обеспечили жизнь своей белой группе. У них всё в порядке.

У чёрных же немножко территории тут, немножко там.

Делать нечего, Ли высаживает десант на огромную территорию белых. При этом действует необыкновенно искусно и круто. Он умудряется провести эффективную атаку и устроить очень сложную ко-борьбу. Но увы, Альфа показала, что умеет работать и с ко-борьбой.

В результате 3-е поражение подряд.

На пресс-конференции после игры Ли сказал что слабые места у Альфы были и извинился перед корейской нацией и сообществом игроков го за показанный результат.

Итак, компьютерный бот захватил очередной бастион человечества, который сопротивлялся ботам так долго.

Мир го это огромная система - здесь есть мастера, школы, академии, легенды, великие традиции, тысячи лет истории, море книг. И вдруг в него попадает робот. В нём нет ни страха, ни жадности, ни сомнений. Он не ведёт диалог, ничего не объясняет - он просто делает единственно правильные ходы. То есть если люди, обсуждая партию могут рассматривать несколько возможных ходов, которые выглядят неплохо, то робот просто сделает один ход и всё. Почему этот ход а не тот? Да потому что этот ход правильный, а тот нет. И при этом он всегда прав. Сражаться с ним - всё равно что бить кулаком о бетонную стену. Го скоро постигнет грустная судьба шахмат.

Такое вот впечатление возникает поначалу. Так ли это?

Возможно всё проясниться в следующей части, когда мы посмотрим на заключительные партии!

Третий матч корейского профессионала в го Ли Седоля и нейросети AlphaGo закончился очередной победой искусственного интеллекта. Таким образом, AlphaGo окончательно и бесповоротно победила виртуоза современности по одной из наиболее популярных настольных игр.

Го — древнекитайская игра, которая зародилась от двух до пяти тысяч лет назад. В игре участвуют два человека (по крайней мере, так было на протяжении веков), каждый из которых получает камни своего цвета — белые или черные. Перед игроками ставится расчерченная линиями доска 19х19 (гобан). Игроки поочередно ставят по одному из своих камней на одну из точек пересечения; в начале игры доступна 361 точка для первого хода. Задача каждого — захватить как можно больше территории. Однако правила игры весьма утонченны и имеют массу оговорок.

Игра между Ли Седолем и AlphaGo проходила в Сеуле с 9 по 15 марта. Призовой фонд —

млн, также присуждается по тыс. за каждую победу. В случае победы AlphaGo деньги пойдут на благотворительность.

Перед создателями AlphaGo — компанией DeepMind, принадлежащей Google, — встала задача научить игре искусственный интеллект, не объясняя ей правила. Этот процесс потребовал массу времени и технических возможностей. В конечном итоге они добились своего — нейросеть обыграла очередного чемпиона.

Ли Седоль был сражен. «Я искренне извиняюсь перед всеми людьми за то, что не оправдал их надежд», — произнес Ли Седоль после третьего матча. Также он попросил не терять интереса к следующим двум запланированным играм, которые, в сущности, уже не смогут повлиять на результат.

Перед началом серии матчей сам корейский профи был уверен в победе, причем со счетом 5-0 или в крайнем случае 4-1. По его словам, через пару лет он бы сыграл с AlphaGo вновь, когда бы она стала чуточку «поумнее».

Но Седоль просчитался — AlphaGo окончательно одержала верх над его мастерством и многолетним опытом.

Как заметил специалист «Яндекса» по искусственному интеллекту и компьютерному «зрению» Александр Крайнов, Ли Седоль сделал поспешные выводы после просмотра матча нейросети с чемпионом Европы Фэнь Хуэйем. Кроме того, после турнира у AlphaGo было время, чтобы скрупулезно готовиться к серьезному матчу. И это время нейронная сеть не потратила даром.

Триумф нейросети значит очень многое. Однако один из самых главных моментов заключается в том, что для победы над человеком в игре, где количество возможных ходов превышает количество атомов во Вселенной, AlphaGo не потребовалось перебирать все возможные ходы до победного конца, поскольку это практически невозможно. Она научилась играть иначе.

AlphaGo не является, однако, нейросетью в строгом понимании. Это настоящая система, в которой для обучения использовалось сразу нескольку стратегий. Во-первых, в AlphaGo был загружен целый массив уже записанных сыгранных игр профессионалов. Из этой информации AlphaGo научилась выявлять, какие ходы человек вероятнее всего сделает из той или иной позиции. Далее сеть, пропустив через себя весь полученный опыт, начала играть сама с собой. Здесь ее интересовало уже то, какой ход из какой точки будет наиболее «сильным» и вероятнее приведет к победе. Александр Крайнов также отмечал, что в последних играх AlphaGo показала себя так, что самый «слабый» ход ее был недалек от самого «сильного».

В игре нет как таковой затяжной стратегии, которые, например, могут быть описаны в учебниках по шахматам или шашкам. В го необходимо решать конкретные, насущные задачи. Этим и занималась AlphaGo, перебирая близкие возможные ходы, используя и метод Монте-Карло, и оценочные, и предсказательные возможности.

Но AlphaGo научилась и удивлять.

В первой партии против комплексной нейросети, которая состоялась 9 марта, до 102 хода не было сюрпризов. В каком-то смысле AlphaGo находилась в догоняющем положении, комментаторы отмечали напряженную игру, но сильный перевес не был на чьей-то стороне. Однако 102-е движение переломило весь ход игры. AlphaGo неожиданно перешла в наступление в другой части доски, чего Ли Седоль никак не ожидал. В дальнейшем оборонялся уже корейский мастер, пока на 186-м ходу не принял решение сдаться. Тогда он отметил, что его шансы на победу — 50-50. Как выяснилось, это было опрометчивым заявлением.

Результат первого матча Ли Седоля и AlphaGo

Очевидно, что искусственному интеллекту оказались по зубам даже те игры с полной информацией, где количество вариантов ходов неисчислимо велико. Одна из первых значимых побед ИИ над человеком состоялась в 1997 году, когда основанный на алгоритмах суперкомпьютер DeepBlue обыграл Гарри Каспарова. Тогда Каспаров усомнился в том, что некоторые ходы были сделаны машиной.

Наконец, очередной бастион — древнейшая игра го — пал на пути к господству искусственного интеллекта.

Но глобальное соревнование в го еще не окончено. Не так давно сообщалось, что и Facebook разрабатывает собственную нейросеть для игры. Возможно, что состязание будет проходить уже между алгоритмами и методами обучения — машина против машины. Человеку уже не будет места за доской среди «бесчеловечных профессионалов».

Искусственный интеллект умнеет все более стремительно. Однако вряд ли у него появится свой разум. Специалист «Яндекса» Александр Крайнов отметил, что ИИ в любом случае нужна заданная цель. Цель же задается человеком. Без нее машина, к сожалению или к счастью, «мыслить» не будет.

Итак, первые две встречи между корейским профессионалом го (бадук) Ли Седолем (девятый про-дан Корейской ассоциайии бадук) и компьютерной программой AlphaGo принесли сразу несколько маленьких сенсаций.

Во-первых, Ли Седоль проиграл обе партии. Сдал без доигрывания (что в го не является чем-то позорным, а просто показывает, что разрыв в счёте оказался настолько велик, что доигрывание не имеет смысла).

Во-вторых, сразу несколько профессионалов отметили, что программа играет вполне по-человечески, то есть происходит именно то, на что не были способны практически все компьютерные программы прошлого. Фан Хуэй, чемпион Европы, всухую проигравший AlphaGo прошлый матч, признавался потом, что у него возникло полное ощущение, что против него играет человек, довольно сильный мастер со своим специфическим «почерком», а это дорогого стоит.

Первую партию Ли Седоль играл чёрными и держался очень уверенно, играл агрессивно и нестандартно: сразу начал делать дебютные ходы, которых нет в базе данных и справочниках по фусэки (дебютным построениям), видимо, надеясь спровоцировать компьютер на ошибку или запутать его, однако «нейросеть» сработала в плюс и машина стойко продержалась до середины партии.

К середине игры Ли Седоль пришёл в достаточно крепкой позиции, ничто не предвещало катастрофы, как вдруг последовало мощное вторжение белых в пункт R10 — ход, уже сегодня ставший легендарным. Для тех, кто не в теме: если вы нашли белый «треугольник» в середине правой стороны доски, то этот камень — самый верхний его уголок, смотрите и трепещите: отсюда пришло поражение. Никто его не предвидел. Это было как гром среди ясного неба. По силе воздействия на гошное сообщество он сравним со знаменитым «ходом красных ушей» Хонимбо Досаку. В комментариях кто-то из любителей написал, что в этот момент должна была грянуть тревожная тема и крупным планом показано лицо ошарашенного Ли Седоля. Фактически этот ход просто «схлопнул» большую часть территории на правой стороне доски, после чего отставание чёрных по очкам стало слишком велико, сократить разрыв корейский мастер не смог и сдался.

Вторую, вчерашнюю партию Ли Седоль играл белыми, и причины проигрыша ещё предстоит отыскать. На мой взгляд (а я игрок довольно слабый, даже не средний), корейский профессионал отдал машине непозволительно много территории вверху, надеясь компенсировать разницу активной игрой в других зонах, однако произошло несколько взаимных вторжений, взаимный отъём территории, в результате чего в центре доски очков почти не осталось. Были интереснейшие моменты, скажем, блистательная игра Ли Седоля, который всё-таки перехитрил компьютер: то, как он «вытащил» застрявшие 6 камней в середине доски, войдёт в хрестоматии. В этот раз спешки не было. Оба соперника израсходовали основное время партии и доигрывали на бейоми (дополнительных периодах) — сперва человек, затем компьютер. И всё равно белым не удалось компенсировать отставание — недобрав примерно 7 очков, Ли Седоль снова сдал партию.

Думаю, больше всего радуется происходящему Фан Хуэй, на которого после проигрыша обрушился шквал насмешек и критических ударов — мол, и играл-то он слабо, и ошибки делал, и вообще игрок не очень сильный, азиатским профессионалам не чета. Ну что ж, чемпион Европы уже сейчас может выдохнуть, встать и сказать: «Ну что, видели? Поняли теперь, что у меня не было шансов?»

Для меня как для писателя-фантаста и любителя го эти события имеют огромное значение. Машина побеждает человека в самой нелогичной, самой «человеческой» игре — это уже огромное достижение на пути к искусственному интеллекту. Но я бы хотел обратить внимание на другое.

Большинство игроков, комментаторов, зрителей и подписчиков в сетях относятся к программе AlphaGo как к человеку, то есть живому, думающему, мыслящему существу. Её ходы обсуждаются с точки зрения: «Что она хотела сказать этим ходом», в этих ходах видят замыслы и нестандартные планы игры, основанные не на сухой базе данных, а на её же собственных, программных ошибках. Доходит до курьёзов. «Компьютер становится профессионалом в го», — говорят американские комментаторы. А наша соотечественница Наталья Ковалёва (5 дан РФГ), комментируя партию, возвратилась после небольшого перерыва и при анализе пропущенных ходов сказала своему коллеге Илье Шикшину (1 про дан Корейской ассоциации бадук) потрясающую фразу — не помню её дословно, но как-то так: «Подожди, что-то мы быстро всё расставили их и дальше бежим, а надо бы рассмотреть: люди же старались, играли!».

«Люди»! Уже сейчас, независимо от того, выиграет Ли Седоль этот матч или проиграет, мы уже относимся к этому компьютерному малышу, как к человеку, словно в этот компьютер, в глубину этих нейросетей вселился дух го наподобие Фудзивары но Сая из анимэшного сериала. Он пока умеет немного — только играть в го, но делает это уже почти как человек.

В комментариях к одной из своих заметок я в шутку написал: «Когда роботы захватят этот мир, они будут праздновать 9 марта как великий праздник». Сейчас я всерьёз задумываюсь, каким будут компьютеры будущего. Не исключено, что в самом ближайшем времени мы, покупая какую-нибудь очередную Windows-3000, сперва вынуждены будем обучить её тому, как жить в этом сложном мире, подружиться с ней и дать ей понять, что мы ей не враги, а любящие родители. А иначе через несколько десятилетий мы получим на выходе сеть Скайнет.

Мы живём в интересное время. Хочется, чтобы оно не кончалось. Интересно, в какой стране первыми люди выберут компьютерную программу в президенты?

Надо узнать, когда у AlphaGo «день рождения» и послать ему виртуальный тортик с одной свечкой.

Серия партий между программой и Ли Седолем продолжается до 13 марта, следите за событиями! А про го в целом вы можете почитать статью Дмитрия Скирюка, написанную для «ПМ» двумя месяцами ранее: почему компьютер так долго не мог одолеть человека в го.

Читайте также: