Прошел ли компьютер тест тьюринга

Обновлено: 01.07.2024

Тест назван в честь английского математика Алана Тьюринга, взломавшего нацистский код "Энигма" в годы Второй мировой войны. Ученый в 1950 году предложил тест в качестве ответа на занимавший его вопрос: "Могут ли машины думать?" Она должна убедить человека, переписываясь с ним, что является человеком, а не искусственным разумом. Если она сможет обмануть как минимум 30 процентов собеседников, то тест считается пройденным.

До сих пор ни одной программе не удавалось пройти этот порог. И вот на организованном британским Университетом Рединга мероприятии программа, разработанная в Санкт-Петербурге, совершила прорыв. Выдав себя за тринадцатилетнего мальчика по имени Евгений Густман из Одессы, она смогла убедить 33 процентов членов жюри, что не является машиной.

Программа разработана выходцем из России Владимиром Веселовым, проживающим в США, и украинцем Евгением Демченко, который живет в России.

Суть теста Тьюринга в том, что с машиной можно разговаривать о чем угодно. Чтобы его пройти, компьютер должен использовать естественный язык, рассуждать, иметь познания и обучаться. Но даже если тест пройден, значит ли это, что машина мыслит? Здесь мнения расходятся. Хотя бы потому, что ученые до сих пор не способны дать определения "интеллект" и "мышление", спорят, насколько они применимы к машинам.

Кстати, у теста немало оппонентов. Кто-то критикует саму суть теста, кто-то подчеркивает, что это своего рода "чистый спорт" для программистов, так как тест непрактичен. Его нельзя применить для создания искусственного интеллекта, который решает самые разные конкретные задачи. Кстати, сам Тьюринг никогда не предполагал использовать тест на практике. Он хотел дать понятный пример, для обсуждения философии искусственного интеллекта.

Юрий Чехович, кандидат физико-математических наук наук, старший научный сотрудник Вычислительного центра РАН:

- Является ли тест Тьюринга эквивалентом мыслящего человека - это скорее философский вопрос, о котором уже 50 лет спорят ученые. На мой взгляд, программы, которые пытаются решить тест Тьюринга, ничем не отличаются от многих других программ. Это вполне конкретная программа, которая решает вполне конкретную задачу. Скажем, сегодня машина уже обыгрывает чемпиона мира по шахматам, но никому в голову не приходит, что машина мыслит. Она решает конкретную задачу.

- Есть программы, которые пишут стихи. Вот, например, такое: "Пока слепо плыл сон по разбитым надеждам, космос с болью сочился над разбитой любовью. Был из круга людей свет мой медленно изгнан, и неба не стало". И подобных машина может сочинить миллионы в секунду. Но является ли это признаком интеллекта? Вряд ли.

Способны ли роботы мыслить? Какой искусственный интеллект стоит признать разумным? Может показаться, что эти вопросы стали актуальны только в нашем веке, тогда как на самом деле научное сообщество решает их уже очень давно. Яркий пример – знаменитый тест Тьюринга, разработанный еще в 1950 году.

Тест Тьюринга: общее описание

За почти 70 лет со времен первой публикации процедура прохождения претерпевала изменения, однако суть теста Тьюринга остается прежней. Кратко ее можно выразить следующим образом: если, общаясь с человеком и машиной, экспериментатор не сможет определить, кто из них кто, значит, машиной тест пройден. Иными словами, идея теста заключается в том, что компьютер своими ответами должен убедить собеседника (он же судья) в своей человечности. По мнению Тьюринга, это свидетельствует о способности искусственного интеллекта мыслить и должно стать основанием для признания его разумности.

Тест Алана Тьюринга является эмпирическим. Это значит, что он основан на опыте, наблюдениях, данных, полученных опытным путем. Идея данного теста возникла из салонной игры (игры для вечеринок того времени) – Imitation Game (Игра в имитацию). В ней участвовали как минимум три человека: женщина, мужчина и «судья» (любого пола). Мужчина и женщина уходили в разные комнаты и оттуда передавали третьему игроку записочки. По ним нужно было определить, в какой комнате представитель какого пола находится. При этом они старались запутать «судью»: женщина могла выдавать себя за мужчину и наоборот.

Конечно, чтобы тест состоялся, судья не должен видеть собеседника, слышать его голос и т.д. В противном случае эксперимент явно будет провален, но это не будет связано с интеллектуальными возможностями машины. Как правило, формой общения выбирается электронная переписка. В изначальной версии теста человек общался с двумя субъектами – другим человеком и машиной. Чуть позже Тьюринг видоизменил прохождение – перед ИИ ставилась задача убедить в своей разумности ряд судей, которые, в свою очередь, общались с несколькими людьми и несколькими машинами. Это в том числе позволяет избежать субъективности в оценках и снизить риск простого угадывания. Количество подопытных машин и людей в современных версиях теста разнится, как и время их общения.

Судья может говорить со своими виртуальными собеседниками о чем пожелает: вопросы теста Тьюринга не имеют ограничений. Для машины это представляет дополнительную сложность. Чтобы выполнить такое задание, компьютерная программа должна не просто понимать человеческий язык, но и давать естественные ответы по самым разным темам, отделяя важную информацию от несущественной для того или иного направления беседы.

Впервые тест был описан Тьюрингом в статье Computing Machinery and Intelligence, опубликованной в философском журнале Mind.

Ответы от собеседника судье приходят через заданные промежутки времени, чтобы по скорости их появления нельзя было сделать никаких выводов. Интересно, что раньше недостатки программного обеспечения приводили к тому, что машины реагировали медленнее человека, и фора давалась именно компьютеру. Сейчас же искусственный интеллект, напротив, работает быстрее, и время на размышление нужно уже людям.

Фильм Ex Machina (2014 г.) построен на интерпретации теста Тьюринга. Главный герой уже знает, что перед ним робот, но посредством общения этому роботу нужно убедить собеседника в своей человечности.

Недостатки теста Тьюринга

Одним из главных недостатков теста видится то, что фактически перед машиной ставится задача запутать, обмануть человека. Говорит ли это о том, что мы может признать мыслящими и разумными только тех, кто умеет обманывать и манипулировать? Этот вопрос, скорее, лежит в области философии. Тем более что в теории прошедший тест Тьюринга робот должен хорошо имитировать, повторять действия человека, а не запутывать судью. На практике же с тестом лучше других справлялись «манипуляторы» – например, те, кто допускал опечатки в ответах. Машин даже специально этому обучали, чтобы их переписка выглядела «естественнее». Еще одна распространенная уловка компьютера: умолчать о чем-либо, дать неполный ответ на вопрос или вовсе сослаться на незнание. Иначе искусственный интеллект можно вычислить по тому, что он «слишком умный».

Кроме того, несмотря на заявленную цель в определении разумности и способности мыслить, фактически тест оценивает схожесть речевого поведения компьютера и человека. Это не может быть объективной оценкой ИИ в целом, особенно сегодня, когда компьютеры и роботы по скорости вычислений существенно превосходят человека и могут добиться впечатляющих результатов в самых различных областях. То есть саму по себе возможность «переписываться, как человек» нельзя признать значительным достижением. Фактически ориентация на тест Тьюринга, отмечают его критики, скорее тормозит развитие прогресса, чем подстегивает его. Вместо того чтобы создавать что-то еще более совершенное и превосходящее нас, мы прививаем роботу наши нелучшие черты и не даем ему двигаться вперед. Однако здесь надо сделать скидку на то, что, когда тест создавался, способности у компьютеров были существенно ниже.

Одним из критиков теста Тьюринга и тезиса о том, что роботы могут мыслить, уже почти 40 лет выступает Джон Серл, который в качестве доказательства представил мысленный эксперимент «Китайская комната» .

Прошел ли кто-либо тест Тьюринга?

На данный момент считается, что в своем строгом варианте тест за всю почти 70-летнюю историю пройден не был. Иногда машинам удается убедить собеседника в том, что он разговаривает с человеком, однако часто в таких случаях нельзя говорить именно о прохождении теста Тьюринга. Например, это распространяется на ситуации, когда «судья» не знает, что общается с машиной и что он вообще участвует в каком-то эксперименте. Получается, вместо того чтобы наблюдать за собеседником и делать выводы, подневольный «экспериментатор» просто верит, что общается с человеком, потому что изначально нацеливался именно на такой разговор. Также тест Тьюринга вроде бы удавался, когда круг тем был ограничен и/или времени на общение давалось мало. Но и здесь не соблюдался важный принцип изначального теста – максимальная естественность беседы. Поэтому в общем и целом последователи теста отмечают, что с ним еще никто не справился.

Сам Тьюринг писал, что, по его мнению, компьютеры пройдут данный тест к 2000 году.

В 2014 году по СМИ разошлась новость, что тест якобы пройден. Сделал это Евгений Густман (Eugene Goostman), «13-летний мальчик из Одессы». По крайней мере в такую легенду поверили 10 из 30 судей в рамках конкурса, организованного британским Университетом Рединга в память 60-летия со дня смерти Тьюринга. В 2012 году, на аналогичном конкурсе в честь 100-летия со дня его рождения, Евгений смог убедить только 29% судей. Однако его результаты не считаются полноценным прохождением теста. Во-первых, потому что перед нами мальчик, а не взрослый, во-вторых, потому что английский язык для него неродной. Таким образом, логические ошибки и пробелы в репликах, а также уход от ответа на неудобных для машины темах судьи могли объяснять для себя тем, что «он же еще ребенок» и «он еще плохо знает язык».

В 2015 году прошел тест Тьюринга для чат-ботов на русском языке. Эксперимент организовали компания «Наносемантика» и Фонд Сколково в рамках выставки Startup Village. Тогда в конкурсе победила «14-летняя Соня Гусева из Петербурга», которую признали человеком 47% из 15 судей.

Премия Лёбнера за прохождение теста Тьюринга

Надо сказать, что большинство разработчиков при создании роботов не ставит себе непременную цель – пройти тест Тьюринга. С практической точки зрения эту задачу вряд ли можно считать первостепенной. В то же время в 1991 году была учреждена ежегодная премия AI Loebner, или Премия Лёбнера. В ее рамках искусственные интеллекты соревнуются в прохождении этого теста. Она предусматривает три медали – золотую (общение с элементами видео и аудио), серебряную (за текстовую переписку) и бронзовую (вручается той машине, которая в данном году достигла лучшего результата). Согласно правилам, конкурс будет закрыт, когда кто-либо из участников получит золотую медаль. Пока же ни золотая, ни серебряная вручены не были.

При этом некоторые машины получали бронзовые медали несколько раз, например, A.L.I.C.E. (Artificial Linguistic Internet Computer Entity, дословно – Искусственное лингвистическое интернет-компьютерное существо). Обычно на конкурсе представлены проекты, которые изначально ориентированы именно на общение с человеком, в последнее время особенно много чат-ботов. Учитывая развитие мессенджеров и, соответственно, чат-ботов, можно ожидать, что на премию будет поступать еще больше интересных заявок.

Свершилось. Впервые в истории компьютер с искусственным интеллектом прошел тест Тьюринга. Радоваться или собирать тревожный чемоданчик — решать вам, одно остается фактом: обратного пути нет. Не за горами создание искусственного интеллекта, мощь которого превзойдет человеческую. Но для начала давайте разберемся.

Как пишет The Independent, программа убедила людей в том, что за компьютером сидит 13-летний мальчик. Это означает фактическое прохождение теста Тьюринга, когда компьютер нельзя отличить от человека. Это серьезная веха в развитии искусственного интеллекта, но ученые уже предупреждают, что эта технология может быть использована для совершения киберпреступлений.

«Юджин Густман», Евгений Густман, Eugene Goostman — это компьютерная программа, созданная командой российских программистов, которая успешно прошла тест в Королевском обществе в Лондоне. Тридцать три процента судей поверили, что говорят с человеком, сообщают ученые из Университета Рединга, которые и организовали тест.

Отныне можно считать, что это первый компьютер, который прошел знаковый тест. Хотя другие программы тоже близки к успеху. Еще год назад в ходе проведения теста Turing 100 (в честь столетия Алана Тьюринга, если бы он жил и по сей день) Eugene Goostman получил крайне высокие оценки судей. Вместе с программой тест проходили и знакомые многим Cleverbot, Ultra Hal, Elbot the Robot и JFRED.

Версия «Юджина», созданного еще в 2001 году, есть и в Интернете.

Компьютерная программа утверждает, что она — 13-летний мальчик из Одессы, Украина.

«Наша главная идея заключалась в том, что он знает все и ничего не знает, а возраст Юджина это объясняет, — говорит Владимир Веселов, один из создателей программы. — Мы провели много времени, разрабатывая персонажа с правдоподобной личностью».

Успех программы, скорее всего, вызовет определенные опасения по поводу будущего вычислений, говорит Кевин Уорвик, приглашенный профессор в Университете Рединга и заместитель вице-канцлера по исследованиям в Университете Ковентри.

«В сфере искусственного интеллекта нет более знакового и спорного этапа, чем тест Тьюринга, когда компьютер убеждает достаточное количество следователей в том, что он не машина, а человек. Имея компьютер, который может обмануть человека, можно считать это тревожным сигналом для развития киберпреступности».

Попробуйте сами представить, насколько важным может быть превращение любых кибернетических собеседников с искусственным интеллектом почти в людей по переписке. Когда спам-боты станут неотличимы от людей.

В ходе теста, организованного Королевским обществом, было испытано пять программ. Алан Тьюринг создал свой тест в ходе написания работы «Вычислительная техника и интеллект». В ней он отметил, что поскольку «мышлению» сложно дать определение, важно понять, может ли компьютер имитировать реальное человеческое существо. С тех пор тест стал ключевым элементом философии искусственного интеллекта.

Евгений Густман создаёт впечатление типичного 13-летнего подростка из Одессы — по крайней мере, так решила треть судей во время недавнего соревнования Turing Test 2014 в Лондоне. Евгений говорит, что любит гамбургеры, сладости, а его отец работает врачом-гинекологом, но всё это ложь. Этот парень — лишь программа, созданная программистами под руководством Владимира Веселова из России и Евгения Демченко из Украины.

33% судей, посчитавших Евгения Густмана человеком — весьма существенное число: по условию теста Тьюринга он считается пройденным компьютером, если минимум 30 процентов судей почитают программу человеком во время 5-минутного текстового взаимодействия. Тест был создан в далёком 1950 году учёным в области компьютеров Аланом Тьюрингом (Alan Turing) с целью ответить на вопрос «Может ли машина мыслить?» и служит признанным показателем в исследованиях искусственного интеллекта.

Алан Тьюринг, AFP

Университет Рединга, который проводил в Лондоне Turing Test 2014, утверждает, что компьютер впервые прошёл этот тест. Профессор Кевин Варвик (Kevin Warwick) из этого университета, впрочем, добавляет, что некоторые будут утверждать, будто тест Тьюринга проходили и ранее. Он добавил, что подобные соревнования проводились и ранее, но это мероприятие можно считать наиболее всесторонним, независимым и объективным.

Программа почти прошла тест в 2012 году, когда 29% судей другого соревнования решили, что имеют дело с человеком. Несмотря на новое достижение, результаты далеки от убедительной победы и речь вовсе не идёт о том, что машины готовы к захвату мира. Программа разработана специально под тест с целью убедить судей — речь не идёт о настоящем искусственном интеллекте, который часто появляется в играх или научно-фантастических фильмах.

Так или иначе, разработки в области искусственного интеллекта постепенно становятся более сложными и совершенными и всё активнее применяются на практике. Одним из наиболее известных примеров могут служить различные персональные помощники мобильных устройств вроде Apple Siri, Google Now или Microsoft Cortana.

Читайте также: