Компьютерное зрение и машинное обучение в чем разница

Обновлено: 07.07.2024

Искусственный интеллект – предмет компьютерных наук, нацеленный на создание машин и компьютеров, которые могут улучшить логические операции. Системы ИИ способны выполнять задачи, естественно связанные с человеческим интеллектом, такие как распознавание речи, принятие решений, визуальное восприятие и перевод языков.

Алгоритм

Алгоритм – это набор инструкций для выполнения задачи. Если мы хотим, чтобы компьютер понимал, как что-то делать, нам нужно дать ему алгоритм. Мы, вероятно, используем алгоритмы в нашей повседневной жизни, сила алгоритма заключается в том, что компьютеры могут выполнять шаги быстро и точно. Алгоритмы используются для обработки данных, расчетов и автоматического рассуждения.

Машинное обучение

Машинное обучение является одним из широко используемых алгоритмов ИИ. Процесс обучения включает в себя расширение новых декларативных знаний, развитие когнитивных и моторных навыков посредством практики или обучения. С начала компьютерной эры исследователи, и ученые пытаются внедрить такие возможности в компьютеры. Решение этой проблемы было и остается самой увлекательной и сложной долгосрочной целью в области ИИ.

Глубокое обучение

Глубокое обучение – это подполе машинного обучения. Это одно из самых мощных и быстрорастущих приложений ИИ. Глубокое обучение используется для решения проблем, которые ранее считались слишком сложными и требуют большого количества данных. Глубокое обучение происходит за счет использования нейронных сетей, которые наслоены для распознавания закономерностей и сложных отношений в данных. Применение глубокого обучения требует огромного набора данных и мощной вычислительной мощности для работы.

Обработка естественного языка

Обработка естественного языка (NLP) – это метод, с помощью которого компьютеры понимают, исполняют и манипулируют человеческим языком. Для достижения этой цели компьютер должен уметь «понимать» большой объем данных – от грамматического синтаксиса и правил до различных акцентов и разговорных выражений.

Компьютерное зрение

Компьютерное зрение – это наука о манипулировании или понимании видео и изображений. Оно имеет множество применений, включая дополненную реальность, автономное вождение и производственный контроль. Внедрение глубокого обучения в компьютерное зрение можно разделить на множество категорий: обнаружение, генерация, сегментация и классификация, как в видео, так и в изображениях.

Искусственный интеллект, машинное обучение и глубокое обучение уже сейчас являются неотъемлемой частью многих предприятий. Часто эти термины используются как синонимы.

Искусственный интеллект движется огромными шагами — от достижений в области беспилотных транспортных средств и способности обыгрывать человека в такие игры, как покер и Го, к автоматизированному обслуживанию клиентов. Искусственный интеллект — это передовая технология, которая готова произвести революцию в бизнесе.

Часто термины искусственный интеллект, машинное обучение и глубокое обучение используются бессистемно как взаимозаменяемые, но, на самом деле, между ними есть различия. Чем именно различаются эти термины будет рассказано далее.

Искусственный интеллект (ИИ)

Искусственный интеллект — широкое понятие, касающееся передового машинного интеллекта. В 1956 году на конференции по искусственному интеллекту в Дартмуте эта технология была описана следующим образом: «Каждый аспект обучения или любая другая особенность интеллекта могут быть в принципе так точно описаны, что машина сможет сымитировать их.»

Искусственный интеллект может относиться к чему угодно — от компьютерных программ для игры в шахматы до систем распознавания речи, таких, например, как голосовой помощник Amazon Alexa, способный воспринимать речь и отвечать на вопросы. В целом системы искусственного интеллекта можно разделить на три группы: ограниченный искусственный интеллект (Narrow AI), общий искусственный интеллект (AGI) и сверхразумный искусственный интеллект.

Программа Deep Blue компании IBM, которая в 1996 году обыграла в шахматы Гарри Каспарова, или программа AlphaGo компании Google DeepMind, которая в 2016 году обыграла чемпиона мира по Го Ли Седоля, являются примерами ограниченного искусственного интеллекта, способного решать одну конкретную задачу. Это его главное отличие от общего искусственного интеллекта (AGI), который стоит на одном уровне с человеческим интеллектом и может выполнять много разных задач.

Сверхразумный искусственный интеллект стоит на ступень выше человеческого. Ник Бостром описывает его следующим образом: это «интеллект, который намного умнее, чем лучший человеческий мозг, практически во всех областях, в том числе в научном творчестве, общей мудрости и социальных навыках.» Другими словами, это когда машины станут намного умнее нас.

Машинное обучение

Машинное обучение является одним из направлений искусственного интеллекта. Основной принцип заключается в том, что машины получают данные и «обучаются» на них. В настоящее время это наиболее перспективный инструмент для бизнеса, основанный на искусственном интеллекте. Системы машинного обучения позволяют быстро применять знания, полученные при обучении на больших наборах данных, что позволяет им преуспевать в таких задачах, как распознавание лиц, распознавание речи, распознавание объектов, перевод, и многих других. В отличие от программ с закодированными вручную инструкциями для выполнения конкретных задач, машинное обучение позволяет системе научиться самостоятельно распознавать шаблоны и делать прогнозы.

В то время, как обе программы — и Deep Blue, и DeepMind, являются примерами использования искусственного интеллекта, Deep Blue была построена на заранее запрограммированном наборе правил, так что она никак не связана с машинным обучением. С другой стороны, DeepMind является примером машинного обучения: программа обыграла чемпиона мира по Го, обучая себя на большом наборе данных ходов, сделанных опытными игроками.

Заинтересован ли Ваш бизнес в интеграции машинного обучения в свою стратегию? Amazon, Baidu, Google, IBM, Microsoft и другие уже предлагают платформы машинного обучения, которые могут использовать предприятия.

Глубокое обучение

Глубокое обучение является подмножеством машинного обучения. Оно использует некоторые методы машинного обучения для решения реальных задач, используя нейронные сетей, которые могут имитировать человеческое принятие решений. Глубокое обучение может быть дорогостоящим и требует огромных массивов данных для обучения. Это объясняется тем, что существует огромное количество параметров, которые необходимо настроить для алгоритмов обучения, чтобы избежать ложных срабатываний. Например, алгоритму глубокого обучения может быть дано указание «узнать», как выглядит кошка. Чтобы произвести обучение, потребуется огромное количество изображений для того, чтобы научиться различать мельчайшие детали, которые позволяют отличить кошку от, скажем, гепарда или пантеры, или лисицы.

Как уже упоминалось выше, в марте 2016 года искусственным интеллектом была достигнута крупная победа, когда программа AlphaGo DeepMind обыграла чемпиона мира по Го Ли Седоля в 4 из 5 игр с использованием глубокого обучения. Как объясняют в Google, система глубокого обучения работала путем комбинирования «метода Монте-Карло для поиска в дереве с глубокими нейронными сетями, которые прошли обучение с учителем на играх профессионалов и обучения с подкреплением на играх с собой".

Глубокое обучение также имеет бизнес-приложения. Можно взять огромное количество данных — миллионы изображений, и с их помощью выявить определенные характеристики. Текстовый поиск, обнаружение мошенничества, обнаружения спама, распознавание рукописного ввода, поиск изображений, распознавание речи, перевод — все эти задачи могут быть выполнены с помощью глубокого обучения. Например, в Google сети глубокого обучения заменили много «систем, основанных на правилах и требующих ручной работы».

Стоит отметить, что глубокое обучение может быть весьма «предвзятым». Например, когда была первоначально развернута система распознавания лиц Google, она помечала много черных лиц как гориллы. «Это пример того, что произойдет, если у вас нет афроамериканских лиц в вашем наборе обучения», сказала Anu Tewary, главный специалист по работе с данными Mint at Intuit. «Если у вас нет афроамериканцев, работающих над системой, если у вас нет афроамериканцев, тестирующих систему, то, когда ваша система сталкивается с афроамериканскими лицами, она не будет знать, как вести себя.»

Существует мнение, что тема глубокого обучения сильно раздута. Система Sundown AI, например, предоставляет автоматизированные взаимодействия с клиентами с использованием комбинации машинного обучения и policy graph алгоритмов без использования глубокого обучения.

Полина Кабирова, коммерческий автор и переводчик, специально для блога Нетологии перевела статью Калума Макклилланда о том, чем отличаются искусственный интеллект, машинное и глубокое обучение и как интернет вещей и искусственный интеллект влияют друг на друга.

Полина кабирова

Коммерческий автор и переводчик

Мы все знакомы с термином «искусственный интеллект» (ИИ). О нём снято много фильмов — «Терминатор», «Матрица», «Из машины». Но вы, наверное, слышали и о других терминах — машинное обучение (Machine Learning) и глубокое обучение (Deep Learning). Их иногда используют как синонимы искусственного интеллекта, и в результате не видно разницы между искусственным интеллектом, машинным обучением и глубоким обучением.

В статье расскажу, каковы отличия между искусственным интеллектом, машинным и глубоким обучением, а затем объясню, как ИИ и интернет вещей связаны друг с другом.

Различия между терминами

Американский информатик Джон Маккарти, впервые употребив термин «искусственный интеллект» в 1956 году, понимал под этим компьютеры, способные выполнять характерные для человеческого интеллекта задачи: планирование, понимание языка, распознавание объектов и звуков, умение обучаться и решать задачи.

Различают сильный и слабый искусственный интеллект. Сильный обладает всеми свойствами человеческого интеллекта, упомянутыми выше. Слабый интеллект способен качественно выполнять только ограниченное количество действий. Компьютер, который распознаёт изображения, но больше ничего не умеет, — пример слабого ИИ.

Машинное обучение — это процесс реализации искусственного интеллекта.

В 1959 году Артур Сэмюэл придумал термин «машинное обучение» — способность компьютера учиться без участия человека. То есть искусственный интеллект возможен без машинного обучения, но для этого понадобится миллион строк кода со сложными правилами и условиями.

Другими словами, вместо прописывания подробных инструкций для каждой конкретной задачи используется алгоритм, который учится находить решения самостоятельно. Обрабатывая огромное количество данных в процессе машинного обучения, компьютер приспосабливается к условиям задачи и совершенствуется.

С помощью машинного обучения была значительно улучшена способность компьютера распознавать объект на изображении или видео — компьютерное зрение. Для этого вы собираете сотни тысяч картинок, а затем люди отмечают на них, например, кошек. Алгоритм строит для компьютера модель, чтобы тот смог определять и выделять картинки с кошками так, как это делает человек. В результате он «узнаёт», как выглядят кошки, и научится распознавать их без ошибок.

Глубокое обучение — один из множества подходов к машинному обучению.

Примеры других подходов: анализ дерева решений, индуктивное логическое программирование, кластеризация, обучение с подкреплением, Байесовская сеть.

Глубокое обучение вдохновлено строением человеческого мозга и взаимодействием нейронов. Появились алгоритмы, имитирующие организацию головного мозга — искусственные нейронные сети (ИНС).

ИНС состоит из искусственных нейронов, которые взаимодействуют между собой. Они расположены слоями — каждый слой реагирует на определённые признаки, например, изгибы и границы фигур при распознавании изображения. Именно из-за множества слоёв обучение называется глубоким.

Искусственный интеллект и интернет вещей неразрывно связаны

Взаимодействие между искусственным интеллектом и интернетом вещей похоже на отношение между человеческим телом и головным мозгом. Тело собирает информацию через зрение, слух, осязание. Мозг её обрабатывает и придаёт смысл — превращает свет в узнаваемые объекты, а звуки в понятную речь. Затем мозг принимает решения и подаёт телу сигнал, например, взять что-то или начать говорить.

Все подключенные датчики интернета вещей работают как наше тело — собирают исходные данные о том, что происходит в мире вокруг. Искусственный интеллект, как и мозг, интерпретирует эту информацию и решает, какие действия предпринять. Затем устройства, подключенные к интернету вещей, выполняют команду или взаимодействуют между собой.

Читать также

Искусственный интеллект, машинное обучение и глубокое обучение: в чём различия

Как использовать искусственный интеллект для решения бытовых задач

Искусственный интеллект, машинное обучение и глубокое обучение: в чём различия

Гайд в мир Data Science для начинающих

Раскрытие потенциала

Искусственный интеллект и интернет вещей стали важными и перспективными технологиями благодаря друг другу.

За последние годы машинное и глубокое обучение привели к прорыву в области искусственного интеллекта. При машинном и глубоком обучении компьютер обрабатывает большое количество данных, которые собирают миллиарды датчиков, составляющих интернет вещей.

Развитие ИИ также будет способствовать внедрению интернета вещей и приведёт к стремительному росту обеих областей.

С помощью интернета вещей искусственный интеллект совершенствуется. Благодаря искусственному интеллекту интернет вещей становится доступным для человека.

ИИ может прогнозировать необходимость ремонта или анализировать процесс производства. Это помогает увеличить эффективность работы и сэкономить миллионы долларов.

Технология адаптируется сама и не требует вмешательства человека. Не надо нажимать на кнопки, набирать текст, искать информацию — только сообщить, что нужно. Например, узнать прогноз погоды или подготовить дом ко сну — выключить кондиционер, закрыть двери, погасить свет.

Объединение технологических достижений

Компьютерные чипы становятся меньше, а техники производства — лучше. Появляются более дешёвые и мощные датчики. Технология изготовления аккумуляторов стремительно развивается, и скоро датчики будут работать много лет без подзарядки.

С появлением смартфонов и беспроводной связи можно дёшево передавать данные в большом объёме, отправляя информацию с датчиков в облако. С облачными технологиями место для хранения данных практически неограниченно, а вычислительные мощности для их обработки — бесконечны.

Конечно, влияние искусственного интеллекта на наше общество и будущее вызывает опасения. Но его развитие и внедрение в связке с интернетом вещей абсолютно точно повлияют на весь мир.

Искусственный интеллект, машинное обучение и глубокое обучение: в чём различия

курс

Big Data с нуля

Узнать больше

  • Научитесь работать с большими данными
  • Расширите знания в аналитике
  • Перейдёте на новый уровень в профессии

Машинное обучение и компьютерное зрение – активно развивающиеся смежные области, весьма перспективные с точки зрения фундаментальных и прикладных исследований с практическим применением в целом ряде задач (видеонаблюдение, автоматическое управление транспортными потоками, автономные транспортные средства, интернет-поиск по изображениям и др.), актуальных для современного общества, что обуславливает научную и практическую значимость данной тематики.

Основополагающими этапами в понимании содержания изображений являются классификация изображений и детектирование объектов. Сложность надежного решения данных проблем во многом обусловлена тем, что изображения являются динамическими «сценами» с различным освещением, степенью удаленности объектов от камеры и углом поворота относительно объектива, а также возможным перекрытием объектов. Другой сложностью является большое количество искомых объектов, что, в свою очередь, ведет к необходимости обработки объемной базы изображений. С учетом того, что многие алгоритмы машинного обучения, применяемые для решения указанной проблемы, имеют трудоемкость, зависящую квадратично или даже кубично от объема исходных данных, время решения больших задач может оказаться неприемлемым. Данный вопрос встает особенно остро, когда задача должна решаться в реальном времени (on-line). В связи с этим также встает проблема разработки высокоэффективных алгоритмов для современных компьютерных архитектур.

Коллектив

Со-руководители проекта

    , д.ф.-м. н., доцент каф. МЛиВА, ВМК ННГУ. , к.т.н., доцент, зам. зав. каф. МО ЭВМ, ВМК ННГУ.

Участники проекта

  • Павел Дружков, аспирант, ВМК ННГУ
  • Евгений Козинов, ассистент каф. МО ЭВМ, ВМК ННГУ. , ассистент каф. МО ЭВМ, ВМК ННГУ.
  • Андрей Мильченко, м.н.с, каф. МЛиВА, ВМК ННГУ.
  • Алексей Половинкин, м.н.с., каф. МО ЭВМ, ВМК ННГУ.
  • Татьяна Ханова, студент, ВМК ННГУ.

Сотрудничество

  • Игорь Чикалов, к.ф.-м.н., ст.н.с., факультет информатики, электротехники и математики, университет науки и технологий короля Абдуллы (Саудовская Аравия).

Основные результаты

Затем разработан высокопроизводительный алгоритм для задачи классификации объектов на изображении с большим числом классов. Разработан новый алгоритм и прототип его программной реализации для задачи детектирования пешеходов, основанного на новом методе отбора признаков с помощью ансамблей деревьев решений [2]. Разработан новый алгоритм для решения задачи детектирования автомобилей на видеопотоке и прототип его программной реализации [1, 5]. На данный момент получены результаты, качественно сравнимые с существующими исследовательскими работами.

Построены оценки сложности ряда алгоритмов машинного обучения и компьютерного зрения: алгоритма градиентного бустинга деревьев решений с распределенными данными, иерархического алгоритма классификации изображений с большим числом категорий, алгоритма отбора признаков с помощью ансамблей деревьев решений, алгоритма детектирования объектов Latent SVM, разработанных алгоритмов видеодетектирования автомобилей.

Разработаны технологии детектирования автомобилей в видеопотоке [13] и пешеходов на изображениях, включающие в себя прототипы программных реализаций и инструкции по их применению. Программные реализации разработаны на базе библиотеки OpenCV и находятся в открытом доступе в сети Интернет. Разработанные технологии могут использоваться при создании реальных систем компьютерного зрения и при решении практических задач машинного обучения (в частности, систем помощи водителю и систем детектирования пешеходов).

Текущие исследования

Проект направлен на решение задач классификации изображений с большим числом категорий и детектирования объектов на изображениях.

В рамках задачи классификации дано обучающее множество изображений с присвоенными им метками категорий, идентифицирующими наличие объектов того или иного класса (например, «человек», «автомобиль», «велосипед» и т.д.). На основании данного набора требуется построить алгоритм, позволяющий для произвольного изображения получить список классов, т.е. определить все присутствующие на нем объекты. В простейшем случае предполагается, что изображение содержит только один объект, и алгоритм должен точно определить какой именно. Отметим, что при наличии нескольких объектов одного класса не требуется определять их количество.

Задача детектирования объектов заключается в построении по обучающему множеству изображений алгоритма, способного локализовать все объекты заданного класса на произвольном изображении. Под локализацией объектов можно понимать нахождение наименьшей прямоугольной области изображения, содержащей объект. Как правило, при решении задачи детектирования используется результат работы алгоритма классификации.

Разрабатываемые методы будут апробированы на задачах детектирования пешеходов и автомобилей. Выбор указанных классов объектов во многом обусловлен практической значимостью приложений, использующих детектирование пешеходов и автомобилей для автоматического анализа и управления транспортными потоками, а также создания автономных транспортных средств.

Планируется использовать следующие методы глубокого обучения, основанные на применении нейронных сетей, а также методы, основанные на применении моделей, отличных от нейронных сетей.

Читайте также: