С его помощью можно преобразовать в компьютерные данные рисунки

Обновлено: 06.07.2024

Тема урока: Ввод изображений с помощью сканера, графического планшета. Использование готовых графических объектов.

Планируемые образовательные результаты:

- предметные – систематизированные представления о растровой и векторной графике;

- метапредметные – умения правильно выбирать формат (способ представления) графических файлов в зависимости от решаемой задачи;

- личностные – знание сфер применения компьютерной графики; способность применять теоретические знания для решения практических задач; интерес к изучению вопросов, связанных с компьютерной графикой.

Решаемые учебные задачи:

1) расширение представлений о сферах применения компьютерной графики;

2) обобщение представлений о способах создания цифровых графических объектов;

3) расширение и систематизация представлений о растровой и векторной графике;

4) формирование представлений о разнообразии и целесообразности использования тех или иных графических форматов.

Используемые на уроке средства ИКТ:

- персональный компьютер (ПК) учителя, мультимедийный проектор, экран.

1. Организационный момент (1 минута)

2. Повторение (10 минут)

1. Компьютерная графика – это…

Компьютерная графика — это широкое понятие, обозначающее:

1) разные виды графических объектов, созданных или обработанных с помощью компьютера;

2) область деятельности, в которой компьютеры используются как инструменты создания и обработки графических объектов.

2. Где применяется компьютерная графика

Компьютерная графика прочно вошла в нашу повседневную жизнь. Она применяется:

- для наглядного представления результатов измерений и наблюдений (например, данных о климатических изменениях за продолжительный период, о динамике популяций животного мира, об экологическом состоянии различных регионов и т. п.), результатов социологических опросов, плановых показателей, статистических данных, результатов ультразвуковых исследований в медицине и т. д.;

- при разработке дизайнов интерьеров и ландшафтов, проектировании новых сооружений, технических устройств и других изделий;

- в тренажёрах и компьютерных играх для имитации различного рода ситуаций, возникающих, например, при полете самолёта или космического аппарата, движении автомобиля и т. п.;

3. Просмотр и обсуждение анимации «Графика в компьютерных играх».

- при создании всевозможных спецэффектов в киноиндустрии;

- при разработке современных пользовательских интерфейсов программного обеспечения и сетевых информационных ресурсов;

- для творческого самовыражения человека (цифровая фотография, цифровая живопись, компьютерная анимация и т. д.).

4. Просмотр и обсуждение анимации «Анимированные графические объекты».

5. Просмотр и обсуждение анимации «Статические графические объекты».

6. Просмотр и обсуждение анимации «Научная графика».

3. Изучение нового материала (20 минут)

Новый материал излагается в сопровождении презентации «Ввод изображений с помощью сканера, графического планшета. Использование готовых графических объектов».

На заре развития компьютерной техники не было ни дисплея, без которого мы не представляем компьютер, ни принтера, без которого мы не можем распечатать информацию на бумагу, ни тем более сканера, цифрового фотоаппарата и я немного вас ошеломлю, если скажу, что не было даже клавиатуры, не говоря уже о всем нам известной «мышке». Почему? И как же тогда работали с компьютером ? А очень просто. Вводили информацию с помощью, можно сказать, обычных выключателей и кнопок от обычных дверных звонков, а получали ответ компьютера, списывая последовательность перемигивания обычных лампочек.

Но как вы сами понимаете, техника не стоит на месте – она развивается. Вначале все усилия были сконцентрированы только на одном: создать машину, способную самостоятельно вычислять. Об удобстве работы никто и не думал. Какие удобства? О каком комфорте общения с компьютером идёт речь, если самого компьютера то нет? Вспомните, какими были первые автомобили, и какими в настоящее время они выпускаются. «Разве можно сравнить» – скажете вы. Можно и разница будет только лишь в удобстве водителя. А машину как создали в начале по схеме: двигатель – трансмиссия – колеса, так до сих пор и создают. Разница только лишь в удобстве управления и удобстве пользования.

Графические объекты, созданные или обработанные с помощью компьютера, сохраняются на компьютерных носителях; при необходимости они могут быть выведены на бумагу или другой подходящий носитель (плёнку, картон, ткань и т. д.).

Графические объекты на компьютерных носителях будем называть цифровыми графическими объектами.

Существует несколько способов получения цифровых графических объектов.

1) копирование готовых изображений с цифровой фотокамеры, с устройств внешней памяти или «скачивание» их из Интернета;

2) ввод графических изображений, существующих на бумажных носителях, с помощью сканера;

3) создание новых графических изображений с помощью программного обеспечения.

Рассказ о принципе работы сканера.

Принцип работы сканера состоит в том, чтобы разбить имеющееся на бумажном носителе изображение на крошечные квадратики — пиксели, определить цвет каждого пикселя и сохранить его в двоичном коде в памяти компьютера.

1.Какие устройства, используемые для ввода информации вы знаете?

Ответ: сканер, графический планшет.

Ска́нер (англ. scanner) — устройство, выполняющее преобразование изображений в цифровой формат — цифровую копию изображения объекта. Процесс получения этой копии называется сканированием; устройство, которое при помощи АЦП создаёт цифровое описание изображения внешнего для ЭВМ образа объекта и передаёт его посредством системы ввода/вывода в ЭВМ.

Планшетный сканер (Flatbed Scanner)
Ручной сканер (Handheld Scanner)
Барабанный сканер (Drum Scanner)

Графический планшет (дигитайзер)

это устройство, предназначенное для оцифровки изображений, применяемое для создания на компьютере рисунков и набросков . Художник создает изображение на экране, но его рука водит пером по планшету. Как правило, планшет используют профессиональные художники для более точной обработки (создания) изображений. Кроме того, дигитайзер можно использовать просто как аналог манипулятора «мышь».

Дигитайзер, или планшет, как его часто называют, состоит из двух основных элементов: основания и курсора, двигающегося по его поверхности. Принцип действия дигитайзера основан на фиксации местоположения курсора с помощью встроенной в планшет сетки. При нажатии на кнопку курсора его местоположение на поверхности планшета фиксируется, а его координаты передаются в компьютер. Сетка состоит из проволочных или печатных проводников с довольно большим расстоянием между соседними проводниками (от трех до шести мм). По принципу работы и технологии существуют различные типы планшетов. В электростатических планшетах регистрируется локальное изменение электрического потенциала сетки под пером. В электромагнитных — перо излучает электромагнитные волны, а сетка служит приёмником. В обоих случаях на перо должно быть подано питание. Кроме того, сегодняшние планшеты можно разделить на два типа по принципу работы — пассивные и активные. Здесь стоит заметить, что информацию о технологии работы планшетов удалось получить только от одной компании, присутствующей на российском рынке — от Wacom. От компании Genius, к сожалению, ответа на просьбу предоставить материалы не последовало. Поэтому при описании принципов работы использовались только данные одной компании.

В зависимости от способа создания графического изображения различают растровую, векторную и фрактальную графику.

В растровой графике изображение формируется в виде растра совокупности точек (пикселей), образующих строки и столбцы.

Растровые графические изображения редко создают вручную. Чаще всего их получают путём сканирования подготовленных художниками иллюстраций или фотографий; в последнее время для ввода растровых изображений в компьютер широко применяются цифровые фотокамеры.

В векторной графике изображения формируются на основе таких наборов данных (векторов), описывающих графические объекты, и формул их построения.

Не всякое изображение можно представить, как совокупность простых геометрических фигур. Такой способ представления хорош для чертежей, схем, деловой графики и в других случаях, где особое значение имеет сохранение чётких и ясных контуров изображений.

Фрактальная графика , как и векторная, основана на математических вычислениях. Но, в отличие от векторной графики, в памяти компьютера хранятся не описания геометрических фигур, составляющих изображение, а сама математическая формула (уравнение), по которой строится изображение.

Под графической информацией подразумевают всю совокупность информации, которая нанесена на самые различные носители — бумагу, пленку, кальку, картон, холст, оргалит, стекло, стену и т. д. В определенной степени графической информацией можно считать и объективную реальность, на которую направлен объектив фотоаппарата или цифровой камеры.

Компьютерная графика - область информатики, изучающая методы и свойства обработки изображений с помощью программно-аппаратных средств.

Под видами компьютерной графики подразумевается способ хранения изображения на плоскости монитора.

Машинная графика в настоящее время уже вполне сформировалась как наука. Существует аппаратное и программное обеспечение для получения разнообразных изображений - от простых чертежей до реалистичных образов естественных объектов. Машинная графика используется почти во всех научных и инженерных дисциплинах для наглядности восприятия и передачи информации.

Машинная графика властно вторгается в бизнес, медицину, рекламу, индустрию развлечений. Применение во время деловых совещаний демонстрационных слайдов, подготовленных методами машинной графики и другими средствам автоматизации конторского труда, считается нормой. В медицине становится обычным получение трехмерных изображений внутренних органов по данным компьютерных томографов. В наши дни телевидение и другие рекламные предприятия часто прибегают к услугам машинной графики и компьютерной мультипликации. Использование машинной графики в индустрии развлечений охватывает такие несхожие области как видеоигры и полнометражные художественные фильмы.

История компьютерной графики

Результатами расчетов на первых компьютерах являлись длинные колонки чисел, напечатанных на бумаге. Для того чтобы осознать полученные результаты, человек брал бумагу, карандаши, линейки и другие чертежные инструменты и чертил графики, диаграммы, чертежи рассчитанных конструкций . Иначе говоря, человек вручную производил графическую обработку результатов вычислений. В графическом виде такие результаты становятся более наглядными и понятными .

Возникла идея поручить графическую обработку самой машине. Первоначально программисты научились получать рисунки в режиме символьной печати. На бумажных листах с помощью символов (звездочек, точек, крестиков, букв) получались рисунки, напоминающие мозаику. Так печатались графики функций, изображения течений жидкостей и газов, электрических и магнитных полей. С помощью символьной печати программисты умудрялись получать даже художественные изображения (Рис. 1). В редком компьютерном центре стены не украшались распечатками с портретами Эйнштейна, репродукциями Джоконды и другой машинной живописью.

Рис. 1 Символьная печать.

Затем появились специальные устройства для графического вывода на бумагу — графопостроители (другое название — плоттеры). С помощью такого устройства на лист бумаги чернильным пером наносятся графические изображения: графики, диаграммы, технические чертежи и прочее. Для управления работо графопостроителей стали создавать специальное программное обеспечение.

Настоящая революция в компьютерной графике произошла с появлением графических дисплеев. На экране графического дисплея стало возможным получать рисунки, чертежи в таком же виде, как на бумаге с помощью карандашей, красок, чертежных инструментов Рисунок из памяти компьютера может быть выведен не только на экран, но и на бумагу с помощью принтера. Существуют принтеры цветной печати, дающие качество рисунков на уровне фотографии.

Представление графической информации в компьютере

Создавать и хранить графические объекты в компьютере можно двумя способами: как растровое или как векторное изображение. Для каждого типа изображения используется свой способ кодирования.

Растровое изображение представляет собой совокупность точек, используемых для его отображения на экране монитора.

Объём растрового изображения определяется как произведение количества точек и информационного объёма одной точки, который зависит от количества возможных цветов. Для черно-белого изображения информационный объём одной точки равен 1 биту, так как точка может быть либо чёрной, либо белой, что можно закодировать одной из двух цифр — 0 или 1.

Информационный объём растрового изображения (V) определяется как произведение числа входящих в изображение точек (N) на информационный объём одной точки (q), который зависит от количества возможных цветов, т. е. V=N ⋅ q.

При чёрно-белом изображении q = 1 бит (например, 1 — точка подсвечивается и 0 — точка не подсвечивается). Поэтому для хранения чёрно-белого (без оттенков) изображения размером 100x100 точек требуется 10000 бит.

Если между чёрным и белым цветами имеется ещё шесть оттенков серого (всего 8), то информационный объём точки равен 3 бита (log28 = 3).

Информационный объём такого изображения увеличивается в три раза: V = 30000бит.

Рассмотрим, сколько потребуется бит для отображения цветной точки: для 8 цветов необходимо 3 бита; для 16 цветов — 4 бита; для 256 цветов — 8 битов (1 байт).

Разные цвета и их оттенки получаются за счёт наличия или отсутствия трёх основных цветов (красного, синего, зеленого) и степени их яркости. Каждая точка на экране кодируется с помощью 4 битов.

Цветные изображения могут отображаться в различных режимах, соответственно изменяется и информационный объём точки (Рис. 4).

Описание цвета пикселя является кодом цвета.

Количество бит, отводимое на каждый пиксель для представления цвета, называют глубиной цвета (англ. color depth). От количества выделяемых бит зависит разнообразие палитры.

Наиболее распространенными значениями глубины цвета являются 8, 16, 24 или 32 бита.

Чем больше глубина цвета, тем больше объем графического файла.

Для хранения растрового изображения размером 32x32 пикселя отвели 512 байтов памяти.

Каково максимально возможное число цветов в палитре изображения?

Решение . Число точек изображения равно 32 ⋅ 3 2 = 1024. Мы знаем, что 512 байтов = 512 ⋅ 8=4096 бит. Найдём глубину цвета 4096÷1024=4. Число цветов равно 24 = 16.

FF — наибольшая яркость цветовой компоненты, для получения различных оттенков одного и того же цвета изменяют яркость.

Также следует отметить, что равное или почти равное сочетание цветовых компонент обозначает серый цвет разной интенсивности.

Векторное изображение представляет собой совокупность графических примитивов. Каждый примитив состоит из элементарных отрезков кривых, параметры которых (координаты узловых точек, радиус кривизны и пр.) описываются математическими формулами.

Для каждой линии указываются её тип (сплошная, пунктирная, штрих-пунктирная), толщина и цвет, а замкнутые фигуры дополнительно характеризуются типом заливки.

Рассмотрим, например, такой графический примитив, как окружность радиуса r. Для её построения необходимо и достаточно следующих исходных данных:

- координаты центра окружности;

- значение радиуса r;

- цвет заполнения (если окружность не прозрачная);

- цвет и толщина контура (в случае наличия контура).

Информация о векторном рисунке кодируется обычным способом, как хранятся тексты, формулы, числа, т. е. хранится не графическое изображение, а только координаты и характеристики изображения его деталей. Поэтому для хранения векторных изображений требуется существенно меньше памяти, чем растровых изображений.

Кодирование графической информации

Графическую информацию можно представлять в двух формах: аналоговой и цифровой.

Живописное полотно, цвет которого изменяется непрерывно — это пример аналогового представления.

Изображение, напечатанное при помощи струйного принтера и состоящее из отдельных точек разного цвета — это цифровое или еще именуют как дискретное представление.

Путем разбиения графического изображения (дискретизации) происходит преобразование графической информации из аналоговой формы в цифровую. Этот процесс называется «кодирование», поскольку каждому элементу назначается конкретное значение в форме двоичного кода. При кодировании изображения происходит его пространственная дискретизация. Ее можно сравнить с построением изображения из большого количества цветных фрагментов (метод мозаики).

Графическая информация в аналоговой форме представляется в виде рисунка, картинки, а также слайда на фотопленке и полученную по нему аналоговую фотографию.

Изображение кодируется в цифровую форму с использованием элементарных геометрических объектов, таких как точки, линии, сплайны и многоугольники или матрицы фиксированного размера, состоящей из точек (пикселей) со своими геометрическими параметрам.

Современная компьютерная графика

Научная графика. Это направление появилось самым первым. Назначение — визуализация (т. е. наглядное изображение) объектов научных исследований, графическая обработка результатов расчетов, проведение вычислительных экспериментов с наглядным представлением их результатов (Рис. 6).

Рис. 6 График комплексной функции в четырехмерном (4D) пространстве.

Деловая графика. Эта область компьютерной графики предназначена для создания иллюстраций, часто используемых в работе различных учреждений.

Плановые показатели, отчетная документация, статистические сводки — вот объекты, для которых с помощью деловой графики создаются иллюстративные материалы (Рис. 7).

Рис. 7 Графики, круговые и столбчатые диаграммы.

Программные средства деловой графики обычно включаются в состав табличных процессоров (электронных таблиц).

Конструкторская графика. Она используется в работе инженеров-конструкторов, изобретателей новой техники. Этот вид компьютерной графики является обязательным элементом систем автоматизации проектирования (САПР). Графика в САПР используется для подготовки технических чертежей проектируемых устройств (Рис. 8).

Рис. 8. Графика в САПР.

Графика в сочетании с расчетами позволяет проводить в наглядной форме поиск оптимальной конструкции, наиболее удачной компоновки деталей, прогнозировать последствия, к которым могут привести изменения в конструкции. Средствами конструкторской графики можно получать плоские изображения (проекции, сечения) и пространственные, трехмерные, изображения.

Иллюстративная графика. Программные средства иллюстративной графики позволяют человеку использовать компьютер для произвольного рисования, черчения подобно тому, как он это делает на бумаге с помощью карандашей, кисточек, красок, циркулей, линеек и других инструментов. Пакеты иллюстративной графики не имеют какой-то производственной направленности. Поэтому они относятся к прикладному программному обеспечению общего назначения.

Простейшие программные средства иллюстративной графики называются графическими редакторами.

Художественная и рекламная графика. Это сравнительно новая отрасль, но уже ставшая популярной во многом благодаря телевидению. С помощью компьютера создаются рекламные ролики, мультфильмы, компьютерные игры, видеоуроки, видеопрезентации и многое другое.

Графические пакеты для этих целей требуют больших ресурсов компьютера по быстродействию и памяти. Отличительной особенностью этого класса графических пакетов является возможность создания реалистических (очень близких к естественным) изображений, а также «движущихся картинок» (рис. 9).

Для создания реалистических изображений в графических пакетах этой категории используется сложный математический аппарат.

Рис. 9 Художественная графика.

Компьютерная анимация. Получение движущихся изображений на дисплее ЭВМ называется компьютерной анимацией. Слово «анимация» означает «оживление».

В недавнем прошлом художники-мультипликаторы создавали свои фильмы вручную. Чтобы передать движение, им приходилось делать тысячи рисунков, отличающихся друг от друга небольшими изменениями. Затем эти рисунки переснимались на кинопленку. Система компьютерной анимации берет значительную часть рутинной работы на себя. Например, художник может создать на экране рисунки лишь начального и конечного состояний движущегося объекта, а все промежуточные состояния рассчитает и изобразит компьютер. Такая работа также связана с расчетами, опирающимися на математическое описание данного типа движения. Полученные рисунки, выводимые последовательно на экран с определенной частотой, создают иллюзию движения.

Фрактальная графика. Фрактальная графика – одна из быстроразвивающихся и перспективных видов компьютерной графики. Математическая основа - фрактальная геометрия. Фрактал – структура, состоящая из частей, подобных целому. Одним из основных свойств является самоподобие (Фрактус – состоящий из фрагментов).

Объекты называются самоподобными когда увеличенные части объекта походят на сам объект. Небольшая часть фрактала содержит информацию обо всем фрактале.

Рис.10 Фрактальная фигура.

Фрактальная графика основана на математических вычислениях. Базовым элементом фрактальной графики является сама математическая формула, то есть никаких объектов в памяти компьютера не хранятся и изображение строится исключительно по уравнениям.

Объекты называются самоподобными, когда увеличенные части объекта походят на сам объект. Небольшая часть фрактала содержит информацию обо всем фрактале.

Название работы: Системный блок компьютера. Устройства ввода

Категория: Конспект урока

Предметная область: Педагогика и дидактика

Описание: Что относится к устройствам ввода Информация в компьютер может вводиться с помощью самых разнообразных уст ройств но не каждое из них называют устройством ввода.

Дата добавления: 2014-04-22

Размер файла: 747.5 KB

Работу скачали: 2 чел.

Урок 3. 10 класс

Системный блок компьютера

3. 1. Устройства ввода

3.1.1. Что относится к устройствам ввода?

Информация в компьютер может вводиться с помощью самых разнообразных уст- ройств, но не каждое из них называют устройством ввода. Например, не являются устрой- ствами ввода устройства внешней памяти, рассмотренные в предыдущем разделе. Прием данных по сети также не является вводом, поскольку здесь (как и в случае внешней памя- ти) данные уже были введены ранее и сохранены в компьютерном формате, а теперь про- сто копируются.

Но, даже исключив из рассмотрения все перечисленные устройства, мы по- прежнему будем иметь довольно пѐструю картину. Сравните между собой подключенный к компьютеру датчик температуры, веб-камеру, осуществляющую съемку для круглосу- точной трансляции городского пейзажа в Интернет, мышку, которой пользователь запус-

кает программы или выбирает из меню требуемое действие, и, наконец, клавиатуру, с по- мощью которой можно не только набрать текст, но и отдавать команды компьютеру.

Устройством ввода называется устройство, которое:

позволяет человеку отдавать компьютеру команды и/или

выполняет первичное преобразование данных в форму, пригодную для хранения и обработки в компьютере.

К устройствам ввода относятся клавиатура;

манипуляторы: мышь, трекбол, сенсорная панель, джойстик, трекпойнт;

микрофон, видеокамера и другие источники мультимедийных данных;

датчики.

Заметим, что некоторые устройства ввода, например, датчики и веб-камеры, работают без

непосредственного участия человека.

Одним из первых устройств ввода была клавиатура. С ее помощью человек вводит в компьютер текст. Текст может быть записью числа: тогда компьютер по программе пре- образует текстовую строку в соответствующее двоичное число, с которым может работать процессор.

Кроме символьных клавиш, на клавиатуре есть дополнительные (управляющие) кла- виши. Значения некоторых из них жѐстко задано (например, клавиши управления курсо- ром, Page Up , Home , Delete , Print Screen и др.), функции других (в первую очередь, функ- циональных клавиш F1 - F12 ) программист может назначить сам. Клавиши Shift , Caps Lock , Ctrl и Alt изменяют результат нажатия остальных клавиш. С их помощью можно, напри- мер, вводить заглавные буквы.

В простейших типах клавиатур при нажатии клавиши соединяются два контакта и замыкается электрическая цепь. Роль контактов в наиболее распространенных моделях играет специальное токопроводящее напыление, наносимое на гибкую изолирующую по- лимерную пленку. Более качественные клавиатуры могут использовать, например, герко-

Работой современной клавиатуры руководит встроенный в нее микроконтроллер, который:

опрашивает все клавиши и фиксирует изменение их состояния: нажатие или отпус- кание;

временно (до момента передачи в центральный процессор) хранит коды нескольких последних нажатых или отпущенных клавиш ( скан-коды ) 29 ;

при наличии данных посылает требование прерывания центральному процессору и затем (по его запросу) передает имеющиеся данные;

управляет световыми индикаторами клавиатуры;

выполняет диагностику неисправностей клавиатуры.

Контроллер клавиатуры выполняет лишь минимальную обработку информации: в компьютер уходят исключительно данные о нажатии или отпускании клавиши с заданным

29 Скан-коды представляют собой номера клавиш и не имеют ничего общего с кодовыми таблицами симво- лов, изученными в главе 2

номером. Распознавание кода набранного символа с учетом состояния клавиш сдвига вы- полняет программа, принимающая данные. Такое решение в очередной раз показывает, что аппаратная часть компьютера всегда делается максимально универсально, а все осо- бенности работы компьютера определяются программным обеспечением.

Клавиатура имеет определенные технические характеристики, такие как усилие на- жатия клавиш (в ньютонах) и ход клавиш (в миллиметрах).

Общая идея работы манипуляторов заключается в следующем. На экране монитора отображается указатель ( курсор ), с помощью которого человек может «показать» компью- теру интересующий его объект. Манипулятор перемещает курсор вслед за определенными перемещениями руки человека. Когда курсор установлен в нужное место экрана, человек сообщает об этом компьютеру, обычно нажимая кнопку на манипуляторе. В принципе манипулятор позволяет даже набирать тексты, используя нарисованную на экране клавиа- туру.

Первоначально датчики движения мыши были механическими: при перемещении мыши вращался находящийся внутри нее шарик. Шарик, в свою очередь, вращал два вза- имно перпендикулярных колесика, и их поворот фиксировался электронным устройством. Полученная информация об изменении координат передавалась в компьютер. Такая меха- ническая конструкция была неудобна, так как шарик и колесики приходилось часто очи- щать от пыли и грязи.

Оптические мыши, которые используются сейчас, не содержат механических час- тей, поэтому они долговечны и обладают высокой точностью. Расположенная «под брю- хом» миниатюрная видеокамера снимает изображение поверхности стола через неболь- шие промежутки времени (для подсветки используется светодиод или портативный ла- зер). Сравнивая полученные картинки, специальный микропроцессор вычисляет переме- щение мыши по двум осям координат. Этот метод даѐт плохие результаты, когда поверх- ность очень гладкая и однородная (например, стекло). В таких случаях значительно лучше работают лазерные мыши, потому что подсветка лазером дает более контрастное изобра- жение.

Кроме разрешения, на качество работы мыши влияет количество кадров, которые делает видеокамера за одну секунду (до десяти тысяч). Размеры каждого кадра определя-

Так выглядит трекбол

где есть вибрация. Сейчас трекболы практически не используются.

В ноутбуках в качестве встроенного «замените- ля» мыши устанавливают еще один тип манипулятора

большой чувствительной к давлению поверхности и двух кнопок. Короткое касание чув- ствительной панели заменяет щелчок мышью (можно использовать также кнопки рядом с панелью). Современные панели способны воспринимать не только перемещение, но и другие команды. Например, для прокрутки документа можно проводить пальцем вдоль правой или нижней границы панели (там, где в окне принято располагать полосы про-

крутки). Некоторые панели даже способны анализировать сочетания движений по ним двух пальцев.

зователь наклоняет ручку, тем быстрее движется указатель по экрану.

В некоторых ноутбуках в середине клавиатуры устанавли- вается трекпойнт (это слово можно перевести с английского как

манду в перемещение курсора на экране.

С его помощью можно преобразовать в компьютерные данные рисунки, фотографии, снимки на фотоплѐнке (негативы и слайды), а также получить снимки объектов не слиш- ком большой толщины.

Часто при помощи сканера в компьютер вводят офисные документы. При этом ска- нер передает в компьютер изображение документа в виде картинки. Чтобы отсканирован- ный текст можно было редактировать, нужно превратить эту картинку в коды символов. Для этого используют программы оптического распознавания символов (англ. OCR = Opt- ical Character Recognition ). OCR-программы пытаются «угадать» в пикселях рисунка очертания букв, и определить, какие это буквы, сверяя контуры с имеющимися у них об-

разцами. В принципе, можно распознавать и рукописный текст, однако программы справ- ляются с ним значительно хуже, чем с печатным (подумайте почему?).

Сканеры могут иметь разную конструкцию:

ручные , где считывающую головку перемещает пользователь (вспомните, как считы- ваются штрих-коды);

планшетные , в которых неподвижный объект кладется на стекло, а светочувствитель- ная головка перемещается внутри сканера;

рулонные , протягивающие бумагу с изображением мимо неподвижной головки; барабанные , где сканируемый объект наклеивается на вращающийся барабан, кото- рый медленно вращается мимо неподвижной головки; такие сканеры обеспечивают наилучшее качество сканирования и применяются в издательской деятельности.

Сканеры часто объединяют в одном корпусе с лазерным принтером, копировальным

Разрешающая способность сканера измеряется в пикселях на дюйм (англ. ppi = pixels per inch ). При сканировании совсем не обязательно устанавливать максимально возмож- ное разрешение. Конечно, чем оно выше, тем лучше качество, но зато и файл займет больше места на диске! Рекомендуемое разрешение зависит от того, зачем сканируется материал (см. таблицу).

Начинаю серию уроков (мини-курс) о распознавании изображений и обнаружении объектов.

Мини-курс, который я пишу, будет состоять из 8 уроков по приблизительно следующей тематике:

Распознавание изображений с использованием традиционных методов компьютерного зрения
Обнаружение объектов с использованием традиционных методов компьютерного зрения
Как обучить и протестировать собственный детектор объектов OpenCV
Распознавание изображений с использованием глубокого обучения

Краткая история распознавания изображений и обнаружения объектов

При таком огромном успехе в распознавании изображений обнаружение объектов на основе глубокого обучения было неизбежным. Такие методы, как Faster R-CNN, производят челюсти. Отбрасывание результатов по нескольким классам объектов. Мы узнаем об этом в следующих публикациях, но пока имейте в виду, что если вы не изучили алгоритмы распознавания изображений и обнаружения объектов на основе глубокого обучения для своих приложений, вы можете упустить огромную возможность получить лучшие результаты.

Распознавание изображений (также известное как классификация изображений)

Чтобы упростить задачу, в этом посте мы сосредоточимся только на двухклассовых (бинарных) классификаторах. Вы можете подумать, что это очень ограничивающее предположение, но имейте в виду, что многие популярные детекторы объектов (например, детектор лиц и детектор пешеходов) имеют под капотом бинарный классификатор. Например, внутри детектора лиц находится классификатор изображений, который сообщает, является ли участок изображения лицом или фоном.

Анатомия классификатора изображений

На следующей диаграмме показаны этапы работы традиционного классификатора изображений.

Интересно, что многие традиционные алгоритмы классификации изображений компьютерного зрения следуют этому конвейеру, в то время как алгоритмы, основанные на глубоком обучении, полностью обходят этап извлечения признаков. Давайте рассмотрим эти шаги более подробно.

Шаг 1: предварительная обработка

Обратите внимание, что я не прописываю, какие шаги предварительной обработки являются хорошими. Причина в том, что никто заранее не знает, какой из этих шагов предварительной обработки даст хорошие результаты. Вы пробуете несколько разных, и некоторые из них могут дать немного лучшие результаты. Вот абзац из Далала и Триггса

Мы оценили несколько представлений входных пикселей, включая цветовые пространства в оттенках серого, RGB и LAB, опционально со степенным (гамма) выравниванием. Эти нормализации имеют лишь умеренное влияние на производительность, возможно, потому, что последующая нормализация дескриптора дает аналогичные результаты. Мы используем информацию о цвете, когда она доступна. Цветовые пространства RGB и LAB дают сравнимые результаты, но ограничение оттенками серого снижает производительность на 1,5% при 10–4 кадрах в секунду. Гамма-сжатие с квадратным корнем для каждого цветового канала улучшает производительность при низких значениях FPPW (на 1% при 10–4 кадрах в секунду), но логарифмическое сжатие слишком велико и ухудшает его на 2% при 10–4 кадрах в секунду.

Как вы видете, авторы не знали заранее, какую предварительную обработку использовать. Они делали разумные предположения и использовали метод проб и ошибок.

В рамках предварительной обработки входное изображение или фрагмент изображения также обрезаются и изменяются до фиксированного размера. Это важно, потому что следующий шаг, извлечение признаков, выполняется на изображении фиксированного размера.

Шаг 2: извлечение признаков

В качестве конкретного примера давайте посмотрим на извлечение признаков с помощью гистограммы ориентированных градиентов (HOG).

Histogram of Oriented Gradients (HOG) или гистограмма направленного градиента

Алгоритм извлечения признаков преобразует изображение фиксированного размера в вектор признаков фиксированного размера. В случае обнаружения пешеходов дескриптор объекта HOG вычисляется для фрагмента изображения размером 64 \times 128 и возвращает вектор размером 3780 . Обратите внимание, что исходный размер этого фрагмента изображения был 64 \times 128 \times 3 = 24,576 , который сокращен до 3780 дескриптором HOG.

HOG основан на идее, что внешний вид локального объекта может быть эффективно описан распределением (гистограммой) направлений краев (направленных градиентов). Шаги по вычислению дескриптора HOG для изображения размером 64 × 128 перечислены ниже.
Расчет градиента: вычисление градиентов x и y изображений и, исходя из исходного изображения. Это можно сделать, отфильтровав исходное изображение следующими ядрами.

Шаг 3: алгоритм классификации (подробнее)

В предыдущем разделе мы узнали, как преобразовать изображение в вектор признаков. В этом разделе мы узнаем, как алгоритм классификации принимает этот вектор признаков в качестве входных данных и выводит метку класса (например, кошка или фон).

На предыдущем шаге мы узнали, что дескриптор HOG изображения является вектором признаков длиной 3 780. Мы можем думать об этом векторе как о точке в 3 780-мерном пространстве. Визуализировать пространство большого измерения невозможно, поэтому немного упростим ситуацию и представим, что вектор признаков был двухмерным.

Оптимизация SVM

Пока все хорошо, но я знаю, что у вас есть один важный вопрос, на который нет ответа. Что, если объекты, принадлежащие двум классам, нельзя разделить с помощью гиперплоскости? В таких случаях, SVM по-прежнему находит лучшую гиперплоскость, решая задачу оптимизации, которая пытается увеличить расстояние гиперплоскости от двух классов, одновременно пытаясь обеспечить правильную классификацию многих обучающих примеров. Этот компромисс контролируется параметром C. Когда значение C мало, выбирается гиперплоскость с большим запасом за счет большего числа ошибочных классификаций. И наоборот, когда C велико, выбирается гиперплоскость меньшего поля, которая пытается правильно классифицировать гораздо больше примеров.

Теперь вы можете быть сбиты с толку, какое значение выбрать для C. Выберите то значение, которое лучше всего работает на тестовом наборе, которого не было в обучающей выборке.

Читайте также: