В памяти компьютера хранятся не изображения символов а их числовые коды в двоичной системе

Обновлено: 07.07.2024

Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.

Информатика. 10 класса. Босова Л.Л. Оглавление

§14. Кодирование текстовой информации

Компьютеры третьего поколения «научились» работать с текстовой информацией.

Текстовая информация по своей природе дискретна, т. к. представляется последовательностью отдельных символов.

Для компьютерного представления текстовой информации достаточно:

1) определить множество всех символов (алфавит), требуемых для представления текстовой информации;
2) выстроить все символы используемого алфавита в некоторой последовательности (присвоить каждому символу алфавита свой номер);
3) получить для каждого символа n-разрядный двоичный код (n ≤ 2 n ), переведя номер этого символа в двоичную систему счисления.

В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.

14.1. Кодировка ASCII и её расширения

Основой для компьютерных стандартов кодирования символов послужил код ASCII (American Standard Code for Information Interchange) — американский стандартный код для обмена информацией, разработанный в 1960-х годах в США и применявшийся для любых, в том числе и некомпьютерных, способов передачи информации (телеграф, факсимильная связь и т. д.). Этот код 7-битовый: общее количество символов составляет 2 7 = 128, из них первые 32 символа — управляющие, а остальные — изображаемые, т. е. имеющие графическое изображение. К изображаемым символам в ASCII относятся буквы латинского алфавита (прописные и строчные), цифры, знаки препинания и арифметических операций, скобки и некоторые специальные символы. Кодировка ASCII приведена в табл. 3.8.

Таблица 3.8

Кодировка ASCII


Хотя для кодирования символов в ASCII достаточно 7 битов, в памяти компьютера под каждый символ отводится ровно 1 байт (8 битов), при этом код символа помещается в младшие биты, а в старший бит заносится 0.

Например, 01000001 — код прописной латинской буквы «А»; с помощью шестнадцатеричных цифр его можно записать как 41.

Впоследствии использование кодовых таблиц было несколько упорядочено: каждой кодовой таблице было присвоено особое название и номер. Для русского языка наиболее распространёнными стали однобайтовые кодовые таблицы CP-866, Windows-1251 (табл. 3.9) и КОИ-8 (табл. 3.10). В них первые 128 символов совпадают с ASCII-кодировкой, а русские буквы размещены во второй части таблицы. Обратите внимание на то, что коды русских букв в этих кодировках различны.

Таблица 3.9

Кодировка Windows-1251


Таблица 3.10

Кодировка КОИ-8


Мы выяснили, что при нажатии на алфавитно-цифровую клавишу в компьютер посылается некоторая цепочка нулей и единиц. В текстовых файлах хранятся не изображения символов, а их коды.

При выводе текста на экран монитора или принтера необходимо восстановить изображения всех символов, составляющих данный текст, причём изображения эти могут быть разнообразны и достаточно причудливы. Внешний вид выводимых на экран символов кодируется и хранится в специальных шрифтовых файлах. Современные текстовые процессоры умеют внедрять шрифты в файл. В этом случае файл содержит не только коды символов, но и описание используемых в этом документе шрифтов. Кроме того, файлы, создаваемые с помощью текстовых процессоров, включают в себя и такие данные о форматировании текста, как его размер, начертание, размеры полей, отступов, межстрочных интервалов и другую дополнительную информацию.

14.2. Стандарт Unicode

В Unicode на кодирование символов отводится 31 бит. Первые 128 символов (коды 0-127) совпадают с таблицей ASCII. Далее размещены основные алфавиты современных языков: они полностью умещаются в первой части таблицы, их коды не превосходят 65 536 = 2 16 .

Стандарт Unicode описывает алфавиты всех известных, в том числе и «мёртвых», языков. Для языков, имеющих несколько алфавитов или вариантов написания (например, японского и индийского), закодированы все варианты. В кодировку Unicode внесены все математические и иные научные символьные обозначения и даже некоторые придуманные языки (например, язык эльфов из трилогии Дж. Р. Р. Толкина «Властелин колец»).

Всего современная версия Unicode позволяет закодировать более миллиона различных знаков, но реально используется чуть менее 110 000 кодовых позиций.

Для представления символов в памяти компьютера в стандарте Unicode имеется несколько кодировок.

В операционных системах семейства Windows используется кодировка UTF-16. В ней все наиболее важные символы кодируются с помощью 2 байт (16 бит), а редко используемые — с помощью 4 байт.

В операционной системе Linux применяется кодировка UTF-8, в которой символы могут занимать от 1 (символы, входящие в таблицу ASCII) до 4 байт. Если значительную часть текста составляют цифры и латинские буквы, то это позволяет в несколько раз уменьшить размер файла по сравнению с кодировкой UTF-16.

Кодировки Unicode позволяют включать в один документ символы самых разных языков, но их использование ведёт к увеличению размеров текстовых файлов.

Мы уже касались этого вопроса, рассматривая алфавитный подход к измерению информации.

Оценим в байтах объём текстовой информации в современном словаре иностранных слов из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы).

Будем считать, что при записи используется кодировка «один символ — один байт». Количество символов во всем словаре равно:

80 • 60 • 740 = 3 552 000.

Следовательно, объём равен

3 552 000 байт = 3 468,75 Кбайт ≈ 3,39 Мбайт.

Если же использовать кодировку UTF-16, то объём этой же текстовой информации в байтах возрастёт в 2 раза и составит 6,78 Мбайт.

САМОЕ ГЛАВНОЕ

Текстовая информация по своей природе дискретна, т. к. представляется последовательностью отдельных символов.

В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.

В 1991 году был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод), позволяющий использовать в текстах любые символы любых языков мира. Кодировки Unicode позволяют включать в один документ символы самых разных языков, но их использование ведёт к увеличению размеров текстовых файлов.

Вопросы и задания

1. Какова основная идея представления текстовой информации в компьютере?

2. Что представляет собой кодировка ASCII? Сколько символов она включает? Какие это символы?

3. Как известно, кодовые таблицы каждому символу алфавита ставят в соответствие его двоичный код. Как, в таком случае, вы можете объяснить вид таблицы 3.8 «Кодировка ASCII»?

4. С помощью таблицы 3.8:

5. Что представляют собой расширения ASCII-кодировки? Назовите основные расширения ASCII-кодировки, содержащие русские буквы.

6. Сравните подходы к расположению русских букв в кодировках Windows-1251 и КОИ-8.

7. Представьте в кодировке Windows-1251 текст «Знание — сила!»:

1) шестнадцатеричным кодом;
2) двоичным кодом;
3) десятичным кодом.

8. Представьте в кодировке КОИ-8 текст «Дело в шляпе!»:

1) шестнадцатеричным кодом;
2) двоичным кодом;
3) десятичным кодом.

9. Что является содержимым файла, созданного в современном текстовом процессоре?

10. В кодировке Unicode на каждый символ отводится 2 байта. Определите в этой кодировке информационный объём следующей строки:

Где родился, там и сгодился.

11. Набранный на компьютере текст содержит 2 страницы. На каждой странице 32 строки, в каждой строке 64 символа. Определите информационный объём текста в кодировке Unicode, в которой каждый символ кодируется 16 битами.

13. В текстовом процессоре MS Word откройте таблицу символов (вкладка Вставка ⇒ Символ ⇒ Другие символы):



В поле Шрифт установите Times New Roman, в поле из — кириллица (дес.).

Нажмите, чтобы узнать подробности

Двоичное кодирование – это кодирование всех видов информации с помощью двух знаков (обычно 0 и 1).

Передача электрических сигналов:

сигнал с помехами

сигнал с помехами

« 1 »

« 0 »

полезный сигнал

полезный сигнал

числа звук Двоичное кодирование кодировщик символы 101011011101110110101 рисунки в такой форме можно закодировать все виды информации нужны только устройства с двумя состояниями практически нет ошибок при передаче компьютеру легче обрабатывать данные человеку сложно воспринимать двоичные коды ? Можно ли использовать не «0» и «1», а другие символы, например, «А» и «Б»? 3

Двоичное кодирование

  • в такой форме можно закодировать все виды информации
  • нужны только устройства с двумя состояниями
  • практически нет ошибок при передаче
  • компьютеру легче обрабатывать данные
  • человеку сложно воспринимать двоичные коды

Можно ли использовать не «0» и «1», а другие символы, например, «А» и «Б»?

Кодирование информации Тема 2. Кодирование чисел и символов © К.Ю. Поляков, 2007 -2008

Кодирование информации

Тема 2. Кодирование чисел и символов

© К.Ю. Поляков, 2007 -2008

Кодирование чисел (двоичная система) Алфавит: 0, 1 Основание (количество цифр): 2 10  2 19 2 19 = 10011 2 18 2 9 8 1 4 2 система счисления 4 1 2 2 2 0 1 2 0 0 0 2  10 1 4 3 2 1 0 разряды = 1 · 2 4 + 0 · 2 3 + 0 · 2 2 + 1 · 2 1 + 1 · 2 0 = 16 + 2 + 1 = 19 10011 2

Кодирование чисел (двоичная система)

Алфавит: 0, 1 Основание (количество цифр): 2

10  2

19 = 10011 2

2  10

= 1 · 2 4 + 0 · 2 3 + 0 · 2 2 + 1 · 2 1 + 1 · 2 0

= 16 + 2 + 1 = 19

10011 2

Кодирование символов Текстовый файл на экране ( символы ) в памяти – двоичные коды 1000001 2 1000010 2 1000011 2 1000100 2 65 66 67 68 ! В файле хранятся не изображения символов, а их числовые коды в двоичной системе! А где же хранятся изображения?

Кодирование символов

Текстовый файл

  • на экране ( символы )
  • в памяти – двоичные коды

В файле хранятся не изображения символов, а их числовые коды в двоичной системе!

А где же хранятся изображения?

Кодирование символов Сколько символов надо использовать одновременно? или 65536 ( UNICODE ) Сколько места надо выделить на символ : Выбрать 256 любых символов (или 65536) - алфавит . Каждому символу – уникальный код 0..255 (или 0..65535). Таблица символов: Коды – в двоичную систему . 256 256 = 2 8 8 бит на символ коды 65 66 67 68 … A B C D …

Кодирование символов

  • Сколько символов надо использовать одновременно? или 65536 ( UNICODE )
  • Сколько места надо выделить на символ:
  • Выбрать 256 любых символов (или 65536) - алфавит .
  • Каждому символу – уникальный код 0..255 (или 0..65535). Таблица символов:
  • Коды – в двоичную систему .

256 = 2 8 8 бит на символ

Кодировка 1 байт на символ

таблица ASCII

( международная )

кодовая страница

ASCII = American Standard Code for Information Interchange

0-31 управляющие символы: 7 – звонок, 10 – новая строка, 13 – возврат каретки, 2 7 – Esc.

знаки препинания : . , : ; ! ?

специальные знаки : + - * / () <> []

65-90 заглавные латинские буквы A-Z

97 - 122 строчные латинские буквы a-z

Кодовая страница (расширенная таблица ASCII ) для русского языка:

CP-866 для системы MS DOS

CP-1251 для системы Windows ( Интернет )

Кодировка UNICODE ( UTF-16 ) Windows , MS Office , … 16 бит на символ 65536 или 2 16 символов в одной таблице можно одновременно использовать символы разных языков ( Интернет ) размер файла увеличивается в 2 раза 10

Кодировка UNICODE ( UTF-16 )

можно одновременно использовать символы разных языков ( Интернет )

размер файла увеличивается в 2 раза

Кодирование информации Тема 3. Кодирование рисунков © К.Ю. Поляков, 2007 -2008

Кодирование информации

Тема 3. Кодирование рисунков

© К.Ю. Поляков, 2007 -2008

Два типа кодирования рисунков растровое кодирование точечный рисунок, состоит из пикселей фотографии, размытые изображения фотографии, размытые изображения векторное кодирование рисунок, состоит из отдельных геометрических фигур чертежи, схемы, карты чертежи, схемы, карты 12

Два типа кодирования рисунков

  • растровое кодирование точечный рисунок, состоит из пикселей

фотографии, размытые изображения

  • фотографии, размытые изображения
  • векторное кодирование рисунок, состоит из отдельных геометрических фигур

чертежи, схемы, карты

Растровое кодирование Шаг 1. Дискретизация: разбивка на пиксели . Шаг 2. Для каждого пикселя определяется единый цвет . Пиксель – это наименьший элемент рисунка, для которого можно независимо установить цвет. ! Есть потеря информации! почему? как ее уменьшить? почему? как ее уменьшить? Разрешение : число пикселей на дюйм , pixels per inch (ppi ) экран 96 ppi, печать 300-600 ppi, типография 1200 ppi 12 13

Растровое кодирование

Шаг 1. Дискретизация: разбивка на пиксели .

Шаг 2. Для каждого пикселя определяется единый цвет .

Пиксель – это наименьший элемент рисунка, для которого можно независимо установить цвет.

Есть потеря информации!

Разрешение : число пикселей на дюйм , pixels per inch (ppi )

экран 96 ppi, печать 300-600 ppi, типография 1200 ppi

Растровое кодирование (True Color) Шаг 3. От цвета – к числам: модель RGB цвет = R + G + B red красный 0..255 green зеленый 0..255 blue синий 0..255 R = 218 G = 164 B = 32 R = 135 G = 206 B = 250 Шаг 4 . Числа – в двоичную систему. Глубина цвета ? Сколько разных цветов можно кодировать? 256 · 256 · 256 = 16 777 216 ( True Color ) ? Сколько памяти нужно для хранения цвета 1 пикселя? R : 256=2 8 вариантов, нужно 8 бит = 1 байт R G B: всего 3 байта 13 14

Растровое кодирование (True Color)

Шаг 3. От цвета – к числам: модель RGB

цвет = R + G + B

green

R = 218 G = 164 B = 32

R = 135 G = 206 B = 250

Шаг 4 . Числа – в двоичную систему.

Глубина цвета

Сколько разных цветов можно кодировать?

256 · 256 · 256 = 16 777 216 ( True Color )

Сколько памяти нужно для хранения цвета 1 пикселя?

R : 256=2 8 вариантов, нужно 8 бит = 1 байт R G B: всего 3 байта

Растровое кодирование с палитрой Шаг 1. Выбрать количество цветов: 2, 4, … 256. Шаг 2. Выбрать 256 цветов из палитры: 248 0 88 0 221 21 181 192 0 21 0 97 Шаг 3 . Составить палитру (каждому цвету – номер 0..255) палитра хранится в начале файла 255 1 254 0 248 0 88 0 221 21 … 181 192 0 21 0 97 Шаг 4. Код пикселя = номеру его цвета в палитре 2 45 65 14 … 12 23 14

Растровое кодирование с палитрой

Шаг 1. Выбрать количество цветов: 2, 4, … 256.

Шаг 2. Выбрать 256 цветов из палитры:

248 0 88

0 221 21

181 192 0

21 0 97

Шаг 3 . Составить палитру (каждому цвету – номер 0..255) палитра хранится в начале файла

248 0 88

0 221 21

181 192 0

21 0 97

Шаг 4. Код пикселя = номеру его цвета в палитре

Растровое кодирование с палитрой Файл с палитрой: пал ит ра коды пикселей ? Сколько занимает палитра и основная часть? Один цвет в палитре: 3 байта ( R G B ) 256 = 2 8 цветов: палитра 256 · 3 = 768 байт рисунок 8 бит на пиксель 1 6 цветов: палитра 16 · 3 = 48 байт рисунок 4 бита на пиксель 2 цвета: палитра 2 · 3 = 6 байт рисунок 1 бит на пиксель Глубина цвета

Растровое кодирование с палитрой

Файл с палитрой:

Сколько занимает палитра и основная часть?

Один цвет в палитре: 3 байта ( R G B )

256 = 2 8 цветов: палитра 256 · 3 = 768 байт

рисунок 8 бит на пиксель

1 6 цветов: палитра 16 · 3 = 48 байт

рисунок 4 бита на пиксель

2 цвета: палитра 2 · 3 = 6 байт

рисунок 1 бит на пиксель

Глубина цвета

Форматы файлов ( растровые рисунки) Формат True Color BMP Палитра  JPG GIF Прозрачность   PNG      17

Форматы файлов ( растровые рисунки)

Прозрачность

Растровые рисунки лучший способ для хранения фотографий и изображений без четких границ спецэффекты (тени, ореолы, и т.д.) есть потеря информации (почему?) при изменении размеров рисунка он искажается размер файла не зависит от сложности рисунка (а от чего зависит?) ? Какие свойства цифрового рисунка определяют его качество? 17 18

Растровые рисунки

  • лучший способ для хранения фотографий и изображений без четких границ
  • спецэффекты (тени, ореолы, и т.д.)
  • есть потеря информации (почему?)
  • при изменении размеров рисунка он искажается
  • размер файла не зависит от сложности рисунка (а от чего зависит?)

Какие свойства цифрового рисунка определяют его качество?

Векторные рисунки Строятся из геометрических фигур: отрезки, ломаные, прямоугольники окружности, эллипсы, дуги сглаженные линии (кривые Безье) отрезки, ломаные, прямоугольники окружности, эллипсы, дуги сглаженные линии (кривые Безье) Для каждой фигуры в памяти хранятся: размеры и координаты на рисунке цвет и стиль границы цвет и стиль заливки (для замкнутых фигур) размеры и координаты на рисунке цвет и стиль границы цвет и стиль заливки (для замкнутых фигур) Форматы файлов: WMF (Windows Metafile) CDR (CorelDraw) WMF (Windows Metafile) CDR (CorelDraw) AI (Adobe Illustrator) FH (FreeHand) 18 19

Векторные рисунки

Строятся из геометрических фигур:

  • отрезки, ломаные, прямоугольники окружности, эллипсы, дуги сглаженные линии (кривые Безье)
  • отрезки, ломаные, прямоугольники
  • окружности, эллипсы, дуги
  • сглаженные линии (кривые Безье)

Для каждой фигуры в памяти хранятся:

  • размеры и координаты на рисунке цвет и стиль границы цвет и стиль заливки (для замкнутых фигур)
  • размеры и координаты на рисунке
  • цвет и стиль границы
  • цвет и стиль заливки (для замкнутых фигур)

Форматы файлов:

Векторные рисунки лучший способ для хранения чертежей, схем, карт ; при кодировании нет потери информации ; при изменении размера нет искажений ; меньше размер файла , зависит от сложности рисунка ; неэффективно использовать для фотографий и размытых изображений 19 20

Векторные рисунки

  • лучший способ для хранения чертежей, схем, карт;
  • при кодировании нет потери информации ;
  • при изменении размера нет искажений ;
  • меньше размер файла , зависит от сложности рисунка ;
  • неэффективно использовать для фотографий и размытых изображений

Кодирование информации Тема 4 . Кодирование звука © К.Ю. Поляков, 2007 -2008

Кодирование информации

Тема 4 . Кодирование звука

© К.Ю. Поляков, 2007 -2008

Оцифровка ( перевод в цифровую форму ) цифровой сигнал 1011010110101010011 аналоговый сигнал аналоговый сигнал ? Какой объем информации в аналоговом сигнале? Можно ли хранить его в памяти реального устройства? Будет ли сигнал на выходе тот же самый? Почему есть потеря информации?

Оцифровка ( перевод в цифровую форму )

цифровой сигнал

аналоговый сигнал

аналоговый сигнал

  • Какой объем информации в аналоговом сигнале?
  • Можно ли хранить его в памяти реального устройства?
  • Будет ли сигнал на выходе тот же самый?
  • Почему есть потеря информации?

Дискретизация по времени хранятся только значения сигнала в моменты 0 , T , 2T , … T – интервал дискретизации Частота дискретизации : f = 8 кГц, 11 кГц, 22 кГц, 44 кГц ( CD) Человек слышит 16 Гц … 20 кГц с 22 кГц 0 T 2 T ? Что компьютер может выдать на выход? ? Как улучшить качество? Что при этом ухудшится? 0 T 2 T 23

Дискретизация по времени

хранятся только значения сигнала в моменты 0 , T , 2T , …

T – интервал дискретизации

Частота дискретизации :

f = 8 кГц, 11 кГц, 22 кГц, 44 кГц ( CD)

Человек слышит 16 Гц … 20 кГц

Что компьютер может выдать на выход?

Как улучшить качество? Что при этом ухудшится?

Дискретизация по уровню ? Сколько бит нужно, чтобы хранить число 0,7 ? У всех точек в одной полосе одинаковый код! 8 бит = 256 уровней 16 бит = 65536 уровней 2 4 бита = 2 2 4 уровней 4 3 2 1 0 0 T 2 T «Глубина» кодирования ( разрядность звуковой карты ) ! При оцифровке потерю информации дает дискретизация как по времени, так и по уровню! 23 24

Дискретизация по уровню

Сколько бит нужно, чтобы хранить число 0,7 ?

У всех точек в одной полосе одинаковый код!

8 бит = 256 уровней

16 бит = 65536 уровней

2 4 бита = 2 2 4 уровней

«Глубина» кодирования

( разрядность звуковой карты )

При оцифровке потерю информации дает дискретизация как по времени, так и по уровню!

Оцифровка – итог можно закодировать любой звук (в т.ч. голос, свист, шорох, …) есть потеря информации большой объем файлов ? Какие свойства цифрового звука определяют его качество? частота дискретизации 44 кГц, глубина кодирования16 бит : 88 Кб / с = 5,3 Мб / мин Форматы файлов: WAV ( Waveform audio format), часто без сжатия (размер!) MP3 ( MPEG-1 Audio Layer 3 , сжатие с потерями ) WMA ( Windows Media Audio, потоковый звук, сжатие ) WAV ( Waveform audio format), часто без сжатия (размер!) MP3 ( MPEG-1 Audio Layer 3 , сжатие с потерями ) WMA ( Windows Media Audio, потоковый звук, сжатие ) 24 25

Оцифровка – итог

можно закодировать любой звук (в т.ч. голос, свист, шорох, …)

  • есть потеря информации
  • большой объем файлов

Какие свойства цифрового звука определяют его качество?

частота дискретизации 44 кГц, глубина кодирования16 бит :

88 Кб / с = 5,3 Мб / мин

Форматы файлов:

WAV ( Waveform audio format), часто без сжатия (размер!)

MP3 ( MPEG-1 Audio Layer 3 , сжатие с потерями )

WMA ( Windows Media Audio, потоковый звук, сжатие )

  • WAV ( Waveform audio format), часто без сжатия (размер!) MP3 ( MPEG-1 Audio Layer 3 , сжатие с потерями ) WMA ( Windows Media Audio, потоковый звук, сжатие )

Инструментальное кодирование MIDI ( Musical Instrument Digital Interface ) , файлы *. MID в файле: нота (высота, длительность) музыкальный инструмент параметры звука (громкость, тембр) может быть несколько каналов нота (высота, длительность) музыкальный инструмент параметры звука (громкость, тембр) может быть несколько каналов нет потери информации при кодировании инструментальной музыки маленький размер файлов невозможно закодировать нестандартный звук, голос MIDI -клавиатура : 25 26

Инструментальное кодирование

MIDI ( Musical Instrument Digital Interface ) , файлы *. MID

  • · кодирование, которое обеспечивается устройствами ввода при преобразовании входной информации в форму, воспринимаемую компьютером, то есть в двоичный код;
  • · декодирование, которое обеспечивается устройствами вывода при преобразовании данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намногоболее простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

  • · 0 -- отсутствие электрического сигнала или сигнал имеет низкий уровень;
  • · 1 -- наличие сигнала или сигнал имеет высокий уровень.

Эти состояния легко различать. Недостаток двоичного кодирования -- длинные коды. Но в технике легче иметь дело с большим числом простых элементов, чем с небольшим количеством сложных.

Вам и в быту ежедневно приходится сталкиваться с устройством, которое может находиться только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.

В настоящее время существуют разные способы двоичного кодирования и декодирования информации в компьютере. В первую очередь это зависит от вида информации, а именно, что должно кодироваться: текст, числа, графические изображения или звук. Кроме того, при кодировании чисел важную роль играет то, как они будут использоваться: в тексте, в расчетах или в процессе ввода-вывода. Накладываются также и особенности технической реализации.

Кодирование чисел

Система счисления -- совокупность приемов и правил записи чисел с помощью определенного набора символов. Для записи чисел могут использоваться не только цифры, но и буквы (например, запись римских цифр -- XXI). Одно и то же число может быть по-разному представлено в различных системах счисления. В зависимости от способа изображения чисел системы счисления делятся на позиционные и непозиционные.

В позиционной системе счисления количественное значение каждой цифры числа зависит от того, в каком месте (позиции или разряде) записана та или иная цифра этого числа. Например, меняя позицию цифры 2 в десятичной системе счисления, можно записать разные по величине десятичные числа, например 2; 20; 2000; 0,02 и т. д.

В непозиционной системе счисления цифры не изменяют своего количественного значения при изменении их расположения (позиции) в числе. Примером непозиционной системы может служить римская система, в которой независимо от местоположения одинаковый символ имеет неизменное значение (например, символ X в числе XXV).

Количество различных символов, используемых для изображения числа в позиционной системе счисления, называется основанием системы счисления.

В компьютере наиболее подходящей и надежной оказалась двоичная система счисления, в которой для представления чисел используются последовательности цифр 0 и 1. Кроме того, для работы с памятью компьютера оказалось удобным использовать представление информации с помощью еще двух систем счисления:

  • · восьмеричной ( любое число представляется с помощью восьми цифр -- 0, 1, 2. 7);
  • · шестнадцатеричной (используемые символы-цифры -- 0, 1, 2. 9 и буквы -- А, В, С, D, Е, F, заменяющие числа 10, 11, 12, 13, 14, 15 соответственно).

Кодирование символьной информации

Нажатие алфавитно-цифровой клавиши на клавиатуре приводит к тому, что в компьютер посылается сигнал в виде двоичного числа, представляющего собой одно из значений кодовой таблицы. Кодовая таблица - это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standart Code for Informational Interchange - американский стандартный код информационного обмена).

Для хранения двоичного кода одного символа выделен 1 байт = 8 бит. Учитывая, что каждый бит принимает значение 1 или 0, количество возможных сочетаний единиц и нулей равно 2 8 = 256.

Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Эти коды и составляют таблицу ASCII.

Пример, при нажатии клавиши с буквой S в память компьютера записывается код 01010011. При выводе буквы 8 на экран компьютер выполняет декодирование -- на основании этого двоичного кода строится изображение символа.

SUN (СОЛНЦЕ) - 01010011 010101101 01001110

Стандарт ASCII кодирует первые 128 символов от 0 до 127: цифры, буквы латинского алфавита, управляющие символы. Первые 32 символа являются управляющими и предназначены в основном для передачи команд управления. Их назначение может варьироваться в зависимости от программных и аппаратных средств. Вторая половина кодовой таблицы (от 128 до 255) американским стандартом не определена и предназначена для символов национальных алфавитов, псевдографических и некоторых математических символов. В разных странах могут использоваться различные варианты второй половины кодовой таблицы.

Цифры кодируются по стандарту ASCII записываются в двух случаях - при вводе-выводе и когда они встречаются я тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичный код.

Для сравнения рассмотрим число 45 для двух вариантов кодирования.

При использовании в тексте это число потребует для своего представления 2 байта, поскольку каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII . В двоичной системе - 00110100 00110101.

Кодирование графической информации

Создавать и хранить графические объекты в компьютере можно двумя способами -- как растровое или как векторное изображение. Для каждого типа изображения используется свой способ кодирования.

Растровое изображение представляет собой совокупность точек, используемых для его отображения на экране монитора. Объем растрового изображения определяется как произведение количества точек и информационного объема одной точки, который зависит от количества возможных цветов. Для черно-белого изображения информационный объем одной точки равен 1 биту, так как точка может быть либо черной, либо белой, что можно закодировать двумя цифрами -- 0 или 1.

Для кодирования 8 цветов необходимо 3 бита; для 16 цветов -- 4 бита; для 256 цветов -- 8 битов (1 байт) и т.д.


Векторное изображение представляет собой совокупность графических примитивов. Каждый примитив состоит из элементарных отрезков кривых, параметры которых (координаты узловых точек, радиус кривизны и пр.) описываются математическими формулами. Для каждой линии указываются ее тип (сплошная, пунктирная, штрих-пунктирная), толщина и цвет, а замкнутые фигуры дополнительно характеризуются типом заливки. Кодирование векторных изображений выполняется различными способами в зависимости от прикладной среды. В частности, формулы, описывающие отрезки кривых, могут кодироваться как обычная буквенно-цифровая информация для дальнейшей обработки специальными программами.

Кодирование звуковой информации

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие участки, причем для каждого такого участка устанавливается определенная величина амплитуды.Таким образом, непрерывная зависимость амплитуды сигнала от времени заменяется на дискретную последовательность уровней громкости.

Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. В таком случае количество уровней сигнала будет равно 65536.

При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, т.е. от частоты дискретизации. Чем больше количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц - качество звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стерео-режимы.


Стандартная программа Windows Звукозапись играет роль цифрового магнитофона и позволяет записывать звук, т.е. дискретизировать звуковые сигналы, и сохранять их в звуковых файлах в формате wav. Также эта программа позволяет производить простейшее редактирование звуковых файлов.

Сегодня каждый из нас не представляет жизнь без компьютера. Компьютер — это устройство, которое может работать с разными видами данных (текстовые, графические, звуковые). Чтобы эти данные компьютер мог сохранить, обработать, передать они должны быть представлены в цифровом виде. Данные в компьютере хранятся, обрабатываются, передаются в двоичном коде.

Двоичный код — это строка символов, состоящих из \(0\) и \(1\).

Как у каждого языка (формального или естественного), двоичный код имеет свой алфавит и мощность алфавита.

Алфавит, в котором два символа, называется двоичным алфавитом.

Мощность алфавита — это количество символов, которые в него входят.

Запись информации, с помощью двоичного алфавита, называют двоичным кодированием.

Почему именно \(0\) и \(1\)? Потому что в технике проще всего реализовать такие наборы цифр: если есть сигнал, то это \(1\), если нет — это \(0\).

Двоичная система кодирования появилась не с созданием компьютера, еще задолго до этого математик Г.В. Лейбниц использовал двоичные числа.

В своей бинарной (двоичной) арифметике Лейбниц видел прообраз творения. Ему представлялось, что единица представляет божественное начало, а нуль — небытие, и что Высшее Существо создает все сущее из небытия точно таким же образом, как единица и нуль в его системе выражают все числа.

Существуют ряд устройств, работающих по принципу двоичного кодирования. Например, обычный выключатель, где свет (горит/не горит).

Всем известная азбука Морзе тоже состоит из двух знаков: точки и тире.

азбука.jpg

Память компьютера можно представить в виде листочка в клетку и в каждой клетке хранятся либо \(1\), либо \(0\).

лист.jpg

Что же происходит, когда мы нажимаем на клавиатуре цифру, например, «\(5\)»?

Каждая клавиша имеет свой порядковый номер (по кодировочной таблице) и именно он переводится в двоичный код.

двоичный код.jpg

Как узнать какой сколько бит (клеточек) в памяти компьютера необходимо для кодирования различных знаков?

Как кодируются числа при помощи двоичного кодирования?

Пусть нам нужно закодировать две цифры — \(0\) и \(1\). Для кодирования этих цифр мне нужно \(2\) ячейки памяти, в одну напишем \(0\), а в другую \(1\).

А если цифр больше? Сколько битов нужно для кодирования каждой цифры? Рассмотрим как закодировать \(4\) цифры.

Если будем использовать однозначные числа, то хватит только для кодирования двух цифр, а нам нужно больше. Попробуем сделать коды двузначными.

Цепочка из двух символов достаточна для кодирования \(4\)-х знаков, а если нужно закодировать \(8\) знаков? Попробуем увеличить длину цепочки.

Читайте также: