Информация в компьютере представлена в двоичном коде алфавит которого состоит из

Обновлено: 04.07.2024

Кодирование - это представление информации с помощью некоторого кода.

Код - это система условных знаков для представления информации.

Способы кодирования информации

  • Графический
  • Числовой
  • Символьный

Декодировани е - это действие по восстановлению первоначальной формы представления информации. Для декодирования необходимо знать код и правила кодирования.

Средством кодирования и декодирования служит кодовая таблица соответствия. Например, соответствие в различных системах счисления - 24 - XXIV, соответствие алфавита каким-либо символамПримеры кодирования информации

Примером кодирования информации является азбука Морзе.

В азбуке Морзе используется всего 2 символа - точка и тире (короткий и длинный звук).

Еще одним примером кодирования информации является флажковая азбука.

Также примером является азбука флагов

Всем известный пример кодирования - нотная азбука.

Кодирование информации

Представление информации происходит в различных формах в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером, компьютером и компьютером.

Кодирование - это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы.

Примером может служить язык жестов.

Сигналы

Вокруг нас существуют преимущественно два сигнала, например:

Всё это сигналы, обозначающие количество информации в 1 бит.

1 бит - это такое количество информации, которое позволяет нам выбрать один вариант из двух возможных.

Распознавание информации компьютером

Компьютер - это электрическая машина, работающая на электронных схемах. Чтобы компьютер распознал и понял вводимую информацию, ее надо перевести на компьютерный (машинный) язык.

Алгоритм, предназначенный для исполнителя, должен быть записан, то есть закодирован, на языке, понятном компьютеру.

Это электрические сигналы: проходит ток или не проходит ток.

Машинный двоичный язык - последовательность "0" и "1". Каждое двоичное число может принимать значение 0 или 1.

Каждая цифра машинного двоичного кода несет количество информации, равное 1 бит.

Бит и байт

Двоичное число, которое представляет наименьшую единицу информации, называется бит. Бит может принимать значение либо 0, либо 1. Наличие магнитного или электронного сигнала в компьютере означает 1, отсутствие 0.

Строка из 8 битов называется байт. Эту строку компьютер обрабатывает как отдельный символ (число, букву).

Рассмотрим пример. Слово ALICE состоит из 5 букв, каждая из которых на языке компьютера представлена одним байтом. Стало быть, Alice можно измерить как 5 байт.

Теория информации. результат развития теории связи (К.Шеннон) Информация-содержание, заложенное в знаковые ( сигнальные последовательности).

Кибернетика. Исследует информационные процессы в системах управления (Н. Винер). Информация- содержание сигналов, передаваемых по каналам связи в системах управления.

Нейрофизиология. Изучает информационные процессы в механизмах нервной деятельности животного и человека. Информация- содержание сигналов электрохимической природы, передающихся по нервным волокнам организма.

Генетика. Изучает механизмы наследственности, пользуется понятием "наследственная информация". Информация- содержание генетического кода- структуру молекул ДНК, входящих в состав клетки живого организма.

Философия. Атрибутивная концепция: Информация- всеобщее свойство (атрибут) материи.

Функциональная концепция: Информация и информационные процессы присущи только живой природе, являются ее функцией.

Антропоцентрическая концепция: Информация и информационные процессы присущи только человеку.

Понятие информации относится к числу фундаментальных, т.е. является основополагающим для науки и не объясняется через другие понятия.

В этом смысле информация встает в один ряд с такими фундаментальными научными понятиями, как вещество, энергия, пространство, время.

Содержательный (вероятностный) подход к измерению информации

Существует два подхода к измерению информации: содержательный (вероятностный) и объемный (алфавитный).

Пусть у нас имеется монета, которую мы бросаем. С равной вероятностью произойдет одно из двух возможных событий – монета окажется в одном из двух положений: «орел» или «решка». Можно говорить, что события равновероятны.

N = 2I

Если вернуться к опыту с бросанием монеты, то здесь неопределенность как раз уменьшается в два раза и, следовательно, полученное количество информации равно 1 биту.

2 = 21

Бит – наименьшая единица измерения информации.

С помощью набора битов можно представить любой знак и любое число. Знаки представляются восьмиразрядными комбинациями битов – байтами.

1байт = 8 битов

Байт – это 8 битов, рассматриваемые как единое целое, основная единица компьютерных данных.

Для измерения информации используются более крупные единицы: килобайты, мегабайты, гигабайты, терабайты и т.д.

1 Кбайт = 210 байт = 1 024 байт

1 Мбайт = 220 байт = 210 Кбайт = 1 024 Кбайт = 1 048 576 байт

1 Гбайт = 230 байт = 1 024 Мбайт

1 Тбайт = 240 байт = 1 024 Гбайт

В рулетке общее количество лунок равно 32. Какое количество информации мы получим при остановке шарика в одной из лунок?

В школьной библиотеке 16 стеллажей с книгами. На каждом стеллаже 8 полок. Библиотекарь сообщил Пете, что нужная ему книга находится на пятом стеллаже на третьей сверху полке. Какое количество информации передал библиотекарь Пете?

При угадывании целого числа в диапазоне от 1 до N было получено 9 бит информации. Чему равно N?

Заполните пропуски числами:

5 Кбайт = __5120__байт = _40960____ бит

_1,5_Кбайт = 1536 байт = _____ бит

__Кбайт = ____ байт = 512 бит

Объемный (алфавитный) подход к измерению информации

Информация является предметом нашей деятельности: мы ее храним, передаем, принимаем, обрабатываем. Нам часто необходимо знать, достаточно ли места на носителе, чтобы разместить нужную нам информацию, сколько времени потребуется, чтобы передать информацию по каналу связи и т.п. Величина, которая нас в этих ситуациях интересует, называется объемом информации. В таком случае говорят об объемном подходе к измерению информации.

Для обмена информацией с другими людьми человек использует естественные языки (русский, английский, китайский и др.).

Наряду с естественными языками были разработаны формальные языки (системы счисления, язык алгебры, языки программирования и др.). Основное отличие формальных языков от естественных состоит в наличии строгих правил грамматики и синтаксиса. Например, системы счисления можно рассматривать как формальные языки, имеющие алфавит (цифры) и позволяющие не только именовать и записывать объекты (числа), но и выполнять над ними арифметические операции по строго определенным правилам. Некоторые языки используют в качестве знаков не буквы и цифры, а другие символы, например химические формулы, ноты, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки Морзе и др.).

Представление информации может осуществляться с помощью языков, которые являются знаковыми системами.

Каждая знаковая система строится на основе определенного алфавита и правил выполнения операций над знаками.

При хранении и передаче информации с помощью технических устройств информация рассматривается как последовательность символов – знаков (букв, цифр, кодов цветов точек изображения и т.д.)

N = 2I

где N – это количество знаков в алфавите знаковой системы, можно рассчитать

I – количество информации, которое несет каждый символ.

Информационная емкость знаков зависит от их количества в алфавите. Так, информационная емкость буквы в русском алфавите, если не использовать букву «ё», составляет:

32 = 2I , т.е. I = 5 битов

Ic = I х K

Например: в слове «информатика» 11 знаков (К=11), каждый знак в русском алфавите несет информацию 5 битов (I=5), тогда количество информации в слове «информатика» Iс=5х11=55 (битов).

Интересно, что сама единица измерения количества информации бит (bit) получила свое название от английского словосочетания BInary digiТ, т.е. двоичная цифра.

Чем большее количество знаков содержит алфавит знаковой системы, тем большее количество информации несет один знак.

Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице?

Информация в компьютере представлена в двоичном коде, алфавит которого состоит из двух цифр- 0 и 1. Цифра двоичной системы называется битом (от английских слов binary digit - двоичная цифра).

Кодирование - это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы другой знаковой системы.

Двоичное кодирование текстовой информации

В основе кодирования текстовой информации лежит кодировка символов вводимых с клавиатуры. Основной принцип кодирования символов - договоренность.

Код ASCII (American Standard Code for Information Interchange -Американский стандартный код информационного обмена), принятый для персональных компьютеров. Алфавит, отображаемый в двоичные коды, включает знаки, которые можно набрать на клавиатуре компьютера (в том числе комбинаций различных клавиш). Таких знаков 256.

Алгоритм определения количества текстовой информации:

1. Определить кол-во символов.

2. Определить сколько бит используется для кодировки 1 символа.

3. Количество информации = число символов * число разрядов в двоичном коде.

Подсчитайте количество информации в данном тексте (бит, байт)

Двоичное кодирование графической информации

Изображение представляется в виде совокупности точек (пикселов). Точки, принадлежащие изображению, и точки, принадлежащие фону, кодируются разными знаками. Черно-белое изображение можно закодировать последовательностью:

0 - нет сигнала (чёрный); 1 - есть сигнал (белый)

Алгоритм определения количества графической информации:

1. Определить кол-во пиксель в изображении;

2. Определить глубину цвета.

Цветные изображения могут иметь различную глубину цвета:

 2 цвета 1 пиксел – 1 бит

 256 цветов 1 пиксел – 1 байт=8 бит

 65536 цветов 1 пиксел – 2 байт=16 бит

3. Количество информации = количеству точек (пиксел), составляющих кадр изображения * глубина цвета.

Выполните кодирование черно-белого графического изображения. Определить количество информации (бит,байт).

Определить объем графического растрового изображения размером 50 на 50 и глубина цвета 256 цветов.

Двоичное кодирование звуковой информации.

Алгоритм определения кол-ва звуковой информации:

1. Глубина кодирования – количество различных уровней сигнала:

 256 уровней – 1 байт = 8 бит

 65536 уровней – 2 байта = 16 бит

2. Частота дискретизации определяется в Гц.

3. Режимы звучания:

4. время в секундах

5. Количество звуковой информации = глубиной кодирования (бит)* частотой дискретизации (Гц)* режим звучания * время (секунды)

Определите информационный объём стереоаудиофайла длительностью звучания 5 секунд при частоте 48 КГц и глубиной кодирования 65536 уровней.

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

Система счисления — способ записи чисел с помощью набора специальных знаков, называемых цифрами.

Десятичная система счисления — позиционная система счисления по основанию 10. Предполагается, что основание 10 связано с количеством пальцев рук у человека. Наиболее распространённая система счисления в мире. Для записи чисел используются символы 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, называемые арабскими цифрами.

Двоичная система счисления — позиционная система счисления с основанием 2. Используются цифры 0 и 1. Двоичная система используется в цифровых устройствах, поскольку является наиболее простой.

Двоичная система счисления обладает такими же свойствами, что и десятичная, только для представления чисел используются не 10 цифр, а всего две. Соответственно и разряд числа называют не десятичным, а двоичным.

Перевод из десятичной системы счисления в систему счисления с основанием p осуществляется последовательным делением десятичного числа и его десятичных частных на p, а затем выписыванием последнего частного и остатков в обратном порядке.

Переведем десятичное число 20 в двоичную систем счисления (основание системы счисления p=2).

В итоге получили 2010 = 101002.

Двоичное кодирование текстовой информации

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Традиционно для кодирования одного символа используется количество информации = 1 байту (1 байт = 8 битов).

Для кодирования одного символа требуется один байт информации.

Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. (28 = 256)

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

Кодирование изображений

Создавать и хранить графические объекты в компьютере можно двумя способами – как растровое или как векторное изображение. Для каждого типа изображений используется свой способ кодирования.

Кодирование растровых изображений

Растровое изображение представляет собой совокупность точек (пикселей) разных цветов. Пиксель - минимальный участок изображения, цвет которого можно задать независимым образом.

В процессе кодирования изображения производится его пространственная дискретизация. Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики (большого количества маленьких разноцветных стекол). Изображение разбивается на отдельные маленькие фрагменты (точки), причем каждому фрагменту присваивается значение его цвета, то есть код цвета (красный, зеленый, синий и так далее).

Для черно-белого изображения информационный объем одной точки равен одному биту (либо черная, либо белая – либо 1, либо 0).

Для четырех цветного – 2 бита.

Для 8 цветов необходимо – 3 бита.

Для 16 цветов – 4 бита.

Для 256 цветов – 8 бит (1 байт).

Качество изображения зависит от количества точек (чем меньше размер точки и, соответственно, больше их количество, тем лучше качество) и количества используемых цветов (чем больше цветов, тем качественнее кодируется изображение). Растровые изображения очень чувствительны к масштабированию (увеличению или уменьшению). При уменьшении растрового изображения несколько соседних точек преобразуются в одну, поэтому теряется различимость мелких деталей изображения. При увеличении изображения увеличивается размер каждой точки и появляется ступенчатый эффект, который можно увидеть невооруженным глазом.

Кодирование векторных изображений

Векторное изображение представляет собой совокупность графических примитивов (точка, отрезок, эллипс…). Каждый примитив описывается математическими формулами. Кодирование зависит от прикладной среды.

Достоинством векторной графики является то, что файлы, хранящие векторные графические изображения, имеют сравнительно небольшой объем.

Важно также, что векторные графические изображения могут быть увеличены или уменьшены без потери качества.


Mind Map: Дискретизация информации

Дискретизация информации создатель Andriano Hilintano

1. Кодирование информации

1.1. Что такое информация?

1.1.1. Информация - сведения об объектах окружающего нас мира.

1.2. Что такое кодирование информации?

1.2.1. Кодирование информации – это процесс преобразования информации из одной формы в другую.

1.2.1.1.1. перевод с одного языка на другой или шифровка и передача сигнала, азбука Морзе.

1.3. Как представлена информация в компьютере?

1.3.1. Информация в компьютере представлена в виде двоичного кода, алфавит которого состоит из двух цифр: 0 и 1. 0 – отсутствие электрического сигнала; 1 – наличие электрического сигнала.

1.4. что такое код и декодирование?

1.4.1. Декодирование – процесс обратный кодированию.

1.4.2. Код – это совокупность условных знаков, каждому из которых присваивается определенное значение.

1.5. Для преобразования «естественной» информации в дискретную форму ее подвергают дискретизации и квантованию.

1.5.1. что такое Дискретизация?

1.5.1.1. процедура устранения временнόй и (или) пространственной непрерывности естественных сигналов, являющихся носителями информации.

1.5.2. Что такое квантование?

1.5.2.1. Квантование-процедура преобразования непрерывного диапазона всех возможных входных значений измеряемой величины в дискретный набор выходных значений.

2. Дискретное представление текстовой информации.

2.1. ASCII

2.1.1. ASCII (American Standard Code for Information Interchange – Американский стандартный код информационного обмена), 1960-е гг.

2.2. Unicode

2.2.1. 31 разрядная (31 бит) Укороченная – 16-ти разрядная (16 бит)

3. Дискретное представление графической информации

3.1. виды компьютерной графики

3.2. Кодирование графики

3.2.1. В процессе кодирования изображения в компьютере производится его пространственная дискретизация

3.3. Дискретное представление изображения

3.3.1. От каких параметров зависит качество изображения на мониторе?

3.3.1.1. Глубина цвета

3.3.1.2. Разрешающая способность монитора 1024768, 800 600, 1280 1024

3.3.2. С помощью каких базовых цветов получается цвет точки на экране?

3.3.2.1. Цветовое изображение на экране монитора получается из сочетаний трёх базовых цветов: красного, зелёного, синего. Такая система цветопередачи называется RGB

3.3.3. Цветовые модели

3.3.3.1. Модель RGB используется в телевизорах, мониторах, проекторах, сканерах, цифровых фотоаппаратах…

3.3.3.2. Для формирования изображения на бумаге используется другая модель – CMYK

4. Дискретное представление звуковой информации

4.1. С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

4.1.1. Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

4.1.1.1. Redirect Notice

4.1.2. Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ:

4.1.2.1. Redirect Notice

4.2. Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон. Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме.

4.2.1. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».

4.2.1.1. Каждой «ступеньке» присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

4.3. Аудиоадаптер (звуковая плата)

4.3.1. Аудиоадаптер (звуковая плата)– специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

4.3.2. В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера: Частотой дискретизации Разрядностью(глубина звука).

4.3.2.1. Частота временной дискретизации

4.3.2.1.1. это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров: 11 кГц, 22 кГц, 44,1 кГц и др.

4.3.2.2. Разрядность регистра (глубина звука)

4.3.3. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле: N = 2I = 216 = 65536, где I — глубина звука. При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации тем точнее процедура двоичного кодирования.

4.3.4. Звуковой файл

4.3.4.1. это файл, хранящий звуковую информацию в числовой двоичной форме

5. Дискретное представление числовой информации

5.1. Информация в компьютере представлена в двоичном коде, алфавит которого состоит из двух цифр (0 и 1)

5.1.1. Ячейка – это часть памяти компьютера, вмещающая в себя информацию, доступную для обработки отдельной командой процессора. Содержимое ячейки памяти называется машинным словом. Ячейка памяти разделяется на разряды, в каждом из которых хранится разряд числа.

5.2. Единицы измерения объема информации

5.2.1. Количество информации, хранящейся в ЭВМ, измеряется ее «объемом», который выражается в битах Битом также называют разряд ячейки памяти ЭВМ. 8 бит = 1 байт Байт - основная единица представления данных. Байт (от английского byte - слог) – часть машинного слова, состоящая из 8 бит, обрабатываемая в ЭВМ как одно целое.

5.3. Представление целых чисел

5.3.1. беззнаковое (только для неотрицательных целых чисел)

5.3.1.1. Для беззнакового представления все разряды ячейки отводятся под представление самого числа. В байте (8 разрядов) можно представить беззнаковые числа от 0 до 255.

5.3.1.2. Диапазон допустимых значений для беззнаковых типов: от 0 до 2k – 1, где k – количество разрядов в ячейке

5.3.2.1. Знаковый целый тип для положительных чисел

5.3.2.1.1. Для представления со знаком самый старший (левый) бит отводится под знак числа, остальные разряды - под само число. Если число положительное, то в знаковый разряд помещается 0, если отрицательное - 1.

5.3.2.1.2. В байте (8 разрядов) можно представить знаковые положительные числа от 0 до 127.

5.3.2.2. Диапазон допустимых значений для знаковых типов:

5.3.2.2.1. от -2k-1 до 2k-1 – 1, где k – количество разрядов в ячейке

5.3.3. Коды представления чисел

5.3.3.1. В ПК в целях упрощения выполнения арифметических операций применяют специальные коды для представления целых чисел.

5.3.3.2. В ПК в целях упрощения выполнения арифметических операций применяют специальные коды для представления целых чисел.

5.3.3.2.1. Прямой код числа

5.3.3.2.2. Обратный код числа

5.3.3.2.3. Дополнительный код числа

5.3.4. Прямой код двоичного числа

5.3.4.1. Прямой код двоичного числа совпадает по изображению с записью самого числа. Значение знакового разряда для положительных чисел равно 0, а для отрицательных чисел равно 1.

5.3.5. Обратный код двоичного числа

5.3.5.1. Обратный код для положительного числа совпадает с прямым кодом. Для отрицательного числа все цифры числа заменяются на противоположные (1 на 0, 0 на 1), а в знаковый разряд заносится единица.

5.3.5.2. Дополнительный код двоичного числа

5.3.5.2.1. Дополнительный код для положительного числа совпадает с прямым кодом. Для отрицательного числа дополнительный код образуется путем получения обратного кода и добавлением к младшему разряду единицы.

Читайте также: