Сколько знаков содержит алфавит который используется в знаковой системе компьютера

Обновлено: 18.05.2024

сформировать у учащихся представление о том, как в компьютере кодируется текстовая информация.

Учащиеся должны научиться:

кодировать и декодировать символы с помощью таблицы кодов;

Программно-дидактическое обеспечение: ПК, таблицы кодов, текстовый редактор, калькулятор.

Постановка целей урока.

Как кодируются символы в компьютере? Почему именно так, а не иначе?

Всегда ли разные компьютеры «понимают» друг друга? Почему?

Сколько текстов поместится на дискете? А на жестком диске?

Актуализация знаний.

Как в компьютере кодируются символы?

Что такое «компьютерный алфавит»? Какова его мощность?

Чему равен информационный объем одного символа компьютерного алфавита?

Почему иногда текст, состоящий из букв русского алфавита, полученный с другого компьютера, мы видим на своем компьютере в виде "абракадабры"?

Изложение нового материала.

Компьютеры не самого рождения могли обрабатывать символьную информацию. Лишь с конца 60-х годов они стали использоваться для обработки текстов и в настоящее время большинство пользователей ПК занимаются вводом, редактированием и форматированием текстовой информации.

Таблица кодирования ASCII.

А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.

Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и других. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфавите — его мощностью.

Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов. Мы знаем, что один символ такого алфавита несет 8 битов информации: 2 в 8 степени равно 256. 8 битов = 1 байт, следовательно:

Один символ в компьютерном тексте занимает 1 байт памяти.

Как мы выяснили, традиционно для кодирования одного символа используется 8 бит. И, когда люди определились с количеством бит, им осталось договориться о том, каким кодом кодировать тот или иной символ, чтобы не получилось путаницы, т.е. необходимо было выработать стандарт – все коды символов сохранить в специальной таблице кодов. В первые годы развития вычислительной техники таких стандартов не существовало, а сейчас наоборот, их стало очень много, но они противоречивы. Первыми решили эти проблемы в США, в институте стандартизации. Этот институт ввел в действие таблицу кодов ASCII ( American Standard Code for Information Interchange – стандартный код информационного обмена США).

Рассмотрим таблицу кодов ASCII.

Пояснение: раздать учащимся распечатанную таблицу кодов ASCII .

Таблица ASCII разделена на две части. Первая – стандартная – содержит коды от 0 до 127. Вторая – расширенная – содержит символы с кодами от 128 до 255.

Первые 32 кода отданы производителям аппаратных средств и называются они управляющие, т.к. эти коды управляют выводом данных. Им не соответствуют никакие символы.

Коды с 32 по 127 соответствуют символам английского алфавита, знакам препинания, цифрам, арифметическим действиям и некоторым вспомогательным символам.

Коды расширенной части таблицы ASCII отданы под символы национальных алфавитов, символы псевдографики и научные символы.

Стандартная часть таблицы кодов ASCII

hello_html_m4f6250cf.jpg

Если вы внимательно посмотрите на обе части таблицы, то увидите, что все буквы расположены в них по алфавиту, а цифры – по возрастанию. Этот принцип последовательного кодирования позволяет определить код символа, не заглядывая в таблицу.

Коды цифр берутся из этой таблицы только при вводе и выводе и если они используются в тексте. Если же они участвуют в вычислениях, то переводятся в двоичную систему счисления.

Коды национального (русского) алфавита

расширенной части таблицы ASCII

hello_html_m246351cb.jpg

А
льтернативные системы кодирования кириллицы.

Тексты, созданные в одной кодировке, не будут правильно отображаться в другой. В настоящее время для поддержки букв русского алфавита (кириллицы) существует несколько кодовых таблиц (кодировок), которые используются различными операционными системами, что является существенным недостатком и в ряде случаев приводит к проблемам, связанным с операциями декодирования числовых значений символов.

Для разных типов ЭВМ используются различные кодировки:

Одним из первых стандартов кодирования кириллицы на компьютерах был стандарт КОИ-8.

hello_html_m44abf083.jpg

В настоящее время применяется и кодовая таблица, размещенная на странице СР866 стандарта кодирования текстовой информации, которая используется в операционной системе MS DOS или сеансе работы MS DOS для кодирования кириллицы.

hello_html_6d5b3a0d.jpg

Н
ациональная часть кодовой таблицы СР866

В настоящее время для кодирования кириллицы наибольшее распространение получила кодовая таблица, размещенная на странице СР1251 соответствующего стандарта, которая используется в операционных системах семейства Windows фирмы Microsoft.

Национальная часть кодовой таблицы СР1251

hello_html_8c83cad.jpg

Во всех представленных кодовых таблицах, кроме таблицы стандарта Unicode, для кодирования одного символа отводится 8 двоичных разрядов (8 бит).

В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать 2 байта (16 бит).

N = 65536 N – мощность алфавита символов в кодовой таблице Unicode.

i – информационный вес символа

Основополагающая таблица использования кодового пространства Unicode

Единицей измерения количества информации является бит – это наименьшаяединица.

1 Кб (килобайт) = 1024 байта= 2 10 байтов

1 Мб (мегабайт) = 1024 Кб = 2 10 Кб

1 Гб (гигабайт) = 1024 Мб = 2 10 Мб

1 Тб (терабайт) =1024 Гб = 2 10 Гб

Формулы, которые используются при решении типовых задач:

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2 i .

i – информационный вес одного символа.

Основная литература:

  1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.

Дополнительная литература:

  1. Босова Л. Л. Информатика: 7–9 классы. Методическое пособие. // Босова Л. Л., Босова А. Ю., Анатольев А. В., Аквилянов Н.А. – М.: БИНОМ, 2019. – 512 с.
  2. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 1. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  3. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 2. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  4. Гейн А. Г. Информатика: 7 класс. // Гейн А. Г., Юнерман Н. А., Гейн А.А. – М.: Просвещение, 2012. – 198 с.

Теоретический материал для самостоятельного изучения.

Что же такое символ в компьютере? Символом в компьютере является любая буква, цифра, знак препинания, специальный символ и прочее, что можно ввести с помощью клавиатуры. Но компьютер не понимает человеческий язык, он каждый символ кодирует. Вся информация в компьютере представляется в виде нулей и единичек. И вот эти нули и единички называются битом.

Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется один бит.

Алфавит любого понятного нам языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита связана с разрядностью двоичного кода соотношением: N = 2 i .

Эту формулу можно применять для вычисления информационного веса одного символа любого произвольного алфавита.

Рассмотрим пример:

Алфавит древнего племени содержит 16 символов. Определите информационный вес одного символа этого алфавита.

Составим краткую запись условия задачи и решим её:

16 = 2 i , 2 4 = 2 i , т. е. i = 4

Ответ: i = 4 бита.

Информационный вес одного символа этого алфавита составляет 4 бита.

Математически это произведение записывается так: I = К · i.

32 = 2 i , 2 5 = 2 i , т.о. i = 5,

I = 180 · 5 = 900 бит.

Ответ: I = 900 бит.

I = 23 · 8 = 184 бита.

Как и в математике, в информатике тоже есть кратные единицы измерения информации. Так, величина равная восьми битам, называется байтом.

Бит и байт – это мелкие единицы измерения. На практике для измерения информационных объёмов используют более крупные единицы: килобайт, мегабайт, гигабайт и другие.

1 Кб (килобайт) = 1024 байта= 2 10 байтов

1 Мб (мегабайт) = 1024 Кб = 2 10 Кб

1 Гб (гигабайт) = 1024 Мб = 2 10 Мб

1 Тб (терабайт) =1024 Гб = 2 10 Гб

Материал для углубленного изучения темы.

Как текстовая информация выглядит в памяти компьютера.

Набирая текст на клавиатуре, мы видим привычные для нас знаки (цифры, буквы и т.д.). В оперативную память компьютера они попадают только в виде двоичного кода. Двоичный код каждого символа, выглядит восьмизначным числом, например 00111111. Теперь возникает вопрос, какой именно восьмизначный двоичный код поставить в соответствие каждому символу?

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код ‑ просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.Таблица для кодировки – это «шпаргалка», в которой указаны символы алфавита в соответствии порядковому номеру. Для разных типов компьютеров используются различные таблицы кодировки.

Таблица ASCII (или Аски), стала международным стандартом для персональных компьютеров. Она имеет две части.


В этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.

Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:

01100110 01101001 01101100 01100101.

А теперь попробуем решить обратную задачу. Какое слово записано следующим двоичным кодом:

01100100 01101001 01110011 01101011?

В таблице 2 приведен один из вариантов второй половины кодовой таблицы АSСII, который называется альтернативной кодировкой. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования.


Вывод: все тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные для нас буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.

Из памяти же компьютера текст может быть выведен на экран или на печать в символьной форме.

Разбор решения заданий тренировочного модуля

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2 i .

Алфавит — это набор символов, которые используются в некотором языке с целью представления информации.

В качестве символов могут быть использованы буквы, цифры, скобки, специальные знаки.

Мощность алфавита — это количество символов в алфавите, которое вычисляется по формуле:

Например, мощность алфавита, состоящего из \(26\) латинских букв и дополнительных символов (скобки, пробел, знаки препинания (\(11\) шт.), \(10\) цифр), — \(47\).

1. определим, какое количество бит необходимо для кодировки одного символа. Так как мощность используемого алфавита \(N\)\(=\) 256 , то \(i\) \(=\) 8 (использовали формулу N = 2 i ).

Поскольку \(1\) байт \(=\) \(8\) бит, \(1\) Кбайт \(=\) \(1024\) байт, получим:

65536 бит \(=\) 65536 8 байт \(=\) 8192 байт \(=\) 8192 1024 Кбайт \(=\) 8 Кбайт.

Любая компьютерная техника работает в двоичном коде, понимая только значения \(0\) — «сигнал есть» и \(1\) — «сигнала нет». Эти значения хранятся в бите — наименьшей единице измерения информации. Однако удобнее использовать более крупные единицы измерения информации, которые приведены в таблице.

\(1\) байт\(8\) бит \(=\) 2 3 бит
\(1\) Кбайт (килобайт) 2 10 байт
\(1\) Мбайт (мегабайт) 2 10 Кбайт
\(1\) Гбайт (гигабайт) 2 10 Мбайт
\(1\) Тбайт (терабайт) 2 10 Гбайт

1) определить, сколько Мбайт информации содержится в \(512\) битах. Ответ дай в виде степени числа \(2\).

2) Какое количество бит содержится в 1 256 Гбайт памяти? Ответ дай в виде степени числа \(2\).


1) Обучающая: рассмотреть алфавитный подход к измерению количества информации, научиться вычислять количество информации с точки зрения алфавитного подхода.

2) Развивающая: развитие у учащихся самостоятельности и познавательной активности.

3) Воспитывающая: воспитывать дисциплинированность, аккуратность, собранность.

Литература:

1) Угринович Н. Д. «Информатика 8 класс»,

2) Заславская О. Ю., Левченко И. В. «Информатика: весь курс».

1) Угринович Н. Д. «Информатика 8 класс».

Тип урока: ознакомление с новым материалом

План урока:

1. Организационный этап.

2. Актуализация знаний.

3. Подготовка учащихся к усвоению нового материала.

4. Этап получения новых знаний.

5. Этап обобщения и закрепления нового материала.

7. Заключительный этап.

Ход урока

1. Организационный этап.

Здравствуйте. Прежде чем мы приступим к уроку, хотелось бы, чтобы каждый из вас настроился на рабочий лад.

2. Актуализация знаний.

2) Какую минимальную единицу информации используют для измерения количества информации? (Бит)

3) Какую формулу используют для определения количества информации? (Формулу Хартли)

3. Этап получения новых знаний.

Содержательный подход к измерению информации рассматривает информацию с точки зрения человека, как уменьшение неопределенности наших знаний.

Однако любое техническое устройство не воспринимает содержание информации. Поэтому в вычислительной технике используется другой подход к определению количества информации. Он называется алфавитным подходом.

Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.

Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, пропуск между словами.

Алфавит — это множество символов, используемых при записи текста.

Мощность (размер) алфавита — это полное количество символов в алфавите.

Мощность алфавита обозначается буквой N.

· мощность алфавита из русских букв равна 33;

· мощность алфавита из латинских букв — 26;

· мощность алфавита текста набранного с клавиатуры равна 256 (строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания );

· мощность двоичного алфавита равна 2.

При алфавитном подходе считается, что каждый символ текста имеет информационную емкость. Информационная емкость знака зависит от мощности алфавита.

Тогда в формуле

N — количество знаков в алфавите знаковой системы, I — количество информации, которое несет каждый знак.

Например, из формулы можно определить количество информации, которое несет знак в двоичной знаковой системе

Информационная емкость знака двоичной знаковой системы составляет 1 бит.

Задача 1. Определите, какое количество информации несет буква русского алфавита (без буквы ё).

Буква русского алфавита несет 5 битов информации.

Давайте решим с вами задачу.

Задача 2. Какое количество информации содержит слово «ПРИВЕТ», если считать, что алфавит состоит из 32 букв?

Решение. Что нам требуется найти в данной задаче? Нам нужно найти какое количество информации содержит слово «ПРИВЕТ».

Что нам для этого дано?

Что нам нужно найти? Нам нужно найти какое количество информации содержит слово «ПРИВЕТ».

4. Этап обобщения и закрепления нового материала.

1) Какое количество информации содержит слово «ИНФОРМАТИКА», если считать, что алфавит состоит из 32 букв? (55 битов)

2) Определить количество информации, содержащееся в слове из 10 символов, если известно, что мощность алфавита равна 32 символам. (50 бит)

5) Для представления числовых данных используют 16-ричный алфавит, включающий знаки математических действий. Сколько битов информации содержит выражение «32 * 5 = 160»? (32 бита)

Информацию можно представлять в нескольких формах:



Кодирование

Одна и та же информация может быть выражена в разных формах. В таких случаях использую специальные обозначения, называемые кодом.


 | Код — набор символов (условных обозначений) для представления информации.

QR-код и код программы, написанный на языке Python
 | Кодирование — процесс представления информации в виде кода.
Алфавит азбуки Морзе

Измерение количества информации

Память в компьютере разделена на равные части. Одна такая часть называются наименьшей адресуемой ячейкой памяти компьютера. В свою очередь, данная ячейка разделена на 8 разрядов. Один разряд может принимать одно из двух значений: 0 или 1.

И нуль и единица занимают одинаковое количество информации и измеряются в битах.




Такую ячейку ещё называют однобайтовой, так как совокупность из 8 бит образует 1 байт. Каждая следующая единица измерения больше предыдущей на 1024 (210).


Единицы измерения объема информации

Переводы из одной единицы измерения в другую

Для перевода из меньшей величину в большую, необходимо последовательно делить исходное значение на разницу между промежуточными единицами измерения.

Дано 8192 бита. Перевести данное число в килобайты.

1) 8192 бит : 8 = 1024 байт;

2) 1024 байт : 1024 = 1 Кбайт;

Для перевода из большей величину в меньшую, необходимо последовательно умножать исходное значение на разницу между промежуточными единицами измерения.

Дано 2 гигабайта. Перевести данное число в Кбайты.

1) 2 Гбайта * 1024 = 2048 Мбайт;

2) 2048 Мбайт * 1024 = 2 097 152 Кбайт;

Ответ: 2 097 152 Кбайт.

Знаковая система. Язык и алфавит.

В независимости от формы представления информации, она всегда представляется с помощью какого-либо языка.


 | Язык — это сложная знаковая система, созданная естественно или искусственно.

 | Знаковая система — это совокупность знаков алфавита и правил работы с ними.

Все языки можно разделить на группы:

» естественные – сформировались в процессе развития человечества (устный и письменный).


» формальные – созданы специально для определённых целей (язык математики, физики, химии и т.д.).


Количество всех символов латинского языка, является мощностью этого алфавита (N).


N – мощность алфавита;

i – вес одного символа.

Алфавитный подход к измерению информации



i – вес одного символа.

Очевидно, что формулы N=2i и I=K*i взаимовыражаемы.


Литература:
1. Информатика: учебник для 7 класса / Л.Л. Босова, А.Ю. Босова. - М.: БИНОМ.Лаборатория знаний, 2014. - 224 с.
2. Информатика. 7 класса / К.Ю. Поляков, Е.А. Еремин. - М.: БИНОМ.Лаборатория знаний, 2017. - 228 с.

К уроку:


ПРЕЗЕНТАЦИЯ

Единицы измерения информации

1. Выполните перевод в биты:

а) 8 байт  г) 32 Кбайта  ж) 0,1 Гбайта
б) 12 байт  д) 1 Мбайт  з) 0,25 Гбайта
в) 20 Кбайт  е) 0,3 Мбайта  и) 0,01 Пбайта

2. Выполните перевод в байты:

а) 16 бит  г) 11 Кбайт  ж) 1 Гбайт
б) 20 бит  д) 1,5 Мбайт  з) 0,6 Гбайта
в) 0,5 Кбайт  е) 0,2 Мбайта  и) 0,02 Пбайта

3. Выполните перевод в килобайты:

а) 4096 бит  г) 204800 байт  ж) 2 Гбайта
б) 368640 бит  д) 3 Мбайта  з) 3,5 Гбайта
в) 12288 байт  е) 2,5 Мбайта  и) 0,03 Пбайта

4. Установите соответствие:



5. Заполните таблицу, определив недостающие величины (ответ округлить до сотых):



Алфавитный подход к измерению информации

6. В алфавите некоторой страны всего 16 символов. Найдите вес одного символа этого алфавита.

7. Алфавит русской азбуки Морзе состоит из 32 символов. Определите вес каждого символа русской «Морзянки».

8. После объединения северного и южного племени было решено объединить их алфавиты. Алфавит северян содержал 23 символа. Южане использовали в своём алфавите 41 символ. Подсчитайте вес одного символа нового алфавита, объединяющего символы северян и южан.

9. Двое друзей решила придумать свой собственный тайный язык. На листе бумаги они выписали все символы алфавита этого языка. В конечном итоге ребята придумали 128 символов. Определите вес одного символа в этом алфавите.

10. Один символ некоторого алфавита занимает 6 бит информации. Определите из скольких символов состоит этот алфавит?

11. Пользователь напечатал текст каждая буква которого весит около 5 бит. Подсчитайте количество символов в используемом алфавите.

12. В памяти телефона на хранение одного смайлика отводится 1,5 байта информации. Определите количество неодинаковых смайликов, которое можно поместить в библиотеку данного телефона.

13. Научный сотрудник лингвистического университета работает с текстом, написанном на неизвестном языке. Он подсчитал, что этот текст содержит 4080 знаков. Проанализировав данный текст и выписав все уникальные знаки, он определил, что количество символов в алфавите этого языка составляет 64 символа. Найдите объём этого текста.

15. Известно, что в книге, состоящей из 126 страниц на каждой странице содержится 50 строк, а в каждой строке 74 символа. Определите информационный объём книги, если вес одного символа равен 6 бит. Ответ запишите в байтах.

Читайте также: