Как кодируются знаки для компьютера технология 6 класс

Обновлено: 06.07.2024

Кодирование текстовой информации — очень распространенное явление. Один и тот же текст может быть закодирован в нескольких форматах. Принято считать, что кодирование текстовой информации появилось с приходом компьютеров. Это и так и не так одновременно. Кодировка в том виде, в котором мы ее знаем, действительно к нам пришла с приходом компьютеров. Но над самим процессом кодирования люди бьются уже много сотен лет. Ведь, по большому счету, сама письменность уже является способом закодировать человеческую речь, для ее дальнейшего использования. Вот и получается, что любая окружающая нас информация никогда не бывает представленной в чистом виде, потому что она уже каким-то образом закодирована. Но сейчас не об этом.

Кодирование текстовой информации

Самый распространенный способ кодирования текстовой информации — это ее двоичное представление, которое сплошь и рядом используется в каждом компьютере, роботе, станке и т. д. Все кодируется в виде слов в двоичном представлении.

Сама технология двоичного представления информации зародилась еще задолго до появления первых компьютеров. Среди первых устройств, которые использовали двоичный метод кодирования, был аппарат Бодо — телеграфный аппарат, который кодировал информацию в 5 битах в двоичном представлении. Суть кодировки заключалась в простой последовательности электрических импульсов:

0 — импульс отсутствует;
1 — импульс присутствует.

В компьютерный мир такая кодировка пришла вместе с персонализацией самих компьютеров. То есть в первых компьютерах не было такой кодировки. Но как только компьютеры стали уходить «в массы», то резко обнаружилась потребность обрабатывать компьютерами большое количество именно текстовой информации, которую нужно было как-то кодировать. Тенденция обрабатывать большое количество текстовой информации сохранилась и в современных устройствах.

Так получилось, что двоичное кодирование в компьютерах связано только с двумя символами «0» и «1», которые выстраиваются в определенной логической последовательности. А сам язык подобной кодировки стал называться машинным.

Кодирование текстовой информации и компьютеры

Если смотреть на текст глазами компьютера, то в тексте нет предложений, абзацев, заголовков и т. д., потому что весь текст просто состоит из отдельных символов. Причем символами будут являться не только буквы, но и цифры, и любые другие специальные знаки (+, -,*,= и т. д.). Что самое интересное, даже пробелы, перенос строки и табуляция — для компьютера это тоже отдельные символы.

Для справки. Есть уникальный язык программирования, который в качестве своих операторов использует только пробелы, табуляции и переносы строки. Практического применения этот язык не имеет, но он есть.

Кодирование текстовой информации в компьютерных устройствах сводится к тому, что каждому отдельному символу присваивается уникальное десятичное значение от 0 и до 255 или его эквивалент в двоичной форме от 00000000 и до 11111111. Люди могут различать символы по их внешнему виду, а компьютерное устройство только по их уникальному коду.

Рассмотрите, как происходит процесс. Мы нажимаем нужный нам символ на клавиатуре, ориентируясь на их внешний вид. В оперативную память компьютера он попадает в двоичном представлении, а когда компьютер его выводит нам на экран, то происходит процесс декодирования, чтобы мы увидели знакомый нам символ.

Кодирование текстовой информации и таблицы кодировок

Таблица кодировки — это место, где прописано какому символу какой код относится. Все таблицы кодировки являются согласованными — это нужно, чтобы не возникало путаницы между документами, закодированными по одной таблице, но на разных устройствах.

На сегодняшний день существует множество таблиц кодировок. Из-за этого часто возникают проблемы с переносом текстовых документов между устройствами. Так получается, что если текстовая информация была закодирована по одной какой-то таблице, то и раскодирована она может быть только по этой таблице. Если попытаться раскодировать другой таблицей, то в результате получим только набор непонятных символов, но никак не читабельный текст.

Информация – это сведения об объектах и явлениях окружающей среды, их свойствах и состоянии, количественных и качественных проявлениях, которые воспринимают живые организмы, технические устройства или другие приёмники сведений в процессе их приспособления к условиям окружающей среды, жизни, деятельности или работы.

Кодирование – процесс представления сведений в какой-либо материальной форме.

Дегустатор – (лат. degusto – чувствовать вкус) – специалист, изучающий продукты питания и напитки.

Сигнал – информация, представленная в форме, удобной для её передачи, обработки, хранения и использования.

Знак – материальное отображение сигнала.

Основная и дополнительная литература по теме урока

Технология. 5 класс: учеб. пособие для общеобразовательных организаций / В. М. Казакевич, Г. В. Пичугина, Г. Ю. Семенова и др.; под ред. В. М. Казакевича. – М.: Просвещение, 2017.

Теоретический материал для самостоятельного изучения

Информация преобразуется органами чувств живых организмов или анализаторами технических устройств в электрические или химические отпечатки. Каждый такой отпечаток соответствует определённому объекту, явлению или каким – то их элементам. Отпечатки отправляются на хранение в запоминающие органы или устройства: в мозг или клетки живого организма, в электронную или магнитную память технического устройства. При повторном получении информации происходит её «узнавание». Это позволяет лучше и быстрее приспосабливаться к условиям окружающей среды.

В информационных технологиях важно не только получать и усваивать информацию, но и передавать её другим, отправитель информации должен представить её в какой – либо материальной форме, доступной для восприятия. Для живых организмов материальная форма информации должна соответствовать имеющимся у них каналам восприятия информации. Соответственно для людей и многих животных – это зрение, слух, вкус, обоняние и осязание. Информация должна быть представлена наглядно, с помощью звука, запаха, химических веществ для восприятия их на вкус, механическим воздействием, температурой.

Хорошо развитые чувства вкуса и обоняния могут понадобиться при выборе профессии. Одной из таких профессий является профессия дегустатора. Дегустатор должен от природы различать тончайшие нюансы вкуса и запаха. Но он должен ориентироваться также на зрение, слух, а иногда и на осязание. Например, оценивая чайные листья, он внюхивается в них, оценивает их на ощупь, прислушивается к шороху. Затем он присматривается к цвету настоя и лишь после этого пробует его на вкус. Одну и ту же информацию можно передать её получателю разными способами. Процесс представления сведений в какой-либо материальной форме называется кодированием.

Нужно учитывать, что закодированная информация всегда имеет определённую форму выражения или представления. Поэтому кодированием можно назвать переход от одной формы представления информации к другой, более удобной для передачи, обработки и хранения. При кодировании информации она представляется в виде совокупности или последовательности сигналов.

Сигналом называют информацию, представленную в форме, удобной для её передачи, хранения и использования. По существу, сигнал – это несущий информацию условный знак, принятый для передачи или записи каких-либо сведений. Условным он называется потому, что отправитель и получатель информации договорились, что они будут понимать под тем или иным сигналом. Например, сигналами при общении людей являются сказанные или написанные с помощью букв слова, определённые позы тела и рук, мимика (выражение лица), тембр и громкость голоса, их сочетания. Сигналы отображаются соответствующими знаками. Так, в языках большинства народов – это слова, выраженные буквенными знаками. Буквы или их сочетания соответствуют звукам при произнесении слов. Однако есть языки, в которых одним знаком может обозначаться целое слово или даже несколько слов. Такие знаки называют иероглифами. Они используются для представления информации народами Китая, Японии и некоторых других стран. Слова можно выражать не только буквами в привычном начертании, но и буквами в виде точек и тире, в виде положения рук.

Для букв и слов можно придумать и другие знаки, которые будут понятны только очень узкому кругу людей. Такое кодирование информации называется шифрованием. Некоторые знаки используют для представления информации о количестве чего-либо. Такими знаками являются цифры. Привычные нам по начертанию цифры были заимствованы европейцами у арабов. Поэтому они до сих пор называются арабскими цифрами. Первоначально каждая арабская цифра при изображении состояла из такого количества углов, которое соответствовало её количественному значению. Привычные скруглённые формы цифр образовались позже для быстроты и удобства их написания. Однако и сейчас на конвертах пишут почтовые индексы цифрами с углами для считывания информации компьютерами. Римские цифры, появившиеся две с половиной тысячи лет назад имеют особое начертание. Обозначение некоторых чисел состоит из нескольких римских цифр. При этом если меньшая римская цифра стоит слева от большей, то она вычитается из большей, если же меньшая цифра стоит справа от большей, то она прибавляется к ней. Для обозначения арифметических и алгебраических действий с числами также придуманы условные знаки. Например, сложение обозначается знаком плюс, вычитание знаком минус.

Для общения с компьютерами нужна другая система кодирования информации. Для компьютера информацию надо составлять из последовательности отдельных сигналов и пропусков между ними. Подача сигнала в записи на бумаге обозначается единицей, отсутствие сигнала – нулём.

Среди знаков, представляющих информационные сигналы, выделяют специальные условные знаки, называемые символами. Символ – это условный знак, который не просто отображает фрагмент информации о чём-либо. Это целый информационный фрагмент, подобный картине художника. Он раскрывает смысл и главную идею какого-либо понятия, объекта, явления или события. В смысле как специальном знаке бывает изображён какой-либо предмет, человек либо животное или растение. Например, символом веры для православных христиан является крест, для мусульман – полумесяц, для иудеев – звезда Давида, для буддистов – дхармчакра, или «колесо закона».

Символы широко применяются в информационной практике современных людей. В любой стране символом власти и управления является понятие «государство». Каждая страна имеет свой государственный символ – герб. Символом правосудия является древнегреческая богиня Фемида с весами и мечом. Свои символы имеют различные фирмы. Например, символом Камского автомобильного завода стал степной аргамак – распространённая в степях Татарстана лошадь, символом компании Apple – надкусанное яблоко. Специальные символы используют и в повседневной жизни. Например, всем понятно, что символ «череп и кости» означает опасность для жизни, а символ «пламя» – опасность возгорания или пожара.

Символы могут играть важную моральную и даже политическую роль. Примером этому служат Вечный огонь у монументов погибшим героям как символ памяти об их подвиге, георгиевская лента как символ беззаветного героического служения Родине, пять олимпийских колец как символ мирных соревнований людей пяти континентов, а не войны между ними.

Примеры и разбор решения заданий тренировочного модуля

Задание 1. Найди лишнее.

Правильный ответ:

Пояснение: Элемент, относящийся к другому органу чувств.

Задание 2. Решите кроссворд.

3. Сведения об окружающем его мире. 6. Безошибочное отражение текущего положения дел. Со временем информация может утратить это свойство. 9. Соответствие нуждам человека в конкретный временной отрезок. 10. Запрет на несанкционированную работу с информацией.

По вертикали:

1. С помощью какого органа чувств здоровый человек получает больше всего информации? 2. Устройство, помогающее человеку хранить, передавать и обрабатывать информацию. 4. Независимость от чего-либо суждения, оценки. 5. Исчерпывающие характеристики предмета или явления. 7. Информация, которую человек получает с помощью языка. 8. Информация, воспринимаемая человеком с помощью кожи.

Презентация на тему: " Кодирование текстовой информации в компьютере 6 класс (базовый уровень)" — Транскрипт:

1 Кодирование текстовой информации в компьютере 6 класс (базовый уровень)

2 2008 г. © Bolgova N.A. 2 Двоичный код 1. Двоичный код Вся информация, которою обработает компьютер, должна быть представлена двоичным кодом с помощью двух цифр – 0 и 1. Эти два символа 0 и 1 принято называть битами (от англ. binary digit – двоичный знак).

3 2008 г. © Bolgova N.A Кодирование и декодирование Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код. Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

4 2008 г. © Bolgova N.A. 4 Двоичное кодирование текстовой информации Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации. и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

5 2008 г. © Bolgova N.A Двоичное кодирование текстовой информации Для кодирования одного символа требуется последовательность из 8 единиц и нулей -байт информации. Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов 2*2*2*2*2*2*2=256

6 2008 г. © Bolgova N.A. 6 Кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от до (или десятичный код от 0 до 255). Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.

7 2008 г. © Bolgova N.A Таблица кодировки Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется. Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

8 2008 г. © Bolgova N.A. 8 Кодовая таблица ASCII

9 2008 г. © Bolgova N.A функциональные клавиши 32 – пробел –специальные символы и знаки препинания цифры математические символы и знаки заглавные A- Z(латинские буквы) 91-96, специальные символы строчные a-z (латинские буквы)

С помощью дополнительной цифровой клавиатуры при нажатой клавише ввести число 0224, отпустить клавишу , в документе появится символ «а». Повторить процедуру для числовых кодов от 0225 до 0233, в документе появится последовательность из 12 символов «абвгдежзий» в кодировке Windows.

С помощью дополнительной цифровой клавиатуры при нажатой клавише ввести число 224, в документе появится символ «р». Повторить процедуру для числовых кодов от 225 до 233, в документе появится последовательность из 12 символов «рстуфхцчшщ» в кодировке MS-DOS.

Таблица кодировки символов.

Символы с кодами от 0 до 127.

Символы с кодами от 128 до 255.

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами. Да, не удивляйтесь: пустое место в тексте тоже должно иметь свое обозначение.

Множество символов, с помощью которых записывается текст, называется алфавитом .

Число символов в алфавите – это его мощность .

Формула определения количества информации: N = 2 b ,

где N – мощность алфавита (количество символов),

b – количество бит (информационный вес символа).

В алфавит мощностью 256 символов можно поместить практически все необходимые символы. Такой алфавит называется достаточным.

Т.к. 256 = 2 8 , то вес 1 символа – 8 бит.

Единице измерения 8 бит присвоили название 1 байт:

Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Каким же образом текстовая информация представлена в памяти компьютера?

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.

Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.

Понятно, что это дело условное, можно придумать множество способов кодировки.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.

Для букв русского алфавита также соблюдается принцип последовательного кодирования.

От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 ("CP" означает "Code Page", "кодовая страница").

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251.

С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode . Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

№ слайда 1

Кодирование текстовой информации

№ слайда 2

Текст на внешних носителях сохраняется в виде файла. Преимущества компьютерного документа:Компактное размещениеЛегко удалитьЛегко размножитьМожно быстро переслать на большое расстояние Недостаток:Прочитать файл можно только с помощью компьютера

№ слайда 3

Любая информация кодируется в компьютере с помощью последовательностей двух цифр - 0 и 1. Он хранит и обрабатывает информацию в виде комбинации электрических сигналов: напряжение 0.4В-0.6В соответствует логическому нулю, напряжение 2.4В-2.7В - логической единице. Последовательности из 0 и 1 называются двоичными кодами, а цифры 0 и 1 - двоичными разрядами (битами) . Такое кодирование информации на компьютере называется двоичным кодированием.

№ слайда 4

Обработкой текстовой информации на компьютере начали заниматься с 60 – х годов 20 века. Первоначально в ЭВМ использовался лишь латинский алфавит (26 букв). Для обозначения каждого символа хватило бы пяти разрядов (битов). Но в тексте есть знаки препинания, десятичные цифры и др. Поэтому в первых англоязычных компьютерах байт - машинный слог - включал шесть битов. Затем семь - не только для того, чтобы отличать большие буквы от малых, но и для увеличения числа кодов управления принтерами, сигнальными лампочками и прочим оборудованием.

№ слайда 5

В 1964 году появились мощные ЭВМ IBM-360, в которых окончательно байт стал равен восьми битам, так как для представления текстовой информации в компьютере начал использоваться алфавит мощностью 256 символов.

№ слайда 6

Международная кодировка ASCII

№ слайда 7

№ слайда 8

Читайте также: