В какой последовательности происходит запись информации на компьютер ввод символьной информации

Обновлено: 06.07.2024

Для представления символьной информации каждому символу ставится в соответствие собственный уникальный десятичный код, который в двоичном виде хранится в ячейке памяти. Совокупность символов и их кодовых обозначений образуют кодовую таблицу.

Для персональных компьютеров основой кодирования символьной информации является кодовая таблица ASCII (American standard code for information interchange, Американский стандартный код для информационных обменов, табл. 3.2). В этой таблице для значения кода используется 8 бит, что позволяет определить 2 8 = 256 символов с кодами 0. 255.

Коды с 0 по 127 составляют стандартную неизменяемую часть таблицы; коды с 128 по 255 — национальную (расширенную) часть таблицы.

Первые 32 (0. 31) кода управляющие, т.е. если генерировать один из них, то будет выполнена соответствующая команда. Именно поэтому рядом с данными кодами в таблице присутствуют не символы, а мнемонические имена команд, например:

  • - NUL: нуль — признак, показывающий, что значение не задано;
  • - FF: прогон страницы;
  • - CR: возврат каретки или перевод строки — выполняет перемещение курсора в начало следующей строки экрана (соответствует клавише Enter).

Фрагмент, кодовой таблицы ASCII

Коды с 33 но 127 соответствуют буквам латинского алфавита (прописным и строчным), цифрам, знакам препинания, скобкам и некоторым другим символам.

Национальную часть кодовой таблицы часто называют расширением основной. Иными словами, коды и символы, содержащиеся в этой таблице, в полном смысле слова стандартом не являются. Расширение основной таблицы ASCII обычно составляют символы псевдографики, буквы национальных алфавитов и иные символы.

Для русскоязычных пользователей подходит расширение таблицы ASCII, известное как кодовая таблица 866, т.е. в национальных кодировках одному и тому же коду соответствуют разные символы. Этих 128 кодов недостаточно для представления всех символов национальных алфавитов (хотя бы европейских), в связи с чем было разработано множество вариантов кодировки (кодовых таблиц). Так, да я отображения на компьютере символов русского алфавита используются стандартные кодировки КОИ8 (код обмена информацией восьмизначный), Windows-1251. Существование нескольких кодовых таблиц порождает задачу межсистемного преобразования данных.

При нажатии клавиши на клавиатуре символ в двоичном виде (набор из восьми нулей и единиц) будет храниться в памяти компьютера, а на экране дисплея будет отображен соответствующий символ. При этом необходимо понимать, что символ «5» хранится как код 00110101, а число 5 как код 00000101. Для хранения символа «55» требуется 16 бит 0011010100110101, а для числа 55 требуется 8 бит 00110111. При выводе символа на экран или принтер программно-аппаратные средства вывода выполняют обратную перекодировку из цифровой формы в символьную по тем же правилам.

В настоящее время внедряется стандарт Unicode, предполагающего возможность кодирования всех возможных символов в рамках единой кодовой таблицы UCS (Universal Character Set). Изначально в UCS для кодирования символа использовалось 16 бит, что давало 2 16 = 65 536 кодовых позиций. Этого количества вполне хватало для всех постоянно используемых символов (букв всех современных алфавитов, пиктограмм, знаков валют и пр.), но оказалось недостаточно для кодирования малоупотребительных символов (например, идеограмм восточных языков, знаков неиспользуемых письменностей и т.д.) Поэтому UCS расширили, стандартизировав использование 31 бит для кодирования символа, что в теории давало примерно 2,1 млрд кодовых позиций. Число 31 появилось из-за разумного решения разработчиков UCS, что для кодирования не должны быть использованы отрицательные числа, поэтому знаковый бит в 32-разрядной сетке кода можно не учитывать. Впрочем, этого количества хватает с лихвой: на момент написания этой книги в версии Unicode 7.0 содержится «всего» 113 021 символ.

Наличие UCS, однако, не решило проблемы межсистемного преобразования данных: старое программное обеспечение нс поддерживало новый способ кодирования, но техническим причинам хранить кодовую таблицу из 2,1 млрд символов не представлялось возможным и нр. В результате был разработан стандарт, позволяющий представлять символы стандарта Unicode в виде последовательности 16 бит (или двух последовательностей по 16 бит) — UTF-16 (Unicode Transformation Format, формат преобразования из Unicode). Специальные методы кодирования позволили, используя 16 бит, кодировать 1 112 064 позиций, причем сохраняя совместимость со старыми программными продуктами. В настоящее время UTF-16 стал основным стандартом кодирования текстовой информации для ОС семейства Windows.

Первые 65 536 кодов Unicode обозначаются как U—ХХХХ, где X теричная цифра. Например, кириллическому символу «П» соответствует обозначение U+041F. Просмотреть часть кодовой таблицы, изображаемой некоторым шрифтом, в ОС семейства Windows можно, используя инструмент «Таблица символов» (рис. 3.9). Его использование может быть полезно, например, когда требуется ввести символ, который напрямую нс вводится с клавиатуры.

Инструмент «Таблица символов»

Рис. 3.9. Инструмент «Таблица символов»

Кроме указанного инструмента, есть еще два способа ввода символов Unicode (не все программы для ОС семейства Windows их поддерживают):

  • - набрать шестнадцатеричный код ХХХХ, выделить его и нажать сочетание клавиш ;
  • - зажать левый Alt, набрать на дополнительной цифровой клавиатуре десятичный код символа, после чего отпустить Alt. Например, для набора кириллической буквы «П» таким десятичным кодом будет 1055, так как 41Fi6 = 1055м.

В табл. 3.3 приведены некоторые символы Unicode, которые могут быть полезны при наборе текстов, связанных с экономической тематикой. Несоответствие шестнадцатеричных и двоичных кодов (например, для знака евро) объясняется тем, что часть символов Unicode дублируются. При этом набирать символы можно по любому десяНекоторые символы Unicode

Примером текстовой информации может служить параграф школьного учебника, детская считалка, ремарка актера в пьесе, расписание уроков, магазинный чек и т.д.

Издавна люди пытались сохранить различного рода сведения на таких носителях, как камень, глина, береста, папирус, на смену которым пришла повсеместно используемая бумага.

Письменный текст записывали различными инструментами – острой костяной палочкой, перьевыми ручками, авторучками и с позапрошлого века стали печатать на пишущих машинках.

Чтобы зафиксировать большой объем информации или изменить смысл предложений, необходимо было проделывать огромную работу, трудоемкую и длительную. С помощью компьютера текстовую информацию можно с легкостью не только вводить, но и редактировать, сохранять, передавать и печатать любое количество копий на принтере. Компьютерные программы коренным образом изменили технологию письма . В современном мире все чаще бумажные документы заменяются электронными.

Причиной перехода к безбумажным технологиям во многих сферах деятельности человека является увеличение скорости и качества обработки информации, уменьшение себестоимости электронных носителей при росте цен на бумагу вследствие мирового экологического кризиса.

Представление текстовой информации в компьютере –это преобразование вводимых символов с помощью кодовой таблицы. Современная универсальная таблица кодировки Unicode позволяет охватить более 65 тысяч символов различных алфавитов, цифры, знаки препинания, математические и другие символы.

Фрагмент кодовой таблицы Unicode

Для каждого знака в памяти компьютера выделяется 2 байта или 16 бит двоичного кода. Таким образом, можно вычислить объем текстовой информации, легко перемножив количество символов (включая пробелы) на информационный вес одного символа. Для выражения крупных объемов информации используются такие единицы измерения, как килобайты, мегабайты и гигабайты.

Единицы измерения информации

Различают следующие виды текстовой информации:

  • фактуальная (отражает события, описание людей, мест действия, времени и т.д.);
  • концептуальная (открывает замысел автора, его позицию, точку зрения);
  • подтекстовая (дополнительная информация, позволяющая полнее раскрыть предыдущие виды информации).

Большинство текстов имеют сложную структуру, подразумевающую сочетание различных типов сведений: когнитивных, оперативных, эмоциональных и эстетических. Каждый из видов информации в тексте характеризуется своими особыми способами языкового выражения.

Текстовые документы

В целях упрощения работы с письменной информацией создали специальное программное обеспечение – текстовые редакторы (процессоры). Каждый текст, написанный в нем, будет называться текстовым документом. Это может быть и научная статья с формулами, и рассказ, и рекламное объявление.

Компьютерный текстовый документ как структура данных, реализованная с помощью гиперссылок, называется гипертекстом . Такой метод организации электронного документа позволяет в кратчайшие сроки переходить к необходимым сведениям и устанавливать связи между различными фрагментами текста.

Основные объекты текстового документа

Различают следующие основные структурные единицы текстового документа:

  • символ – самый маленький элемент текста;
  • слово – буквенный или цифровой ряд, ограниченный пробелами или символами препинания;
  • абзац – набор письменных элементов, начинающийся с красной строки;
  • строка – ряд символов внутри абзаца, который расположен в пределах одной горизонтальной линии между границами полей документа;
  • фрагмент – произвольная непрерывная часть текста (может быть какодно слово, строчка, абзац, так и весь документ).

Компьютер – основной инструмент работы с текстом

В современном мире компьютер – уникальное устройство, в том числе и для работы с текстовой информацией. Элементарные программы для текстовых документов имеют возможность создания текстов, составленных из символов, печатаемых с клавиатуры, и небольшой комплект инструментов для оформления информации. Для подготовки наиболее сложных текстов с графиками, табличным представлением данных, надписями, схемами, картинками и фотографиями целесообразно использование сильных текстовых процессоров.

Среди множества программ, предназначенных для работы с текстовой информацией, выделяют следующие:

  1. Foxit Reader – бесплатная программа для открытия текстовых документов в формате PDF. Кроме просмотра, она имеет возможность редактировать и отправлять текст на печать.
  1. Libre Office Writer– свободное офисное приложение. Прямой аналог Open Office Writer.Текстовый документа, напечатанный в этой программе, будет иметь формат ODF.
  1. Adobe Reader – удобная программа для работы текстовыми документами в формате PDF, используемого для создания текстовой информации высокого качества.
  1. Open Office Writer– бесплатное программное обеспечение, полная альтернатива приложению Microsoft Office Word. Поддерживает многие форматы. Из минусов данного приложения – отсутствует автоматическая проверка грамматики.
  1. Word Pad – стандартная программа операционной системы Microsoft Windows, обладающая ограниченными функциональными возможностями.
  1. В большинстве случаев для создания текстового документа используют программу Microsoft Word, имеющую богатый арсенал инструментов для обработки текстовой информацией. Позволяет создавать документы различной сложности.

Основные стадии подготовки электронного текстового документа:

  1. Ввод (набор символов).
  2. Редактирование.
  3. Форматирование.
  4. Печать.

Ввод текста

К устройствам ввода текстовой информации относится графический планшет, сканер, сенсорный экран и самое распространённое - клавиатура. Она позволяет вводить числа, буквы, различные знаки и управлять действиями компьютера служебными клавишами.

При вводе текстовой информации следует придерживаться несложных правил:

  1. Любой символ препинания, кроме тире, печатается сразу же после буквы. Затем нужно поставить пробел, нажав соответствующую клавишу. Исключение составляет « – », которое выделяется пробелом с 2 сторон.
  2. Для выравнивания текста по центру, по ширине, по левому или правому краю, недопустимо печатание нескольких пробелов или использование клавиши Tab. Это действие выполняет специальная кнопка в текстовом редакторе.
  3. Между словами должен быть исключительно один пробел. Легко отследить это поможет включение режима отображения непечатаемых символов.
  1. Каждый абзац начинается после нажатия на клавишу Enter с новой строки.
  2. Отступ для абзаца создается нажатием на Tab.

Редактирование текста

Редактирование текста представляет собой процедуру внесения необходимых правок. Этот этап подготовки документа требует внимания и усидчивости.

В процессе редактирования текста изменяется содержание текста. В результате работы текст должен стать грамотным и понятным.

Основными функциями редактирования текста являются:

  • выделение текстового отрывка;
  • удаление, копирование, перемещение и вставка необходимых фрагментов текста;
  • корректировка документа, включающая в себя подстановку вместо повторяющихся слов синонимов, устранение грамматических, пунктуационных, орфографических и стилистических ошибок.

Редактирование текста осуществляется перемещением курсора в необходимое место с помощью мыши либо нажатием служебных клавиш (их комбинации).

Основные сочетания клавиш

Работать можно как с отдельными знаками, строками, абзацами,так и со всем текстом. Прежде всего нужный фрагмент следует выделить. Для этого нужно установить курсорную стрелку в начало элемента и, зажимая левую кнопку мышки, провести до его окончания.

Далее можно его скопировать, вырезать, удалить соответствующими кнопками или сочетаниями клавиш.

Microsoft Word – самая популярная программа для редактирования текста. Она обладает богатыми возможностями и удобным интерфейсом. Основные средства для редактирования текста в Word:

  1. Режим вставки и замены символов (в первом режиме при печатании знаки вставляются между уже имеющимися, а при втором – очередные символы заменяют ранее напечатанные при вводе) Файл→Параметры→Дополнительно
  1. Режим Тезауруса (используется для автоматической замены выделенных слов синонимами)
  1. Автоматическая проверка правописания (проверка орфографии и грамматики)
  1. Средства рецензирования (позволяет создавать примечания, исправления и другие операции, не изменяя исходный текст) вкладка Рецензирование

Форматирование текста

Следующий этап обработки текста заключается в его форматировании. Форматирование текста подразумевает изменение внешнего вида документа. Информация подвергается оформлению по необходимым критериям.

Форматирование текста представляет собой:

  • выбор параметров страницы;
  • форматирование символов;
  • форматирование абзацев;
  • создание списков.

Вначале выбирается альбомная или книжная ориентация страницы (Разметка страницы → Ориентация).

Также в этой вкладке можно устанавливать различные параметры страницы (поля, размер, колонки и т.д.)

Нумерация страницы производится нажатием на кнопку Вставка → Номер страницы.

В процессе форматирования текста изменяется размер, начертание и цвет шрифта на Главной вкладке.

Оформление абзацев состоит в выравнивании текста относительно границ страницы (по левому или правому краю, центру или ширине).

Применение номерованных или маркированных списков позволит облегчить восприятие текстовой информации.

Подготовка документа заканчивается его распечатыванием. Для этой цели используют принтеры (устройства, переводящие электронную информацию на бумажный носитель) разного типа:

Представление изображений.


Все известные форматы представления изображений (как неподвижных, так и движущихся) можно разделить на растровые и векторные. В векторном формате изображение разделяется на примитивы - прямые линии, многоугольники, окружности и сегменты окружностей, параметрические кривые, залитые определенным цветом или шаблоном, связные области, набранные определенным шрифтом отрывки текста и т. д. (см. рис.). Для пересекающихся примитивов задается порядок, в котором один из них перекрывает другой. Некоторые форматы, например, PostScript, позволяют задавать собственные примитивы, аналогично тому, как в языках программирования можно описывать подпрограммы. Такие форматы часто имеют переменные и условные операторы и представляют собой полнофункциональный (хотя и специализированный) язык программирования.


Рис. Двухмерное векторное изображение

Каждый примитив описывается своими геометрическими координатами. Точность описания в разных форматах различна, нередко используются числа с плавающей точкой двойной точности или с фиксированной точкой и точностью до 16-го двоичного знака.
Координаты примитивов бывают как двух-, так и трехмерными. Для трехмерных изображений, естественно, набор примитивов расширяется, в него включаются и различные поверхности - сферы, эллипсоиды и их сегменты, параметрические многообразия и др. (см. рис.).


Рис. Трехмерное векторное изображение


Рис. Растровое изображение

Наиболее широко используемые цветовые модели - это RGB (Red, Green, Blue - красный, зеленый, синий, соответствующие максимумам частотной характеристики светочувствительных пигментов человеческого глаза), CMY (Cyan, Magenta, Yellow - голубой, пурпурный, желтый, дополнительные к RGB) и CMYG - те же цвета, но с добавлением градаций серого. Цветовая модель RGB используется в цветных кинескопах и видеоадаптерах, CMYG - в цветной полиграфии.
В различных графических форматах используется разный способ хранения пикселов. Два основных подхода - хранить числа, соответствующие пикселам, одно за другим, или разбивать изображение на битовые плоскости - сначала хранятся младшие биты всех пикселов, потом - вторые и так далее. Обычно растровое изображение снабжается заголовком, в котором указано его разрешение, глубина пиксела и, нередко, используемая цветовая модель.

Представление звуковой информации.

  1. Метод FM (Frequency Modulation) основан та том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, а, следовательно, может быть описан числовыми параметрами, т.е. кодом. В природе звуковые сигналы имеют непрерывный спектр, т.е. являются аналоговыми. Их разложение в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальный устройства - аналогово-цифровые преобразователи (АЦП). Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). При таких преобразованиях неизбежны потери информации, связанные с методом кодирования, поэтому качество звукозаписи обычно получается не вполне удовлетворительным и соответствует качеству звучания простейших электромузыкальных инструментов с окрасом характерным для электронной музыки. В то же время данный метод копирования обеспечивает весьма компактный код, поэтому он нашёл применение ещё в те годы, когда ресурсы средств вычислительной техники были явно недостаточны.
  2. Метод таблично волнового (Wave-Table) синтеза лучше соответствует современному уровню развития техники. В заранее подготовленных таблицах хранятся образцы звуков для множества различных музыкальных инструментах. В технике такие образцы называют сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звучания. Поскольку в качестве образцов исполняются реальные звуки, то его качество получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.
  • цифровая запись, когда реальные звуковые волны преобразуются в цифровую информацию путем измерения звука тысячи раз в секунду;
  • MIDI-запись, которая, вообще говоря, является не реальным звуком, а записью определенных команд-указаний (какие клавиши надо нажимать, например, на синтезаторе). MIDI-запись является электронным эквивалентом записи игры на фортепиано.

Таким образом, рассмотрев принципы хранения в ЭВМ различных видов информации, можно сделать важный вывод о том, что все они так или иначе преобразуются в числовую форму и кодируются набором нулей и единиц. Благодаря такой универсальности представления данных, если из памяти наудачу извлечь содержимое какой-нибудь ячейки, то принципиально невозможно определить, какая именно информация там закодирована: текст, число или картинка.

Представление видео.


В последнее время компьютер все чаще используется для работы с видеоинформацией. Простейшей, с позволения сказать, работой является просмотр кинофильмов и видеоклипов, а также (куда компьютерным пользователям без них!) многочисленные видеоигры. Более правомерно данным термином называть создание и редактирование такой информации с помощью компьютера.
Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные. В любительской киносъемке использовалась частота 16 кадров/сек., в профессиональной - 24.
Традиционный кадр на кинопленке "докомпьютерной" эпохи выглядел так, как показано на рис.1. Основную его часть, разумеется, занимает видеоизображение, а справа сбоку отчетливо видны колебания на звуковой дорожке. Имеющаяся по обоим краям пленки периодическая система отверстий (перфорация) служит для механической протяжки ленты в киноаппарате с помощью специального механизма.

Казалось бы, если проблемы кодирования статической графики и звука решены, то сохранить видеоизображение уже не составит труда. Но это только на первый взгляд, поскольку, как показывает разобранный выше пример, при использовании традиционных методов сохранения информации электронная версия фильма получится слишком большой. Достаточно очевидное усовершенствование состоит в том, чтобы первый кадр запомнить целиком (в литературе его принято называть ключевым), а в следующих сохранять лишь отличия от начального кадра (разностные кадры).
Принцип формирования разностного кадра поясняется рис.2, где продемонстрировано небольшое горизонтальное смещение прямоугольного объекта. Отчетливо видно, что при этом на всей площади кадра изменились всего 2 небольшие зоны: первая сзади объекта возвратилась к цвету фона, а на второй - перед ним, фон перекрасился в цвет объекта. Для разноцветных предметов произвольной формы эффект сохранится, хотя изобразить его будет заметно труднее.

Рис.2

Конечно, в фильме существует много ситуаций, связанных со сменой действия, когда первый кадр новой сцены настолько отличается от предыдущего, что его проще сделать ключевым, чем разностным. Может показаться, что в компьютерном фильме будет столько ключевых кадров, сколько новых ракурсов камеры. Тем не менее, их гораздо больше. Регулярное расположение подобных кадров в потоке позволяет пользователю оперативно начинать просмотр с любого места фильма: "если пользователь решил начать просмотр фильма с середины, вряд ли он захочет ждать, пока программа распаковки вычислит все разности с самого начала" Кроме того, указанная профилактическая мера позволяет эффективно восстановить изображение при любых сбоях или при "потере темпа" и пропуске отдельных кадров на медленных компьютерных системах.
Заметим, что в современных методах сохранения движущихся видеоизображений используются и другие типы кадров.
Существует множество различных форматов представления видеоданных. В среде Windows, например, уже более 10 лет (начиная с версии 3.1) применяется формат Video for Windows, базирующийся на универсальных файлах с расширением AVI (Audio Video Interleave - чередование аудио и видео). Суть AVI файлов состоит в хранении структур произвольных мультимедийных данных, каждая из которых имеет простой вид, изображенный на рис.3. Файл как таковой представляет собой единый блок, причем в него, как и в любой другой, могут быть вложены новые блоки. Заметим, что идентификатор блока определяет тип информации, которая хранится в блоке.

Рис.3

Внутри описанного выше своеобразного контейнера информации (блока) могут храниться абсолютно произвольные данные, в том числе, например, блоки, сжатые разными методами. Таким образом, все AVI-файлы только внешне выглядят одинаково, а внутри могут различаться очень существенно.
Еще более универсальным является мультимедийный формат Quick Time, первоначально возникший на компьютерах Apple. По сравнению с описанным выше, он позволяет хранить независимые фрагменты данных, причем даже не имеющие общей временной синхронизации, как этого требует AVI. В результате в одном файле может, например, храниться песня, текст с ее словами, нотная запись в MIDI-формате, способная управлять синтезатором, и т.п. Мощной особенностью Quick Time является возможность формировать изображение на новой дорожке путем ссылок на кадры, имеющиеся на других дорожках. Полученная таким способом дорожка оказывается несоизмеримо меньше, чем если бы на нее были скопированы требуемые кадры. Благодаря описанной возможности файл подобного типа легко может содержать не только полную высококачественную версию видеофильма, но и специальным образом "упрощенную" копию для медленных компьютеров, а также рекламный ролик, представляющий собой "выжимку" из полной версии. И все это без особого увеличения объема по сравнению с полной копией.
Все большее распространение в последнее время получают системы сжатия видеоизображений, допускающие некоторые незаметные для глаза искажения изображения с целью повышения степени сжатия. Наиболее известным стандартом подобного класса служит MPEG (Motion Picture Expert Group), который разработан и постоянно развивается созданным в 1988 году Комитетом (группой экспертов) международной организации ISO/IEC (International Standards Organization/International Electrotechnical Commission) по стандартам высококачественного сжатия движущихся изображений. Методы, применяемые в MPEG, непросты для понимания и опираются на достаточно сложную математику. Укажем лишь наиболее общие приемы, за счет которых достигается сжатие. Прежде всего, обрабатываемый сигнал из RGB-представления с равноправными компонентами преобразуется в яркость и две "координаты" цветности. Как показывают эксперименты, цветовые компоненты менее важны для восприятия и их можно проредить вдвое. Кроме того, производится специальные математические преобразования (DCT - дискретно-косинусное преобразование), несколько загрубляющее изображение в мелких деталях. Опять таки из экспериментов следует, что на субъективном восприятии изображение это практически не сказывается. Наконец, специальными методами (в том числе и методом, изображенным на рис.2) ликвидируется сильная избыточность информации, связанная со слабыми отличиями между соседними кадрами. Полученные в результате всех описанных процедур данные дополнительно сжимаются общепринятыми методами, подобно тому, как это делается при архивации файлов.
В последнее время все большее распространение получает технология под названием DivX (происходит от сокращения слов Digital Video Express, обозначающих название видеосистемы, которая "прославилась" неудачной попыткой взимать небольшую оплату за каждый просмотр видеодиска; к собственно технологии DivX это никакого отношения не имело). Благодаря DivX удалось достигнуть степени сжатия, позволившей вмесить качественную запись полнометражного фильма на один компакт-диск - сжать 4,7 Гб DVD-фильма до 650 Мб. И хотя это достижение, к сожалению, чаще всего используется для пиратского копирования, сам по себе этот факт не умаляет достоинств новой технологии. Как и то, что самая первая версия сжатия DivX была сработана французскими хакерами из MPEG-4 - современные версии DivX уже не имеют к этому событию никакого отношения.
Наиболее популярные программы проигрывания видеофайлов позволяют использовать замещаемые подсистемы сжатия и восстановления видеоданных - кодеки (от англ. compression/decompression - codec, сравните с образованием термина "модем").
Такой подход позволяет легко адаптировать новые технологии, как только те становятся доступными. Замещаемые кодеки хороши как для пользователей, так и для разработчиков программного обеспечения. Тем не менее, большое разнообразие кодеков создает определенные трудности для производителей видеопродукции. Часто в качестве выхода из создавшегося положения необходимые кодеки помещают на компакт-диск с фильмами или даже поставляют видеоматериалы в нескольких вариантах, предоставляя тем самым возможность выбрать подходящий. Все больше распространяется автоматизация распознавания, когда плейер, обнаружив информацию об отсутствующем кодеке, загружает его из Интеренет.

Единицей измерения количества информации является бит – это наименьшаяединица.

1 Кб (килобайт) = 1024 байта= 2 10 байтов

1 Мб (мегабайт) = 1024 Кб = 2 10 Кб

1 Гб (гигабайт) = 1024 Мб = 2 10 Мб

1 Тб (терабайт) =1024 Гб = 2 10 Гб

Формулы, которые используются при решении типовых задач:

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2 i .

i – информационный вес одного символа.

Основная литература:

  1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.

Дополнительная литература:

  1. Босова Л. Л. Информатика: 7–9 классы. Методическое пособие. // Босова Л. Л., Босова А. Ю., Анатольев А. В., Аквилянов Н.А. – М.: БИНОМ, 2019. – 512 с.
  2. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 1. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  3. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 2. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  4. Гейн А. Г. Информатика: 7 класс. // Гейн А. Г., Юнерман Н. А., Гейн А.А. – М.: Просвещение, 2012. – 198 с.

Теоретический материал для самостоятельного изучения.

Что же такое символ в компьютере? Символом в компьютере является любая буква, цифра, знак препинания, специальный символ и прочее, что можно ввести с помощью клавиатуры. Но компьютер не понимает человеческий язык, он каждый символ кодирует. Вся информация в компьютере представляется в виде нулей и единичек. И вот эти нули и единички называются битом.

Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется один бит.

Алфавит любого понятного нам языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита связана с разрядностью двоичного кода соотношением: N = 2 i .

Эту формулу можно применять для вычисления информационного веса одного символа любого произвольного алфавита.

Рассмотрим пример:

Алфавит древнего племени содержит 16 символов. Определите информационный вес одного символа этого алфавита.

Составим краткую запись условия задачи и решим её:

16 = 2 i , 2 4 = 2 i , т. е. i = 4

Ответ: i = 4 бита.

Информационный вес одного символа этого алфавита составляет 4 бита.

Математически это произведение записывается так: I = К · i.

32 = 2 i , 2 5 = 2 i , т.о. i = 5,

I = 180 · 5 = 900 бит.

Ответ: I = 900 бит.

I = 23 · 8 = 184 бита.

Как и в математике, в информатике тоже есть кратные единицы измерения информации. Так, величина равная восьми битам, называется байтом.

Бит и байт – это мелкие единицы измерения. На практике для измерения информационных объёмов используют более крупные единицы: килобайт, мегабайт, гигабайт и другие.

1 Кб (килобайт) = 1024 байта= 2 10 байтов

1 Мб (мегабайт) = 1024 Кб = 2 10 Кб

1 Гб (гигабайт) = 1024 Мб = 2 10 Мб

1 Тб (терабайт) =1024 Гб = 2 10 Гб

Материал для углубленного изучения темы.

Как текстовая информация выглядит в памяти компьютера.

Набирая текст на клавиатуре, мы видим привычные для нас знаки (цифры, буквы и т.д.). В оперативную память компьютера они попадают только в виде двоичного кода. Двоичный код каждого символа, выглядит восьмизначным числом, например 00111111. Теперь возникает вопрос, какой именно восьмизначный двоичный код поставить в соответствие каждому символу?

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код ‑ просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.Таблица для кодировки – это «шпаргалка», в которой указаны символы алфавита в соответствии порядковому номеру. Для разных типов компьютеров используются различные таблицы кодировки.

Таблица ASCII (или Аски), стала международным стандартом для персональных компьютеров. Она имеет две части.


В этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.

Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:

01100110 01101001 01101100 01100101.

А теперь попробуем решить обратную задачу. Какое слово записано следующим двоичным кодом:

01100100 01101001 01110011 01101011?

В таблице 2 приведен один из вариантов второй половины кодовой таблицы АSСII, который называется альтернативной кодировкой. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования.


Вывод: все тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные для нас буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.

Из памяти же компьютера текст может быть выведен на экран или на печать в символьной форме.

Разбор решения заданий тренировочного модуля

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2 i .

Читайте также: