Файл как единица измерения информации

Обновлено: 07.07.2024

При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру. При этом образуются адресные данные. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.

Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких, как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т.п.), поскольку частичное заполнение одной единицы хранения приводит к неэффективности хранения.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом.

Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем.

Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.

Поскольку в определении файла нет ограничений на размер, можно представить себе файл, имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла.

Имя файла состоит из двух частей: собственно имени и расширения файла.

Собственно имя файла может состоять из букв русского и английского алфавитов, цифр и специальных символов. При этом его длина не должна превышать 256 символов.

В зависимости от расширения все файлы делятся на две большие группы: исполняемые и неисполняемые.

Исполняемые файлы – это такие файлы, которые могут выполняться самостоятельно, т. е. не требуют каких-либо специальных программ для их запуска. Имеют следующие расширения:

exe – готовый к исполнению файл (tetris.exe; winword.exe);

sys – файл операционной системы (Io.sys);

bat – командный файл операционной системы MS-DOS (autoexec.bat).

Неисполняемые файлы для запуска требуют установки специальных программ. Так, например, для того чтобы просмотреть текстовый документ, требуется наличие какого-либо текстового редактора. По расширению неисполняемого файла можно судить о типе данных, хранящихся в данном файле. Вот несколько примеров:

В этой статье мы поговорим о единицах измерения информации, файлах, папках и форматах размещения данных.

Понимание основ принципов размещения и измерения информации позволит Вам легко манипулировать файлами и папками и не вызовет никаких затруднений при выполнений элементарных задач.

Единицы измерения информации

Бит (англ. bit — немного) — единица измерения информации.

Байт (англ. byte) — единица измерения количества информации, по умолчанию байт считается равным восьми битам.

В основном, в зависимости от объема, пользуются первыми тремя единицами измерения: Калобайты, Мегабайты, Гигабайты.

Немного позже в этой статье мы с вами рассмотрим на конкретных примерах, сколько по объему занимают места те или иные файлы.

А перед этим давайте рассмотрим одно из главных понятий, с которым связано измерение и хранение информации.

Файл — именованная область памяти, в которой может храниться определенный объем информации.

Каждый файл имеет ряд свойств:

Имя файла — последовательность символов.

Расширение имени файла — последовательность символов, продолжающая имя файла через точку, к примеру документ.DOC, каждая программа имеет файлы с определенным расширением.

Атрибуты — параметры файла, определяющие его состояние или какие - либо дополнительные свойства

Теперь давайте рассмотрим основные типы файлов, т.к. основным отличием файлов является — тип размещяемой в них информации.

расширение	тип файла
BMP	Точечный рисунок
DOC	Документ Word
HTML	Интернет - страница
ICO	Файл с иконкой
JPG	Файл изображения
MP3	Файл со звуком
XLS	Файл с таблицами Excel
RAR	Файл с архивом Winrar

Конечно - это далеко не полный список расширений файлов, для того, чтобы посмотреть какой перечень зарегестрированных типов файлов есть в вашем компьютере вы можете открыть окно и в главном меню выбрать Сервис - Свойства папки:

Во вкладке типы файлов вы сможете найти полный список зарегестрированных типов файлов, это те файлы, к которым привязана какая - либо программа для его открытия.

Теперь давайте посмотрим какой объем информации имеют те или иные файлы.
Для того, чтобы посмотреть какой объем имеет файл нужно нажать на этом файле правой кнопкой мыши и выбрать в контекстном меню "свойства".

В появившемся окне вы увидите раздел размер файла в уже известных вам единицах. Как видите файл, содержащий 18 страниц текста имеет объем всего 117 Килобайт.

А вот файл, содержащий видео, имеет уже по сравнению с текстом довольно таки большой объем.

Здесь объем уже 700 Мегабайт, если же формат DVD-видео, то он может быть уже объемом 8 Гигабайт и более.

Теперь давайте рассмотрим еще несколько определений.

Папка — именованая область, в которой могут содержаться другие папки, а также файлы.

Древовидная структура — система размещения папок в операционной системе Windows, для того, чтобы понять её предлагаю взглянуть на следующее изображение.

Как мы видим из этого изображения, для того, чтобы к примеру нам открыть папку Logs, нам нужно на рабочем столе открыть - Мой компьютер, затем открыть Диск System(C:), затем папку Intel, после чего мы уже увидим папку Logs. Полный путь к этой папке записывается следующим видом: C:\Intel\Logs.

Для того, чтобы перейти из группы простых пользователей в группу экпертов в компьютерах предлагаю видеокурс по настройке, ремонту и обслуживанию компьютера.

Единицей измерения количества информации является бит – это наименьшаяединица.

1 Кб (килобайт) = 1024 байта= 2 10 байтов

1 Мб (мегабайт) = 1024 Кб = 2 10 Кб

1 Гб (гигабайт) = 1024 Мб = 2 10 Мб

1 Тб (терабайт) =1024 Гб = 2 10 Гб

Формулы, которые используются при решении типовых задач:

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2 i .

i – информационный вес одного символа.

Основная литература:

Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.

Дополнительная литература:

Босова Л. Л. Информатика: 7–9 классы. Методическое пособие. // Босова Л. Л., Босова А. Ю., Анатольев А. В., Аквилянов Н.А. – М.: БИНОМ, 2019. – 512 с.
Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 1. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 2. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
Гейн А. Г. Информатика: 7 класс. // Гейн А. Г., Юнерман Н. А., Гейн А.А. – М.: Просвещение, 2012. – 198 с.

Теоретический материал для самостоятельного изучения.

Что же такое символ в компьютере? Символом в компьютере является любая буква, цифра, знак препинания, специальный символ и прочее, что можно ввести с помощью клавиатуры. Но компьютер не понимает человеческий язык, он каждый символ кодирует. Вся информация в компьютере представляется в виде нулей и единичек. И вот эти нули и единички называются битом.

Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется один бит.

Алфавит любого понятного нам языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита связана с разрядностью двоичного кода соотношением: N = 2 i .

Эту формулу можно применять для вычисления информационного веса одного символа любого произвольного алфавита.

Рассмотрим пример:

Алфавит древнего племени содержит 16 символов. Определите информационный вес одного символа этого алфавита.

Составим краткую запись условия задачи и решим её:

16 = 2 i , 2 4 = 2 i , т. е. i = 4

Ответ: i = 4 бита.

Информационный вес одного символа этого алфавита составляет 4 бита.

Математически это произведение записывается так: I = К · i.

32 = 2 i , 2 5 = 2 i , т.о. i = 5,

I = 180 · 5 = 900 бит.

Ответ: I = 900 бит.

I = 23 · 8 = 184 бита.

Как и в математике, в информатике тоже есть кратные единицы измерения информации. Так, величина равная восьми битам, называется байтом.

Бит и байт – это мелкие единицы измерения. На практике для измерения информационных объёмов используют более крупные единицы: килобайт, мегабайт, гигабайт и другие.

1 Кб (килобайт) = 1024 байта= 2 10 байтов

1 Мб (мегабайт) = 1024 Кб = 2 10 Кб

1 Гб (гигабайт) = 1024 Мб = 2 10 Мб

1 Тб (терабайт) =1024 Гб = 2 10 Гб

Материал для углубленного изучения темы.

Как текстовая информация выглядит в памяти компьютера.

Набирая текст на клавиатуре, мы видим привычные для нас знаки (цифры, буквы и т.д.). В оперативную память компьютера они попадают только в виде двоичного кода. Двоичный код каждого символа, выглядит восьмизначным числом, например 00111111. Теперь возникает вопрос, какой именно восьмизначный двоичный код поставить в соответствие каждому символу?

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код ‑ просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.Таблица для кодировки – это «шпаргалка», в которой указаны символы алфавита в соответствии порядковому номеру. Для разных типов компьютеров используются различные таблицы кодировки.

Таблица ASCII (или Аски), стала международным стандартом для персональных компьютеров. Она имеет две части.

В этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.

Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:

01100110 01101001 01101100 01100101.

А теперь попробуем решить обратную задачу. Какое слово записано следующим двоичным кодом:

01100100 01101001 01110011 01101011?

В таблице 2 приведен один из вариантов второй половины кодовой таблицы АSСII, который называется альтернативной кодировкой. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования.

Вывод: все тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные для нас буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.

Из памяти же компьютера текст может быть выведен на экран или на печать в символьной форме.

Разбор решения заданий тренировочного модуля

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2 i .

Одной из характеристик любой информация является ее объем. Например, небольшую заметку может характеризовать количество слов ее составляющих, а книги обычно меряют уже страницами. В электронных устройствах есть свои единицы объема информации, которые показывают, сколько нужно места для ее хранения.

Здесь придется сделать небольшое отступление, чтобы объяснить, как вообще хранится в компьютерах информация. Из информатики нам известно, что обычные компьютеры распознают только два состояния, включено и выключено (высокий и низкий сигнал). Для описания этих состояний достаточно всего двух цифр 0 (выключено или ложь) и 1 (включено или истина). Все остальное получается из комбинации нулей и единиц. Это так называемая двоичная система счисления.

С другой стороны, мы все обычно пользуемся десятичной системой счисления, которая использует уже десять цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Отсюда у простых людей есть определенные трудности в понимании, как оперируют информацией компьютеры. К счастью, в контексте этой статьи, нам ненужно вникать во все эти тонкости. Достаточно запомнить, что компьютеры оперируют только 0 и 1 и это соответствует одному биту.

Бит (bit) — минимальный объем информации в двоичной системе счисления, равен 0 или 1. Это конечно хорошо, но как нам записать, что то более осмысленное? Выход находится в комбинировании нескольких бит. Если взять два бита, то вместе они уже имеют не два состояния (0 или 1), а четыре: 00, 01, 10, 11. Восемь последовательных бит дают в сумме 256 (2 8 ) возможных комбинаций нуля и единицы. Такое количество комбинаций достаточно, чтобы закодировать все буквы алфавита, цифры, знаки препинания и остальные служебные вещи.

Таблица соответствия двоичных кодов некоторым ASCII кодам

В действительности все немного сложнее, поскольку в мире существует множество языков, а так же других полезных символов. Естественно общее количество символов получается гораздо больше, чем 256. Для решения этой проблемы используют таблицы кодировки, чтобы компьютер мог понять, какому символу на каком языке должен соответствовать тот или иной двоичный код. Например, в операционной системе Windows используется кодировка Windows-1251 , в которой в первых 128 комбинациях закодированы служебные символы, цифры, знаки препинания и латинские буквы, а оставшиеся комбинации отданы под хранение кириллицы и всяких дополнительных значков.

Фраза «Привет, мир!» в двоичном коде в кодировке Windows-1251 выглядит так:

Что такое байт

Байт (byte) — восемь последовательных битов образуют 1 байт. Это минимальный объем информации, к которому можно обратится напрямую и с которым имеют дело компьютерные программы. В современной компьютерной технике 1 байт равен 8 битам, но есть исключения, поэтому его еще иногда называют «октет» для полной однозначности. Теперь вы знаете, сколько бит в байте.

Именно в байтах измеряют объем любой информации неважно текст, изображение и видео. Поэтому в Проводник показывает вес (объем) файла в байтах, о существовании битов обычные пользователи компьютера могут даже не догадываться. Объем накопителей для хранения данных так же выражается в байтах.

В школе изучают эти приставки и все знают, что приставка «кило» означает тысяча (10 3 ), например километр (1 000 метров), килограмм (1 000 грамм). Приставка «мега» означает миллион (10 6 ), например мегагерц (1 000 000 герц), мегаом (1 000 000 ом). Есть и многие другие широко распространенные в нашей жизни приставки. Именно в этот момент у изучающих компьютер начинается путаница. Дело в том, что в компьютерах используют те же приставки, то есть килобайт, мегабайт, гигабайт и так далее, но они кратны 1 024 (2 10 ). Согласитесь, неожиданный поворот. На эту тему есть даже древний анекдот:

— В чем отличие программиста от простого человека?
— Программист думает, килограмм картошки — это 1 024 грамма, а простой человек полагает, что в килобайте 1 000 байт.

На самом деле, для обозначения единиц компьютерной информации существуют свои собственные приставки, которые устраняют эту чехарду, правда ими практически никто не пользуется. Считается, что в силу их громоздкости и труднопроизносимости. Образуются заменой последнего слога стандартной приставки на «би», кибибайт, мебибайт, гибибайт, тебибайт и так далее.

Килобайт (КБ, Кбайт) — единица информации равная 1 024 байтам . Хотя правильнее как уже говорилось выше, называть ее кибибайтом. Чтобы перевести килобайты в байты, их нужно умножить на 1 024 , а чтобы получились биты, умножить получившееся число еще на 8. В итоге, в 1 КБ содержит 8 192 бита .

Мегабайт (МБ, Мбайт) — единица информации равная 1 024 килобайта . Чтобы перевести байты в мегабайты их нужно разделить на 1 024 и еще раз на 1 024 , то есть он равен 1 048 576 байтам . Обычно вес музыки, фотографий или коротких видеоклипов измеряется как раз в них.

Гигабайт (ГБ, Гбайт) — единица информации равная 1 024 мегабайта , 1 048 576 килобайт , 1 073 741 824 байтам или 8 589 934 592 бит . В основном это фильмы в хорошем качестве. Высчитывать все это вручную не очень удобно, поэтому ниже есть специальный конвертер для пересчета единиц измерения объема информации.

Терабайт (ТБ, Тбайт) — самая большая единица объема информации, с которой может столкнуться обычный пользователь компьютера на сегодняшний день и то не в виде отдельных файлов, а в виде объема жесткого диска. Равен 1 024 гигабайтам или 1 048 576 мегабайтам . С другой стороны, объем потребляемой информации постоянно растет и в будущем терабайт может стать такой же привычной величиной и повсеместное внедрение видео формата 4K вполне может этому поспособствовать.

Это самые распространенные на сегодняшний день объемы отдельных файлов встречающиеся в компьютерах обычных пользователей. Остальные единицы измерения информации, такие как терабайт, петабайт, эксабайт и так далее пока не встречаются в домашних компьютерах, за исключением терабайта. Вы можете посмотреть в таблице, а так же воспользоваться онлайн калькулятором расположенным ниже для их пересчета.

Разобрались, что такое килобайт, мегабайт, гигабайт и так далее? Хорошо, однако, это еще не вся путаница, которая подстерегает чайника в компьютерах. Все еще интереснее и веселее.

Почему объем жесткого диска меньше, чем написано на этикетке

Вы возможно уже сталкивались с ситуацией, когда вы купили жесткий диск емкостью 500 ГБ, а операционная система видит заметно меньше, например, только 465 ГБ. Ответ кроется все в тех же приставках и бардаке в их применении. Зато маркетологи знают, как можно буквально по мановению волшебной палочки увеличить емкость дисков своей компании. Достаточно посчитать ее по своей собственной методике.

Производитель может придерживаться при расчетах объема диска международной системы СИ, где гигабайт это 10 9 и напишет на этикетке диска емкостью 500 млрд. байт, что он на 500 ГБ. Когда вы его подключите к компьютеру, то Windows будет считать в двоичной системе и насчитает только 465 ГБ. Причем чем больше емкость диска, тем больше разница между этикеткой и реально доступным объемом. Более того, производитель может посчитать каким-нибудь еще способом, допустим, гигабайт окажется равным 1 млн. килобайт.

В чем измеряется скорость интернета

Вы еще не потерялись во всех этих хитросплетениях? Тогда новая порция чудес ждет вас. Дело в том, что скорость передачи данных в компьютерных сетях измеряется в битах в секунду. Именно в битах, а не в байтах. Это достаточно просто проверить, достаточно посмотреть, что пишет Windows в свойствах вашего подключения к интернету, там окажется, скорее всего, 100 Мбит/с или 1 Гбит/с.

Провайдеры точно так же указывают в тарифах именно биты в секунду. Причем здесь повторяется ситуация с байтами. Согласно международной системе СИ 1 Мбит это 1 000 000 бит, а в двоичной системе он должен называться мебибит и равняться 1 048 576 бит. Поэтому, что на самом деле имеет человек в виду говоря «мегабит», сказать однозначно нельзя.

Калькулятор единиц объема информации
Число:
Разделять разряды:
Байт:	Бит:
Килобайт:	Килобит:
Мегабайт:	Мегабит:
Гигабайт:	Гигабит:
Терабайт:	Терабит:
Петабайт:	Петабит:
Эксабайт:	Эксабит:
Зеттабайт:	Зеттабит:
Йоттабайт:	Йоттабит:

Конечно, новичкам трудно сразу разобраться во всей этой путанице, с другой стороны это особо и не требуется. Главное помнить, что 8 бит равно 1 байту, остальные величины кратны 1 024, вес файлов измеряется в байтах, а скорость интернета в битах. Этого вполне достаточно для нормальной работы за компьютером. А чтобы вам было легче сориентироваться, насколько много весит тот или иной файл, приведем в качестве справки объем некоторых носителей информации.

Дискета 3,5″ (если вы знаете, что это такое) — 1.44 МБ
CD диск — 700 МБ
DVD диск (однослойный) — 4.7 ГБ
Blu-ray диск (однослойный) — 25 ГБ
HDD (макс. емкость в настоящее время для домашнего компьютера) — 12 ТБ

Вот собственно и все, что мы вам хотели рассказать про единицы измерения информации в операционной системе компьютера. Рекомендуем сохранить данную страницу в закладки, чтобы иметь возможность быстро перевести килобайты в другие единицы измерения информации с помощью нашего конвертера.

Читайте также: