Формат файла iso 9660

Обновлено: 07.07.2024

Базовый стандарт файловой системы для дисков CDROM — ISO 9660 (ECMA119). В терминах этой файловой системы дорожка называется томом . Том делится на логические секторы по 2048 байтов. В начале тома расположена системная область длиной 15 секторов. В ней хранятся дескрипторы тома и загрузочная запись. С 16го сектора начинается область данных, которая продолжается до конца дорожки. Внутри тома (в области данных) находятся собственно данные:

Таким образом, файлы образуют древовидную структуру каталогов. Для ускорения поиска файлов для каждого каталога создается также таблица путей (Path Table). Она содержит адрес экстента (файла или каталога), длину записи расширенных атрибутов, номер родительского каталога и идентификатор каталога.

Каждый каталог получает номер, причем корневому каталогу присваивается номер 1. Каталоги в таблице путей сортируются по уровням иерархии (вложенности), далее — по возрастанию номера родительского каталога и, наконец, по идентификатору каталога в алфавитном порядке. Таблицы хранятся в двух вариантах (LSB и MSB) и могут существовать в двух копиях. Это повышает степень устойчивости данных.

Согласно стандарту, оглавление отсортировано в алфавитном порядке, каталоги находятся в его начале, вне зависимости от реального расположения файлов на диске. Сортировка внутри каталога также происходит по именам файлов. Чтобы диски могли читаться различными операционными системами, внутри стандарта ISO 9660 предусмотрены три уровня совместимости.

Level 1. Совместимость с MSDOS: длина имени файла или каталога до 8 символов, длина полного пути к файлу — до 256 символов, а глубина вложенности папок и файлов не превышает восьми. Каждый файл на диске должен быть непрерывным.

Level 2. Совместимость с операционной системой Windows 95/98. Разрешены имена файлов длиной до 30 символов, не считая точки и расширения.

Level 3. Файл может состоять из нескольких фрагментов. С дисками, файловая система которых соответствует этому уровню, могут работать только операционные системы Windows 2000/XP/Vista/7 и некоторые системы Linux.

Стандарт ISO 9660 предусматривает и работу с перезаписываемыми носителями. Запись на записываемых и перезаписываемых дисках может осуществляться в несколько приемов (сессий). Сначала в зоне PMA создается таблица оглавления (Table of Content, TOC). При закрытии сессии она переписывается на нулевую дорожку.

Таблица оглавления (TOC) содержит указания на размещение записей файловой системы. При быстром стирании перезаписываемого диска стирается только она, а файлы в области данных не затрагиваются. Возможность восстановления данных после нечаянного стирания диска основана именно на этом.

Расширения ISO 9660

За более чем 20-летнюю историю своего существования стандарт ISO 9660 неоднократно обновлялся. На диски DVD и Bluray он распространился автоматически. Важно, что обновление спецификаций шло исключительно по пути их дополнения и расширения. Все новые возможности появлялись за счет добавления новых структур, чтобы совместимость со старыми ОС и приложениями оставалась полной.

- Rock Ridge Interchange Protocol — расширение файловой системы ISO 9660, дополняющее список допустимых атрибутов файлов и каталогов. Эта файловая система полностью поддерживается операционной системой UNIX. На компьютерах с операционной системой Windows такие диски могут читаться, но с некоторыми ограничениями (ограничение касается длинных имен файлов).

- Стандарт Joliet был разработан корпорацией Microsoft и также является расширением файловой системы ISO 9660. В этой спецификации обходится ряд ограничений, ранее наложенных стандартом ISO 9660 на длину имен и вложенность каталогов. Имена файлов и каталогов записываются двухбайтовыми символами Unicode. Таблицы Unicode хранятся в отдельном дополнительном заголовке. Старые программы его игнорируют, читая лишь основной заголовок.

- Спецификация El Torito определяет формат загрузочной записи, находящейся среди дескрипторов тома файловой системы ISO 9660, и ее интерпретацию в BIOS. Диски с такой загрузочной записью при загрузке с них компьютера эмулируют один из стандартных типов носителей, например, дискету или винчестер. В остальном на загрузочных дисках используется все та же файловая система ISO 9660.

Будучи в поисках интересной информации о стеганографии, я наткнулся на занимательную статью о стеганографии в файловой системе, и, спустя какое -то время, та навела меня на мысль о создании стеганографии в файловой системе оптических дисков.

Вероятно, в наши дни, уже почти не осталось людей, которые бы использовали в повседневности диски, ведь им на замену пришел более достойный вариант в лице флеш-накопителей.

Немного поразмыслив, я решил, что дискам все еще можно найти какое-то применение, например, внутри их файловой системы можно скрыть какую-то секретную информацию и затем передать другому так, чтобы никто ничего не заподозрил.

Этим мы и займемся, а именно: будем использовать библиотеку питона, которая поможет нам закодировать информацию из текстового файла, а затем скрыть ее в недрах нашего диска.

image



Но перед тем, как мы начнем, давайте сначала разберем некоторые мелочи, а так же определим понятие оптического диска.

Что такое оптический диск

Опти́ческий диск (англ. optical disc) — собирательное название для носителей информации, выполненных в виде дисков, чтение с которых ведётся с помощью оптического (лазерного) излучения.

image

Каждый диск на компьютере представляется в определенном формате в виде образа, где содержится вся информация и структура диска, и используется он для работы с информацией без оптического носителя, а также архивирования данных на твёрдые носители
Стандартным форматом для оптических дисков является iso9660, но есть еще
Следует иметь в виду, что образ содержит меньше информации, чем исходный компакт-диск. На диске содержится служебная информация, которая может, в частности, использоваться для защиты от копирования.Работать же мы будем с ISO9660.

Взгляд изнутри

A теперь давайте же посмотрим на структуру iso9660 изнутри, подробную информацию вы можете найти здесь, здесь и здесь, а для знающих английский еще и здесь. От себя же просто скажу, что в основном она состоит из 2 дескрипторов: Boot Record и Primary Volume Descriptor (PVD), вы можете открыть любой iso в 010editor и сами в этом убедиться.

image

Boot Record может быть использован системами, которым необходимо инициализировать много типов данных, перед тем, как сделать диск доступным, хотя ISO 9660 не указывает на то, какая информация в Boot Record или как ее вообще использовать.

PVD же — стартовая точка в идентификации iso9660, выглядит она следующим образом:

image

image

Для любителей схем:

image

Больше информации вы найдете тут

А мы движемся дальше.

Инициализация в структуре ISO

Работать мы будем с корневой директорией, в ней создадим собственные директории и добавим необходимые файлы.

Для этого мы будем использовать библиотеку pycdlib, с ней вы можете хорошо ознакомиться по следующей ссылке.

Перейдем к написанию программы, но кто не хочет идти пошагово, исходный код вы найдете по ссылке на мой репозиторий в гитхаб:

Подготавливаем файлы с текстом

Теперь нам необходимо подготовить наши файлы, которые мы закинем в структуру нашего iso.

Ход действий следующий:

  1. Берем исходный текст в определенных файлах и считываем его в переменные- ничто не мешает взять нам много текста, но для демонстрации я взял всего пару предложений в каждый файл- этими переменными мы и будем дальше манипулировать
  2. После того, как мы считали предложения, нам необходимо закодировать содержимое Кодировать же мы будем с помощью base64
  3. Запишем закодированное содержимое в новые файлы, под названием UP и DOWN. Файлы так называются из-за того, что я решил сделать перестановку таким образом, чтобы в UP записалась 1 часть 1го файла и 1 часть 2го файла(т.е верхние части), а в DOWN 2 часть 1го файла и 2 часть 2го файла(т.е нижние части)

Сокрытие

Пришло время перейти к той самой библиотеке pycdlib, о которой я говорил еще в начале. С ней работать достаточно не сложно: мы создаем объект, через который дальше добавляем внутрь различные файлы и директории.


Как мы видим, наш текст успешно записался

image

Хочу подметить, что мы можем создать по определенному пути, например /A, либо файл, либо папку.

Расширения для файловой системы ISO9660

Есть 2 основных расширения для файловой системы iso, это: RockRidge и Joilet.

RockRidge

Это расширение файловой системы ISO 9660, разработанное для хранения файловых атрибутов, используемых в операционных системах POSIX(т.е Unix- совместимых).

Расширения Rock Ridge записываются поверх файловой системы ISO 9660 так, что оптический диск с Rock Ridge может быть прочитан программным обеспечением, рассчитанным на работу с ISO 9660.

Rock Ridge может хранить следующую дополнительную информацию о содержимом диска:

  • длинные имена файлов (до 255 символов);
  • меньше ограничений на использование символов в именах файлов;
  • структуру каталогов произвольной вложенности.
  • для каждого файла записываются атрибуты:
  • права доступа к файлу, в том числе поля uid и gid;
  • количество жёстких ссылок на файл;
  • времена создания, модификации, доступа, изменения атрибутов и др.
  • поддерживаются специальные файлы:
  • разрежённые файлы;
  • символьные ссылки;
  • файлы устройств;
  • файлы сокетов;
  • FIFO-файлы.

Joilet

Это расширение файловой системы ISO 9660, созданное для ослабления ограничений на имя файла, накладываемых в ISO 9660. Спецификация была разработана фирмой Microsoft и поддерживается всеми версиями ОС Microsoft Windows со времён Windows 95 и Windows NT 4.0.
По умолчанию используется на всех CD-ROM носителях с данными, выпущенных после 1995 года.

Joliet вводит дополнительный набор имён для файлов. Имена имеют длину до 64 символов Unicode и хранятся в кодировке UCS-2. Для их хранения используется специальный дополнительный заголовок (Supplementary Volume Descriptor, SVD), который безусловно игнорируется ISO 9660-совместимыми программами, обеспечивая этим обратную совместимость.

Большинство существующих программных платформ, включая Microsoft Windows, Linux, Mac OS X, и FreeBSD, способны читать носители информации с расширением файловой системы Joliet, что позволяет обмениваться файлами между этими операционными системами даже при использовании нелатинских алфавитов (таких как Арабский, Японский, Кириллица), что было невозможно при помощи обычного ISO 9660.

На самом деле, есть еще и 3 расширение для файловой системы iso, оно называется Romeo.

Это расширение ISO 9660 для MS Windows 95, информации по нему в интернете достаточно мало, и, вероятнее всего, это расширение больше нигде сейчас не используется.

Еще больше информации по расширениям и файловым системам для CD/DVD вы найдете тут, а сейчас давайте вернемся к нашей программе.

Получившийся код для кодирования информации из файла и помещения файлов с закодированной информацией в iso выглядит так:


А я напоминаю, что полный код так же есть по ссылке на гитхаб
Теперь давайте же перейдем к заключительной части — запишем наш получившийся iso на диск
Вы можете записывать чем хотите, я же воспользуюсь Nero 7
Использовать мы будем CD-R

Отличаются они тем, что CD-ROM это диск только для чтения данных, записать уже туда ничего не получится. CD-R и CD-RW это диски с возможностью записи. CD-R позволяет записать однократно на диск, CD-RW — многократно.

А как же DVD?

Основное отличие от CD-R/RW заключается в объеме данных, которые можно записать на DVD-диск 4,7 ГБ против 650700 МБ. Некоторые форматы DVD поддерживают до 13 и даже 17 ГБ
Еще больше информации о дисках

Как мы видим, программа успешно записалась на диск.

image

Теперь мы можем передать ее на диске тем людям, каким сами захотим.

Декодирование

Зачем нам все это было делать, если информацию нельзя раскодировать обратно, верно?

Если вас заинтересовал способ, можно написать программу, которая будет изымать и декодировать вложенные файлы, ей как раз таки и будут пользоваться «ваши люди».

И на этом все. Моей задачей было продемонстрировать один из возможных способов сокрытия информации, с использованием дисков, которые, казалось бы, канули в лету.

image

Буду рад увидеть ваши предложения, дополнения, исправления и другой feedback.

По стандарту диски могут быть разбиты на логические разделы, но мы будем рассматривать диски с одним разделом.

Как вы знаете из предыдущих лекций: блоки записываются последовательно; по спирали; сектора по 2352 байта.

Порядок записи информации:

Каждый CD-ROM начинается с 16 блоков (неопределенных ISO 9660), эта область может быть использована для размещения загрузчика ОС или для других целей.

Дальше один блок основного описателя тома - хранит общую информацию о CD-ROM, в нее входит:
- идентификатор системы (32байта)
- идентификатор тома (32байта)
- идентификатор издателя (128байт)
- идентификатор лица, подготовившего данные (128байт)
- имена трех файлов, которые могут содержать краткий обзор, авторские права и библиографическая информация.
- ключевые слова: размер логического блока (как правило 2048, но могут быть 4096, 8192 и т.д.); количество блоков; дата создания; дата окончания срока службы диска.
- описатель корневого каталога (номер блока содержащего каталог).

Могут быть дополнительные описатели тома, подобные основному.

Каталоговая запись стандарта ISO 9660.

Каталоговая запись стандарта ISO 9660.

Расположение файла - номер начального блока, т.к. блоки располагаются последовательно.

L - длина имени файла в байтах

Имя файла - 8 символов, 3 символа расширения (из-за совместимости с MS-DOS). Имя файла может встречаться несколько раз, но с разными номерами версий.

Sys - поле System use (используется различными ОС для своих расширений )

Порядок каталоговых записей:

Описатель самого каталога (аналог ".")

Ссылка на родительский каталог (аналог "..")

Остальные записи (записи файлов) в алфавитном порядке

Количество каталоговых записей не ограничено, но ограничено количество вложенности каталогов - 8.

В стандарте ISO 9660 определены три уровня ограничений:

имена файлов и каталогов до 31 символа

- имена файлов и каталогов до 31 символа
- файлы могут быть не непрерывными, состоять из разделов

3.1.2 Рок-ридж расширения для UNIX

Это расширение было создано, чтобы файловая система UNIX была представлена на CD-ROM.

Для этого используется поле System use.

Расширения содержат следующие поля:

PX - атрибуты POSIX (стандартные биты rwxrwxrwx, (чтение, запись, запуск) (владелец, группа, все) )

PN - старший и младший номер устройств (чтобы можно было записать каталог /dev, который содержит устройства)

SL - символьная связь

NM - альтернативное имя, позволяет использовать произвольные имена, без ограничений

CL - расположение дочернего узла (чтобы обойти ограничение на вложенность каталогов)

PL - расположение дочернего узла (чтобы обойти ограничение на вложенность каталогов)

RE - перераспределение (чтобы обойти ограничение на вложенность каталогов)

TF - временные штампы (время создания, последнее изменение , последний доступ)

3.1.3 Joliet расширения для Windows

Это расширение было создано, чтобы файловая система ОС Windows 95 была представлена на CD-ROM.

Для этого используется поле System use.

Расширения содержат следующие поля:

Длинные имена файлов (до 64 символов)

Набор символов Unicode (поддержка различных языков)

Преодоление ограничений на вложенность каталогов

Имена каталогов с расширениями

3.1.4 Romeo расширения для Windows

Стандарт Romeo предоставляет другую возможность записи файлов с длинными именами на компакт-диск. Длина имени может составлять 128 символов, однако использование кодировки Unicode не предусмотрено. Альтернативные имена в этом стандарте не создаются, поэтому программы MS-DOS не смогут прочитать файлы с такого диска.

Вы можете выбрать стандарт Romeo только в том случае, если диск предназначен для чтения приложениями Windows 95 и Windows NT.

3.1.5 HFS расширения для Macintosh

Иерархическая файловая система компьютеров Macintosh, не совместима ни с какими другими файловыми системами и называется Hierarchical File System (HFS).

3.1.6 Файловая система UDF (Universal Disk Format)

Изначально созданная для DVD, с версии 1.50 добавили поддержку CD-RW и CD-R.

Эта файловая система позволяет дописывать диски, а также поддерживает большие размеры файлов и длинные имена файлов.

3.2 Файловая система CP/M

CP/M (Control Program for Microcomputers) - операционная система, предшественник MS-DOS.

В ее файловой системе только один каталог, с фиксированными записями по 32 байта.

Имена файлов - 8+3 символов верхнего регистра.

После каждой перезагрузки рассчитывается битовый массив занятых и свободных блоков. Массив находится постоянно в памяти (для 180Кбайтного диска 23 байта массива). После завершения работы, он не записывается на диск.

Каталоговая запись CP/M

Видно, что максимальный размер файла 16Кбайт (16*1Кбайт).

Для файлов размером от 16 до 32 Кбайт можно использовать две записи. Для до 48 Кбайт три записи и т.д.

Порядковый номер записи хранится в поле экстент.

Код пользователя - каждый пользователь мог работать только со своими файлами.

Порядок чтения файлов:

Файл открывается системным вызовом open

Читается каталоговая запись, из которой получает информацию о всех блоках.

Вызывается системный вызов read

3.2 Файловая система MS-DOS (FAT-12,16,32)

В первых версиях был только один каталог (MS-DOS 1.0).

С версии MS-DOS 2.0 применили иерархическую структуру.

Каталоговые записи, фиксированны по 32 байта.

Имена файлов - 8+3 символов верхнего регистра.

Порядок чтения файлов:

Файл открывается системным вызовом open, которому указывается путь к файлу (может быть абсолютным и относительным).

Файловая система открывает каталоги (согласно пути), считывает последний каталог в память.

Ищет описатель файла.

Читается дескриптор файла, из которого получает информацию о всех блоках.

Вызывается системный вызов read

Каталоговая запись MS-DOS, обратите внимание на пустые 10 байт, они будут задействованы в Windows 98

Атрибут архивный нужен для программ резервного копирования, по нему они определяют надо копировать файл или нет.

Поле время (16 разрядов) разбивается на три подполя:

секунды - 5бит (2^5=32 поэтому хранятся с точностью до 2-х секунд)

Поле даты (16 разрядов) разбивается на три подполя:

год - 7бит (начинается с 1980г, т.е. максимальный 2107г.)

Теоретически размер файлов может быть до 4Гбайт (32 разряда).

Все блоки файла в записи не хранятся, а только первый блок. Этот номер используется в качестве индекса для 64К (для FAT-16) элементов FAT-таблицы, хранящейся в оперативной памяти.

В зависимости от количества блоков на диске в системе MS-DOS применяется три версии файловой системы FAT:

FAT-32 - для адреса используются только 28 бит, поэтому правильнее назвать FAT-28

Размер блока (кластера) должен быть кратным 512 байт.

В первой версии MS-DOS использовалась FAT-12 с 512 байтовыми блоками, поэтому максимальный размер раздела мог достигать 2Мбайта (2^12*512байта).

С увеличением дисков, этого стало не хватать, стали увеличивать размер блоков 1,2 и 4 Кбайта (2^12) (при этом эффективность использования диска падает).

FAT-12 до сих пор применяется для гибких дисков.

16-разрядные дисковые указатели

Размеры кластеров 512, 1, 2, 4, 8, 16 и 32Кбайт (2^15)

Таблица постоянно занимала в памяти 128 Кбайт.

Максимальный размер раздела диска мог достигать 2Гбайта (2^16*32Кбайта).

Причем кластер в 32 Кбайта для файлов со средним размером в 1Кбайт, не эффективен.

Размеры кластеров 512, 1, 2, 4, 8, 16 и 32Кбайт

Максимальный размер раздела диска мог бы достигать 2^28*2^15, но здесь уже вступает другое ограничение - 512 байтные сектора адресуются 32-разрядным числом, а это 2^32*2^9, т.е. 2 Тбайта.

Максимальный размер раздела для различных размеров кластеров

Размер кластера, Кбайт

Из таблицы видно, что FAT-16 использовать не эффективно уже при разделах в 256 Мбайт, учитывая, что средний размер файла 1Кбайт.

3.2.4 Расширение Windows 98 для FAT-32

Для расширения были задействованы 10 свободных бит.

Формат каталоговой записи в системе FAT-32 с расширениями для Windows 98

Пять добавленных полей:

NT - предназначено для совместимости с Windows.

Sec - дополнение к старому полю время, позволяет хранить время с точностью до секунды (было 2 секунды)

Дата и время создания файла (Creation time)

Дата (но не время) последнего доступа (Last access)

Для хранения номера блока выделено еще 2 байта (16 бит), т.к. номера блоков стали 32-разрядные.

Основная надстройка над FAT-32, это длинные имена файлов.

Для каждого файла стали присваивать два имени:

Короткое 8+3 для совместимости с MS-DOS

Длинное имя файла, в формате Unicode

Доступ к файлу может быть получен по любому имени.

Если файлу дано длинное имя (или используются пробелы), то система делает следующие шаги:

берет первые шесть символов

преобразуются в верхний регистр ASCII, удаляются пробелы, лишние точки, некоторые символы преобразуются в "_"

если такое имя есть, то используется суффикс

Короткие имена хранятся в в обычном дескрипторе файла.

Длинные имена хранятся в дополнительных каталоговых записях, идущих перед основным описателем файла. Каждая такая запись содержит 13 символов формата Unicode (для символа Unicode нужно два байта).

Формат каталогов записи с фрагментом длинного имени файла в Windows 98

Поле "Атрибуты" позволяет отличить фрагмент длинного имени (значение 0х0F) от дескриптора файла. Старые программы MS-DOS каталоговые записи со значением поля атрибутов 0х0F, просто игнорируют.

Последовательность - порядковый номер в последовательности фрагментов.

Длина имени файла ограничена 260 символами не из-за порядкового номера (1 байт), для номера используются только 6 бит 6х13=819 символов.

Контрольная сумма нужна для выявления ошибок, т.к. файл с длинным именем может удалить MS-DOS и создать новый, и тогда останутся не удаленные записи, которые "прилипнут" к новому файлу. Т.к. это поле один байт, есть вероятность 1/256 что Windows 98 не заметит подмены.

3.3 Файловая система NTFS

Файловая система NTFS была разработана для Windows NT.

64-разрядные адреса, т.е. теоретически может поддерживать 2^64*2^16 байт (1 208 925 819 Пбайт

Размеры блока (кластера) от 512байт до 64 Кбайт, для большинства используется 4Кбайта.

Поддержка больших файлов.

Имена файлов ограничены 255 символами Unicode.

Длина пути ограничивается 32 767 (2^15) символами Unicode.

Имена чувствительны к регистру, my.txt и MY.TXT это разные файлы (но из-за Win32 API использовать нельзя), это заложено на будущее.

Журналируемая файловая система, т.е. не попадет в противоречивое состояние после сбоев.

Контроль доступа к файлам и каталогам.

Поддержка жестких и символических ссылок.

Поддержка сжатия и шифрования файлов.

Поддержка дисковых квот.

Главная файловая таблица MFT (Master File Table) - главная структура данных в каждом томе, записи фиксированные по 1Кбайту. Каждая запись описывает один каталог или файл. Для больших файлов могут использоваться несколько записей, первая запись называется - базовой записью.

MFT представляет собой обычный файл (размером до 2^48 записей), который может располагаться в любом месте на диске.

Главная файловая таблица MFT, каждая запись ссылается на файл или каталог.

Первые 16 записей MFT зарезервированы для файлов метаданных. Каждая запись описывает нормальный файл, имена этих файлов начинаются с символа "$".

Каждая запись представляет собой последовательность пар (заголовок атрибута, значение).

Некоторые записи метаданных в MFT:

0) Первая запись описывает сам файл MFT, и содержит все блоки файла MFT. Номер первого блока файла MFT содержится в загрузочном блоке.

1) Дубликат файла MFT, резервная копия.

2) Журнал для восстановления, например, перед созданием, удалением каталога делается запись в журнал. Система не попадет в противоречивое состояние после сбоев.

3) Информация о томе (размер, метка и версия)

4) Определяются атрибуты для MFT записей.

6) Битовый массив использованных блоков - для учета свободного места на диске

7) Указывает на файл начальной загрузки

Атрибуты, используемые в записях MFT:

Стандартная информация - флаговые биты (только чтение, архивный), временные штампы и т.д.

Имя файла - имя файла в кодировке Unicode, файлы могут повторятся в формате MS-DOS 8+3.

Список атрибутов - расположение дополнительных записей MFT

Идентификатор объекта - 64-разрядный идентификатор файла, уникальный для данного тома.

Точка повторного анализа - используется для символьных ссылок и монтирования устройств.

Корневой индекс - используется для каталогов

Размещение индекса - используется для очень больших каталогов

Битовый массив - используется для очень больших каталогов

Поток данных утилиты регистрации - используется для шифрования

Данные - поточные данные, может повторяться, используется для хранения самого файла. За заголовком следует список дисковых адресов, определяющий положение файла на диске, если файл очень маленький (несколько сотен байт), то следует сам файл (такой файл называется - непосредственный файл).

Как привило, все данные файла не помещаются в запись MFT.

Дисковые блоки файлам назначаются по возможности в виде серий последовательных блоков (сегментов файлов). В идеале файл должен быть записан в одну серию (не фрагментированный файл), файл, состоящий из n блоков, может быть записан от 1 до n серий.

Запись MFT для 9-блочного файла, состоящего из трех сегментов (серий).
Вся запись помещается в одну запись MFT (файл не сильно фрагментирован).

Заголовок содержит количество блоков (9 блоков).

Каждая серия записывается в виде пары, дисковый адрес - количество блоков (20-4, 64-2, 80-3).

Каждая пара, при отсутствие сжатия, это два 64-разрядные числа (16 байт на пару).

Многие адреса содержат большое количество нулей, сжатие делается за счет убирания нулей в старших байтах. В результате для пары требуется чаще всего 4байта.

Если файл сильно фрагментирован, требуется несколько записей MFT.

Три записи MFT для сильно фрагментированного файла.
В первой записи указывается индексы на дополнительные записи.

Может потребоваться очень много индексов MFT, так что индексы не поместятся в запись. В этом случае список хранится не в MFT, а в файле.

Запись MFT для небольшого каталога

Поиск файла в каталоге по имени состоит в последовательном переборе имен файлов.

Для больших каталогов используется другой формат. Используется дерево В+, обеспечивающее поиск в алфавитном порядке.

3.3.1 Поиск файла по имени

При создании файла, программа обращается к библиотечной процедуре

Этот вызов попадает в совместно используемую библиотеку уровня пользователя kernel32.dll, где \??\ помещается перед именем файла, и получается строка:

Это имя пути передается системному вызову NtFileCreate в качестве параметра.

Этапы поиска файла C:\windows\readmy.txt

3.3.2 Сжатие файлов

Если файл помечен как сжатый, то система автоматически сжимает при записи, а при чтении происходит декомпрессия.

Берутся для изучения первые 16 блоков файла (не зависимо от сегментов файла).

При меняется к ним алгоритм сжатия.

Если полученные данные можно записать хотя бы в 15 блоков, они записываются в сжатом виде.
Если их можно записать только в 16 блоков, то они записываются в несжатом виде.

Алгоритм повторяется для следующих 16 блоков.

Запись MFT для предыдущего файла.

Как видно из рисунка, сжатие приводит к сильной фрагментации.

Чтобы прочитать сжатый блок системе придется распаковать весь сегмент. Поэтому сжатие применяют к 16 блокам, если увеличить количество блоков, уменьшится производительность (но возрастет эффективность сжатия).

3.3.3 Шифрование файлов

Любую информацию, если она не зашифрована, можно прочитать, получив доступ. Поэтому самая надежная защита информации от несанкционированного доступа - шифрование.

Даже если у вас украдут винчестер, прочесть данные не смогут (большинство не сможет).

Если файл помечен как шифрованный, то система автоматически шифрует при записи, а при чтении происходит дешифрация.

Шифрование и дешифрование выполняет не сама NTFS, а специальный драйвер EFS (Encrypting File System).

Каждый блок шифруется отдельно.

ISO 9660 — стандарт, выпущенный Международной организацией по стандартизации, описывающий файловую систему для дисков CD-ROM. Также известен как CDFS (Compact Disc File System). Целью стандарта является обеспечить совместимость носителей под разными операционными системами, такими, как Unix, Mac OS, Windows [1]

Содержание

История

Стандарт выпущен в 1988 году группой компаний под названием High Sierra. High Sierra располагает информацию о файле в последовательной компоновке, чтобы минимизировать непоследовательный доступ с помощью иерархического расположения дерева файловой системы, подобные UNIX и FAT. Для облегчения перекрестной совместимости платформы, она определила минимальный набор общих атрибутов файла (каталог или обычный файл и время записи), имя атрибутов (имя, расширение и версию), и использование отдельной области использования системы, где могут быть указаны будущие дополнительные расширения для каждого файла. High Sierra был принят в декабре 1986 года в качестве международного стандарта Ecma International (ECMA-119) и представлен для быстрого отслеживания в ISO, который в 1988 году был принят в качестве стандарта ISO 9660.

В 2013 году была опубликована «Поправка 1» к стандарту ISO 9660,а именно, внедрение новых структур данных и гибких правил имен файлов, предназначенных для согласования между ISO 9660 и широко используемой Joliet Спецификацией.

Характеристики и общая структура

файловая система ISO 9660

Системная область (32768 Б) Область данных
Не используется в ISO 9660 Объем набора дескриптора Путь таблицы, директории, файлы


Системная область включает 32768 байтов данных диска (16 секторов по 2,048 байт каждый), не используется в ISO 9660 и поэтому доступна для использования в других целях. Например, CD-ROM может содержать альтернативный дескриптор файловой системы в этой области, так как она часто используется в гибридных компакт-дисках, чтобы предложить Mac OS- специализированное содержание. Все мульти-байтовые значении сохраняются дважды, в прямой порядок байтов и большой прямой порядок байтов, либо один после другого при том, что спецификация называется «запрос обоих байтов»( both-byte orders), или в дублированных структурах данных, таких как таблицы пути.

Область данных начинается с набором из одного или более дескрипторов тома, завершается объемом идентификатора конца набора дескрипторов тома. В совокупности объем дескрипторов тома выступает в качестве заголовка для области данных, описывающего его содержание (по аналогии с блоком параметров BIOS, используемой FAT и NTFS).

Множество «терминаторов» объема дескриптора является просто определенным типом дескриптора тома, используемого с целью маркировки конца этого набора структур.

Дескриптор тома

Каждый дескриптор тома составляет 2048 байт. Они имеют следующую структур

← 2,048 байта →

Составляющие Тип Версия (всегда 0x01) Идентификатор (всегда 'CD001') Данные
Размеры 1 байт 5 байт 1 байт 2,041 байт

Поле данных дескриптора тома может быть подразделено на несколько полей, причем точное содержание определяется в зависимости от типа. Стандартные типы дескрипторов тома являются следующие:

Тип значения поля Тип
0 Загрузочная запись дескриптора тома
1 Первичный объем дескриптора
2 Дополнительный объем дескриптора
3 Объем дескриптор раздела
255 Идентификатор конца набора дескрипторов тома

Совместимый диск ISO 9660 содержит, по меньшей мере, один основной том, описывающий файловую систему и идентификатор конца набора дескрипторов тома для указания конца последовательности дескрипторов. Первичный объем дескриптора содержит информацию об объеме, характеристиках и метаданных, в том числе запись корневого каталога, который указывает, в каком секторе корневой каталог находится. Другие поля содержат описание или имя тома, а также информацию о том, кто его создал, и с помощью какого приложение. Размер логических блоков файловая система использует для сегмента, объем также сохраняется в поле внутри дескриптора первичного тома, а также объем пространства, занимаемого объема (измеряется в количестве логических блоков).

Могут быть созданы дополнительные дескрипторы тома, которые описывают один и тот же объем и, как правило, используются для предоставления дополнительной поддержки кодовой страницы, когда стандартные кодовые таблицы являются недостаточными. ISO 9660 поддерживает международные однобайтные и мульти-байтовые наборы символов, при условии, что они вписываются в рамки стандартов ISO 2022 и ISO 2375. Однако, ISO 9660 не определяет никаких кодовых страниц, которые бы гарантированно поддерживались.

Спецификация и Ограничения

Существует несколько уровней спецификации [2]

  • Уровень 1: Имена файлов ограничены восемью символами и тремя символами расширения. В именах используются только буквы латинского алфавита. Фрагментация файлов не допускается, файл может располагаться только в непрерывной цепочке секторов. Имена директорий должны содержать не более 8 символов. Максимальная глубина вложенных директорий — до 8.
  • Уровень 2: Имена файлов ограничены 32 символами. Набор символов в именах не ограничен.
  • Уровень 3: Файлы могут быть фрагментированы (это необходимо для пакетной или инкрементной записи CD).

Стандарт также определяет следующие ограничения имен:

Нередко можно встретить, что отформатированный диск не может быть больше, чем 2 32 -1 в размере, поскольку размер файла сохранен в без знаковом 32 битном значении, для которого 2 32 -1 является максимальным. Однако это ограничение можно обойти с помощью функции и-фрагментации. При этом, файлы размером более 4 ГБ, можно разделить на несколько последовательный секторов, каждый из которых не превышает предел 4 ГБ. Еще одно, но менее распространенное ограничение - это количество каталогов. ISO образ имеет структуру, называемую "путь таблицы". Для каждого каталога в изображении, эта таблица дает номер входа родительского каталога. Проблема заключается в том, что число родительских каталогов представляет собой 16-битное число, что ограничивает его диапазон от 1 до 65,535.

Расширения и улучшения

Есть несколько расширений к ISO 9660, с помощью которых снимаются некоторые ограничения [3]

Rock Ridge поддерживает сохранение POSIX разрешений и длинных имен.

Joliet поддерживает имена Unicode, сохраненные в UCS-2, таким образом, что позволяет использовать практически любой символ, который будет использоваться ( даже нелатинский).

В Apple ISO 9660 добавлена поддержка Mac-OS-специфических характеристик файлов, таких как раздел файла (вилка ресурса), резервное копирование файлов и т.д.

Так же существует несколько стандартов, разработанных в качестве расширения стандарта ISO 9660: ISO 13490 является расширением формата ISO 9660, который добавляет поддержку нескольких сеансов на диске, был создан, чтобы позволить добавлять больше файлов на записываемый диск.

Стандарт ISO 13346 (ECMA-167) разработан в сочетании со стандартом ISO 13490 для решения большинства недостатков ISO 9660.

А так же разработан, но еще пока не ратифицирован в качестве стандарта ISO, стандарт JIS X 0606:1998 (также известный как ISO 9660: 1999). Данный стандарт создан для того, чтобы сделать некоторые улучшения и устранить некоторые ограничения для оригинального ISO 9660 (увеличение длины имени файла и т.д.).

Поддержка стандарта операционными системами

Операционные системы, которые поддерживают ISO 9660 и его расширения следующее:

Читайте также: