Как перезаписать файл с

Обновлено: 07.07.2024

С помощью функции file_get_contents() можно получить содержимое файла:

Также мы можем получить html-код какой-либо страницы в интернете:

Но работает это далеко не для всех сайтов, у многих есть защита от такого примитивного парсинга.

Чтение файла: file()

Функция file() позволяет получить содержимое файла в виде массива. Разделителем элементов является символ переноса строки.

Создадим в корне сайта файл data.txt со следующим содержимым:

Теперь запустим скрипт index.php со следующим кодом:

При запуске этого скрипта мы получим в браузере:

Заметили, что у первых двух строк длина 7 символов вместо пяти? Это из-за того, что каждая строка содержит в конце символы переноса строки.

Чаще всего они нам не нужны, поэтому их можно убрать, передав вторым параметром константу FILE_IGNORE_NEW_LINES :

Теперь у всех строк будет по 5 символов.

Если нам необходимо получить только заполненные строки в файле и пропустить пустые, можно передать вторым параметром константу FILE_SKIP_EMPTY_LINES :

Разумеется, мы можем передать сразу две константы:

Создание файла и запись в файл: file_put_contents()

Функция file_put_contents() позволяет создать файл и заполнить его данными.

Первым параметром функция принимает путь к файлу, вторым - строку с данными. Для создания пустого файла нужно передать вторым параметром пустую строку.

Если файла не существует - он будет создан. Если существует - данные в файле будут перезаписаны.

Чтобы не перезаписывать данные, а добавить их в конец файла, нужно передать третьим параметром константу FILE_APPEND :

Также вторым параметром можно передать массив:

Но этот вариант не очень удобен, поскольку все элементы массива запишутся подряд, без каких-либо разделителей. Чтобы их добавить, можно использовать функцию implode:

Создание папки или структуры папок

Создать папку можно с помощью функции mkdir() (make directory):

Вторым параметром указываются права доступа к файлу в виде восьмеричного числа, по-умолчанию это 0777 , что означает самые широкие права. Для Windows этот аргумент игнорируется.

Кроме этого, второй параметр может игнорироваться при заданной umask (пользовательская маска (user mask), которая нужна для определения конечных прав доступа). В этом случае принудительно сменить права можно функцией chmod() :

Также мы можем создать структуру папок рекурсивно, для этого нужно третьим параметром передать true :

Но в этом случае права доступа будут заданы только для конечной папки. Для изменения прав у каждой из папок придётся указывать права вручную:

Права доступа - это отдельная объёмная тема, поэтому сейчас мы её пока рассматривать не будем.

Проверка существования файла или папки

Проверить существование папки или файла можно с помощью функции file_exists() :

Если вы хотите проверить существование только папки или только файла, для этого есть специальные функции is_dir() и is_file() :

Проверка прав доступа

Функции is_readable() и is_writable() проверяют, есть ли у пользователя, от имени которого запущен PHP, права на чтение и запись файла или папки:

Копирование, перенос и удаление файла

Для удаления файлов используется функция unlink() :

Чтобы скопировать файл, используем функцию copy() :

Для переименования и переноса файла в другую папку используется функция rename() :

Работа с файлами с помощью fopen()

Функций file() , file_get_contents() и file_put_contents() достаточно для решения большинства задач, связанных с управлением файлами.

Но иногда возникают ситуации, когда нам необходимы более продвинутые инструменты. Например, если у нас есть большой текстовый файл и мы хотим читать его построчно, а не весь сразу, для экономии оперативной памяти.

Итак, открыть (или создать и открыть) файл можно с помощью функции fopen() :

Функция fopen() возвращает так называемый лескриптор. Это ссылка, указатель на файл, его мы будем передавать в другие функции. Кстати, тип данных этого дескриптора - resource .

Первым параметром мы передаём путь к файлу, вторым - модификатор доступа к файлу. Ниже перечислены наиболее популярные модификаторы:

r - открытие для чтения, указатель переходит в начало файла.
r+ - открытие для чтения и записи, указатель переходит в начало файла.
w - открытие для записи, указатель переходит в начало файла. Если файла нет - создаётся, если есть - очищается от данных.
w+ - открытие для чтения и записи, в остальном аналогичен w .
a - открытие для записи, указатель переходит в конец файла. Если файла нет - создаётся.
a+ - открытие для чтения и записи, в остальном аналогичен a .
x - создание и открытие для записи, указатель переходит в начало файла. Если файл существует - PHP покажет ошибку.
x+ - создание и открытие для чтения и записи, в остальном аналогичен x .

Указатель - это нечто вроде курсора. Вы можете переместить его в любое место файла, чтобы добавить или отредактировать определённые данные.

Для записи данных в файл существует функция fwrite() . Давайте попробуем создать файл и записать в него какие-нибудь данные:

Заметьте, из-за модификатора w при каждом запуске скрипта данные в файле стираются и добавляются заново. Если модификатор заменить на a , данные будут не перезаписываться, а добавляться в конец файла.

Для построчного чтения файла используется функция fgets() :

При каждом запуске fgets получает следующую строку и возвращает её в $line . Вторым параметром передаётся максимальная длина строки. Это означает, что если строка слишком длинная, она будет обрезана.

Также в PHP существует множество других полезных функций, работающих с дескриптором файла. Почитать о них можно в документации.

Для удобства обращения информация в запоминающих устройствах хранится в виде файлов.

Файл – именованная область внешней памяти, выделенная для хранения массива данных. Данные, содержащиеся в файлах, имеют самый разнообразный характер: программы на алгоритмическом или машинном языке; исходные данные для работы программ или результаты выполнения программ; произвольные тексты; графические изображения и т. п.

Каталог ( папка , директория ) – именованная совокупность байтов на носителе информации, содержащая название подкаталогов и файлов, используется в файловой системе для упрощения организации файлов.

Файловой системой называется функциональная часть операционной системы, обеспечивающая выполнение операций над файлами. Примерами файловых систем являются FAT (FAT – File Allocation Table, таблица размещения файлов), NTFS, UDF (используется на компакт-дисках).

Существуют три основные версии FAT: FAT12, FAT16 и FAT32. Они отличаются разрядностью записей в дисковой структуре, т.е. количеством бит, отведённых для хранения номера кластера. FAT12 применяется в основном для дискет (до 4 кбайт), FAT16 – для дисков малого объёма, FAT32 – для FLASH-накопителей большой емкости (до 32 Гбайт).

Рассмотрим структуру файловой системы на примере FAT32.

Файловая структура FAT32

Устройства внешней памяти в системе FAT32 имеют не байтовую, а блочную адресацию. Запись информации в устройство внешней памяти осуществляется блоками или секторами.

Сектор – минимальная адресуемая единица хранения информации на внешних запоминающих устройствах. Как правило, размер сектора фиксирован и составляет 512 байт. Для увеличения адресного пространства устройств внешней памяти сектора объединяют в группы, называемые кластерами.

Кластер – объединение нескольких секторов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами. Основным свойством кластера является его размер, измеряемый в количестве секторов или количестве байт.

Файловая система FAT32 имеет следующую структуру.

Нумерация кластеров, используемых для записи файлов, ведется с 2. Как правило, кластер №2 используется корневым каталогом, а начиная с кластера №3 хранится массив данных. Сектора, используемые для хранения информации, представленной выше корневого каталога, в кластеры не объединяются.
Минимальный размер файла, занимаемый на диске, соответствует 1 кластеру.

Загрузочный сектор начинается следующей информацией:

EB 58 90 – безусловный переход и сигнатура;
4D 53 44 4F 53 35 2E 30 MSDOS5.0;
00 02 – количество байт в секторе (обычно 512);
1 байт – количество секторов в кластере;
2 байта – количество резервных секторов.

Кроме того, загрузочный сектор содержит следующую важную информацию:

0x10 (1 байт) – количество таблиц FAT (обычно 2);
0x20 (4 байта) – количество секторов на диске;
0x2С (4 байта) – номер кластера корневого каталога;
0x47 (11 байт) – метка тома;
0x1FE (2 байта) – сигнатура загрузочного сектора ( 55 AA ).

Сектор информации файловой системы содержит:

0x00 (4 байта) – сигнатура ( 52 52 61 41 );
0x1E4 (4 байта) – сигнатура ( 72 72 41 61 );
0x1E8 (4 байта) – количество свободных кластеров, -1 если не известно;
0x1EС (4 байта) – номер последнего записанного кластера;
0x1FE (2 байта) – сигнатура ( 55 AA ).

Таблица FAT содержит информацию о состоянии каждого кластера на диске. Младшие 2 байт таблицы FAT хранят F8 FF FF 0F FF FF FF FF (что соответствует состоянию кластеров 0 и 1, физически отсутствующих). Далее состояние каждого кластера содержит номер кластера, в котором продолжается текущий файл или следующую информацию:

00 00 00 00 – кластер свободен;
FF FF FF 0F – конец текущего файла.

Корневой каталог содержит набор 32-битных записей информации о каждом файле, содержащих следующую информацию:

8 байт – имя файла;
3 байта – расширение файла;

8 байт – имя файла;
3 байта – расширение файла;
1 байт – атрибут файла:
1 байт – зарезервирован;
1 байт – время создания (миллисекунды) (число от 0 до 199);
2 байта – время создания (с точностью до 2с):
2 байта – дата создания:
2 байта – дата последнего доступа;
2 байта – старшие 2 байта начального кластера;
2 байта – время последней модификации;
2 байта – дата последней модификации;
2 байта – младшие 2 байта начального кластера;
4 байта – размер файла (в байтах).

В случае работы с длинными именами файлов (включая русские имена) кодировка имени файла производится в системе кодировки UTF-16. При этого для кодирования каждого символа отводится 2 байта. При этом имя файла записывается в виде следующей структуры:

1 байт последовательности;
10 байт содержат младшие 5 символов имени файла;
1 байт атрибут;
1 байт резервный;
1 байт – контрольная сумма имени DOS;
12 байт содержат младшие 3 символа имени файла;
2 байта – номер первого кластера;
остальные символы длинного имени.

Далее следует запись, включающая имя файла в формате 8.3 в обычном формате.

Работа с файлами в языке Си

Для программиста открытый файл представляется как последовательность считываемых или записываемых данных. При открытии файла с ним связывается поток ввода-вывода . Выводимая информация записывается в поток, вводимая информация считывается из потока.

Когда поток открывается для ввода-вывода, он связывается со стандартной структурой типа FILE , которая определена в stdio.h . Структура FILE содержит необходимую информацию о файле.

Открытие файла осуществляется с помощью функции fopen() , которая возвращает указатель на структуру типа FILE , который можно использовать для последующих операций с файлом.

"r" — открыть файл для чтения (файл должен существовать);
"w" — открыть пустой файл для записи; если файл существует, то его содержимое теряется;
"a" — открыть файл для записи в конец (для добавления); файл создается, если он не существует;
"r+" — открыть файл для чтения и записи (файл должен существовать);
"w+" — открыть пустой файл для чтения и записи; если файл существует, то его содержимое теряется;
"a+" — открыть файл для чтения и дополнения, если файл не существует, то он создаётся.

Функция fclose() закрывает поток или потоки, связанные с открытыми при помощи функции fopen() файлами. Закрываемый поток определяется аргументом функции fclose() .

Возвращаемое значение: значение 0, если поток успешно закрыт; константа EOF , если произошла ошибка.

Чтение символа из файла:

Аргументом функции является указатель на поток типа FILE . Функция возвращает код считанного символа. Если достигнут конец файла или возникла ошибка, возвращается константа EOF .

Запись символа в файл:

Аргументами функции являются символ и указатель на поток типа FILE . Функция возвращает код считанного символа.

Функции fscanf() и fprintf() аналогичны функциям scanf() и printf() , но работают с файлами данных, и имеют первый аргумент — указатель на файл.

Функции fgets() и fputs() предназначены для ввода-вывода строк, они являются аналогами функций gets() и puts() для работы с файлами.

Копирует строку в поток с текущей позиции. Завершающий нуль- символ не копируется.
Пример Ввести число и сохранить его в файле s1.txt. Считать число из файла s1.txt, увеличить его на 3 и сохранить в файле s2.txt.

Возможно ли на С++ реализовать алгоритм перезаписи файла (в данном контексте - безвозвратное стирание файла). Если да, то как (т. е. нужен ли тут очень большой код или это можно просто реализовать парой функций)?

Даже подписал тебе всё:

Т. е. Вы просто заменяете содержимое файл всякой хренью? Такой код я бы и сам мог написать (просто думал нужно другому как-то), но всё равно большое спасибо.

Вечнозелёный Мудрец (16490) Можешь хрень раза по три в файл сгенерировать. Вообще все магнитные остатки старой инфы затрутся.

Речь идёт о безвозвратном удалении файлов. Разные там подходы: 1 подход перезаписи, 3 подхожа, 7 подходов (NSA) и т. д.

Pinhead Просветленный (28581) я имею ввиду своей.

Да никаких проблем.

Прочитать размер файла.
Открыть файл на запись.
Записать в него столько мусора (random), сколько в нём было размера.
Закрыть файл.
Удалить файл.
Создать файл с таким же именем.
Записать в него пару байт.
Закрыть файл
Удалить файл.

Размер мусора должен быть равным размеру файла для этого?
И как тогда генерировать случайный код?

Случайный код - это разве всего лишь цифры (судя по random) или ещё и символы?
И этот алгоритм не похож на работу программ (механизм перезаписи) типа Resiva.

Тащемта на плюсах можно что угодно написать :)
Для многоразовой затирки файла, по-хорошему нужно влазить на уровень ядра или хотя бы фс, чтобы взаимодействовать с железякой более-менее напрямую. Банальная запись всякой фигни несколько по дескриптору файла не гарантирует ничего, т. к. является абстракцией файла, а перезаписывать много раз нужно секторы жесткого диска, где этот файл располагается, а не сам файл. В случае с наивными решениями выше есть куча подводных камней:
а) операционка может решить записать сгенеренный бред вообще в другое место жесткого диска.
б) весь бред может на самом деле писаться в буфер и сброситься на жд только после закрытя файла, т. е. никакой многоразовой записи не произойдет.

И как же тогда "взаимодействовать с железякой напрямую" правильно?
Код, если можно.

Duality Просветленный (29269) >И как же тогда "взаимодействовать с железякой напрямую" правильно? А это уже целиком и полностью зависит от ОС, ФС и железяки. Советую накатить какой-нибудь линукс и покурить как в нем устроена работа с блочными устройствами. Думаю все должно обойтись без особо извращенных ковыряний, просто модулем ядра. >Код, если можно. На лине есть утила shred, которая как раз занимается сабжем. Можно почитать ее сырцы и узнать как она работает.

Чтобы указать конкретное имя файла и открыть его необходимо выполнить следующее действие с данной ссылкой - myfile .

1) Если файл будет находиться в той же директории что и программа то задаем имя командой

2) Если файл будет находиться например на диске то задаем имя файла следующим образом:

a) можно использовать символ / (обратный слэшь) для задания пути

myfile .open (" E: / DEVELOP / MyCodingSite / C++ / IO / WriteRead / Win32 / Debug / Mytext.txt ");

б) чтобы использовать стандартный символ \ его нужно удваивать ( \\) иначе система не распознает данный символ.

myfile .open (" E: \\ DEVELOP \\ MyCodingSite \\ C++ \\ IO \\ WriteRead \\ Win32 \\ Debug \\ Mytext.txt ");

Указывая имя файла или полный путь к файлу мы связываем его с файловой системой. Если файла не существует то операционная система его создаст сама если файл существует то он будет открыт.

Функция Open встроенная в тип данных fstream содержит набор флагов позволяющих открывать файлы в разных режимах доступа. Чтобы задать один из режимов необходимо явно указать флаг доступа к файлу.

myfile .open (" Имя файла " , флаг доступа к файлу );

Если флаг не указан то система открывает файл с полным доступом по умолчанию.

Когда мы связались с файловой системой и указали имя файла которое нужно использовать. Нам открывается возможность выполнять различные действия:

Для записи данных в файл мы нужно открыть его с флагом ios::app это сообщит файловой системе что мы просто будем дописывать в конец файла информацию. Если флаг опустить то файл будет перезаписан заново. Т.е. содержимое исчезнет и останется только наш текст.

записываем текст в файл myfile << "My Ferst Text in file";

Этот код создаст файл с именем Mytext.txt в той же директории где находиться наш скомпилированный проект и запишет в него строку My Ferst Text in file

Для чтения файла нужно открыть его с флагом ios::in это сообщит файловой системе что мы просто будем читать информацию но не сможем ее записывать

При открытии файла на чтении нужно проверить смогла ли ОС (операционная система выполнить данное действие).

а) Если нет то сообщим что нет такого файла.

б) Если да будем пробовать читать содержимое файла.

Для проверки открылся файл или нет нужно использовать встроенную в функцию is_open() она встроена в тип данных ofstream.

Если файл открылся то функция вернет true (правду 1) если нет то false (ложь 0)

Читайте также: