Документ это текстовый файл в формате ascii который содержит

Обновлено: 04.07.2024

A текстовый файл (иногда пишется текстовый файл ; старое альтернативное имя - плоский файл ) - это разновидность компьютерного файла , который имеет структуру последовательность строк из электронного текста . Существует текстовый файл , хранящийся как данные в компьютерной файловой системе . В таких операционных системах, как CP / M и MS-DOS , где операционная система не отслеживает размер файла в байтах, конец текстового файла обозначается помещением один или несколько специальных символов, известных как маркер конца файла , как заполнение после последней строки в текстовом файле. В современных операционных системах, таких как Microsoft Windows и Unix-подобные системы , текстовые файлы не содержат каких-либо специальных символов EOF, поскольку файловые системы в этих операционных системах отслеживают размер файла в байты. Для большинства текстовых файлов необходимо иметь разделители end-of-line , которые выполняются несколькими способами в зависимости от операционной системы. Некоторые операционные системы с ориентированными на записи файловыми системами могут не использовать новые разделители строк и будут в основном хранить текстовые файлы с разделенными строками как записи фиксированной или переменной длины.

«Текстовый файл» относится к типу контейнера, а обычный текст относится к типу содержимого.

На общем уровне описания существует два типа компьютерных файлов: текстовые файлы и двоичные файлы .

Содержание

Данные storage

Стилизованное графическое изображение CSV -форматированного текстового файла .

Из-за своей простоты текстовые файлы обычно используются для хранения информации. Они позволяют избежать некоторых проблем, возникающих с другими форматами файлов, таких как порядок байтов , байты заполнения или различия в количестве байтов в машинном слове . Кроме того, когда повреждение данных происходит в текстовом файле, часто бывает проще восстановить и продолжить обработку оставшегося содержимого. Недостатком текстовых файлов является то, что они обычно имеют низкую энтропию , что означает, что информация занимает больше места для хранения, чем это строго необходимо.

Простой текстовый файл может не нуждаться в дополнительных метаданных (кроме знания его набора символов ), чтобы помочь читателю в интерпретации. Текстовый файл может вообще не содержать данных, что является случаем файла с нулевым байтом .

Кодировка

Набор символов ASCII является наиболее распространенным совместимым подмножеством символов. задается для текстовых файлов на английском языке и обычно считается форматом файла по умолчанию во многих ситуациях. Он охватывает американский английский, но для британского знака фунта , знака евро или символов, используемых за пределами английского языка, необходимо использовать более богатый набор символов. Во многих системах это выбирается на основе настройки локали по умолчанию на компьютере, с которого выполняется чтение. До UTF-8 это были традиционно однобайтовые кодировки (например, от ISO-8859-1 до ISO-8859-16 ) для европейских языков и широкие символы кодировки для азиатских языков.

Поскольку кодировки обязательно имеют только ограниченный набор символов, часто очень маленький, многие из них могут использоваться только для представления текста в ограниченном подмножестве человеческих языков. Unicode - это попытка создать общий стандарт для представления всех известных языков, а наиболее известные наборы символов являются подмножествами очень большого набора символов Unicode. Хотя для Unicode доступно несколько кодировок символов, наиболее распространенной является UTF-8 , которая имеет преимущество обратной совместимости с ASCII; то есть каждый текстовый файл ASCII также является текстовым файлом UTF-8 с идентичным значением. UTF-8 также имеет то преимущество, что легко обнаруживается автоматически . Таким образом, общий режим работы программного обеспечения, поддерживающего UTF-8, при открытии файлов с неизвестной кодировкой - сначала попробовать UTF-8 и вернуться к устаревшей кодировке, зависящей от локали, если это определенно не UTF-8.

Форматы

В большинстве операционных систем текстовый файл имени относится к формату файла, который допускает только текстовый контент с очень небольшим форматированием (например, без полужирный или курсив шрифты). Такие файлы можно просматривать и редактировать на текстовых терминалах или в Simple. Текстовые файлы обычно имеют тип MIME text / plain , обычно с дополнительной информацией, указывающей кодировку.

Текстовые файлы Microsoft Windows

MS-DOS и Microsoft Windows используют общий формат текстового файла, в котором каждая строка текста разделена комбинацией из двух символов: возврат каретки (CR) и перевод строки (LF). Обычно последняя строка текста не заканчивается маркером CR-LF, и многие текстовые редакторы (включая Блокнот ) не вставляют его автоматически в последнюю строку.

В операционных системах Microsoft Windows файл рассматривается как текстовый файл, если суффикс имени файла («расширение имени файла ») равен .txt . Однако многие другие суффиксы используются для текстовых файлов с определенными целями. Например, исходный код компьютерных программ обычно хранится в текстовых файлах с суффиксами к именам файлов, указывающими на язык программирования , на котором написан исходный текст.

Текстовые файлы Unix

В Unix-подобных операционных системах формат текстовых файлов точно описан: POSIX определяет текстовый файл как файл, содержащий символы, сгруппированные в ноль или больше строк, где строки представляют собой последовательности из нуля или более символов, отличных от новой строки, плюс завершающий символ новой строки, обычно LF.

Кроме того, POSIX определяет файл для печати как текстовый файл, символы которого можно печатать, пробелами или обратными пробелами в соответствии с региональными правилами. Это исключает большинство управляющих символов, которые не печатаются.

Текстовые файлы Apple Macintosh

До появления Mac OS X (теперь называется macOS) классическая система Mac OS считала содержимое файла (ветвь данных) текстовым файлом, когда его ветвь ресурсов указывала, что тип файла был «ТЕКСТ». Строки текстовых файлов Macintosh заканчиваются символами CR.

Рендеринг

При открытии текстовым редактором удобочитаемое содержимое отображается в Пользователь. Часто это простой текст файла, видимый пользователю. В зависимости от приложения управляющие коды могут отображаться либо как буквальные инструкции, выполняемые редактором, либо как видимые escape-символы , которые можно редактировать как обычный текст. Хотя в текстовом файле может быть простой текст, управляющие символы в файле (особенно символ конца файла) могут отображать простой текст, невидимый определенным методом.

Текстовым файлам противопоставляются двоичные файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текста (например, файлы, хранящие закодированные звук или изображение).

В отличие от термина «текстовый формат», характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.

Содержание

Описание

Текстовой файл может содержать как форматированный, так и неформатированный текст.

Преимущества и недостатки

Форматы, основанные на текстовых файлах

В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, логов). Текстовый формат служит основой для многих более специализированных форматов (например, .ini, SGML, HTML, XML, TeX, исходных текстов языков программирования).

Расширения имён файлов

В DOS и Windows для файлов с неформатированным текстом обычно используется расширение .txt. Тем не менее, текстовыми могут являться файлы с любым другим расширением или без оного. Например, исходные коды программ обычно хранятся в файлах с расширениями, соответствующими языку программирования, на котором написаны программы (.bas, .pas, .c).

Кодировки

Unicode в текстовых файлах

Управляющие символы

Помимо названных, в текстовых файлах применяются такие символы, как табуляция (код 9) и перевод страницы (код 12).

См. также

Примечания

  • Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное.
  • Проставив сноски, внести более точные указания на источники.
  • Форматы файлов
  • Форматы текстовых документов
  • Форматы электронных книг

Wikimedia Foundation . 2010 .

Полезное

Смотреть что такое "Текстовый файл" в других словарях:

Файл (компьютер) — Файл (англ. file папка, скоросшиватель) концепция в вычислительной технике: сущность, позволяющая получить доступ к какому либо ресурсу вычислительной системы и обладающая рядом признаков: фиксированное имя (последовательность символов, число или … Википедия

файл инициализации — Специальный текстовый файл, используемый при загрузке среды и отдельных программ для начальной установки параметров. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в … Справочник технического переводчика

Как открывать, редактировать и конвертировать текстовые файлы

Некоторые текстовые файлы используют расширение файла .TXT и не содержат изображений, но другие могут содержать как изображения, так и текст, но при этом называться текстовым файлом или даже сокращенно как «текстовый файл», что может сбивать с толку.

Типы текстовых файлов

В общем смысле текстовый файл относится к любому файлу, который имеет текст only и не содержит изображений и других нетекстовых символов. Иногда они используют расширение файла TXT, но не обязательно. Например, документ Word, который представляет собой эссе, содержащее только текст, может быть в формате файла DOCX, но все еще называться текстовым файлом.

Конечно, файлы с расширением .TXT также являются текстовыми и обычно используются для хранения вещей, которые можно легко открыть в любом текстовом редакторе или записать с помощью простого скрипта. Примеры могут включать в себя хранение пошаговых инструкций о том, как что-то использовать, место для хранения временной информации или журналы, созданные программой (хотя они обычно хранятся в файле LOG).

Как открыть текстовый файл

Все текстовые редакторы должны иметь возможность открывать любой текстовый файл, особенно если не используется никакого специального форматирования. Например, файлы TXT можно открыть с помощью встроенной программы «Блокнот» в Windows, щелкнув файл правой кнопкой мыши и выбрав Изменить . Аналогично для TextEdit на Mac.

Большинство веб-браузеров и мобильных устройств также могут открывать текстовые файлы. Однако, поскольку большинство из них не предназначены для загрузки текстовых файлов с использованием различных расширений, которые вам нравятся, вам может понадобиться сначала переименовать расширение файла в .TXT, если вы хотите использовать эти приложения для чтения файла.

Некоторые другие текстовые редакторы и средства просмотра включают Microsoft Word, TextPad, Notepad2, Geany и Microsoft WordPad.

Дополнительные текстовые редакторы для macOS включают BBEdit и TextMate. Пользователи Linux также могут попробовать открыватели/редакторы Leafpad, gedit и KWrite.

Откройте любой файл как текстовый документ

Здесь нужно еще кое-что понять: файл любой можно открыть как текстовый документ, даже если он не содержит читаемый текст. Это полезно, если вы не уверены, в каком формате он находится, например, если в нем отсутствует расширение файла или вы думаете, что оно было идентифицировано с неправильным расширением файла.

Например, вы можете открыть аудиофайл MP3 в виде текстового файла, подключив его к текстовому редактору, такому как Notepad ++. Вы не можете воспроизводить MP3 таким образом, но вы можете видеть, из чего он состоит, в текстовой форме, поскольку текстовый редактор может отображать данные только в виде текста.

В частности, для MP3-файлов самая первая строка должна содержать «ID3», чтобы указать, что это контейнер метаданных, который может хранить такую ​​информацию, как исполнитель, альбом, номер дорожки и т. Д.

Как конвертировать текстовые файлы

Например, упомянутая выше программа Notepad ++ способна сохранять в огромное количество форматов файлов, таких как HTML, TXT, NFO, PHP, PS, ASM, AU3, SH, BAT, SQL, TEX, VGS, CSS, CMD, REG. , URL, HEX, VHD, PLIST, JAVA, XML и KML.

Другие программы, которые экспортируют в текстовый формат, могут, вероятно, сохранять в несколько различных типов, обычно TXT, RTF, CSV и XML.Поэтому, если вам нужен файл из определенной программы в новом текстовом формате, рассмотрите возможность возврата к приложению, в котором был создан исходный текстовый файл, и экспортируйте его во что-нибудь другое.

Также посмотрите наш список бесплатных программ для конвертации документов, чтобы узнать о некоторых дополнительных конвертерах файлов, которые работают с различными типами текстовых файлов.

Ваш файл все еще не открывается?

Вы видите беспорядочный текст при открытии файла? Возможно большинство, если это, или все это, полностью нечитаемо. Наиболее вероятная причина этого заключается в том, что файл не является простым текстом.

Как мы упоминали выше, вы можете открыть любой файл с помощью Notepad ++, но, как и в примере с MP3, это не означает, что вы можете использовать файл там. Если вы попробуете свой файл в текстовом редакторе, и он не будет отображаться так, как вы думаете, он должен переосмыслить способ его открытия; это, вероятно, не в формате файла, который может быть объяснен в удобочитаемом тексте.

Если вы не знаете, как должен открываться ваш файл, попробуйте некоторые популярные программы, которые работают с различными форматами. Например, хотя Notepad ++ отлично подходит для просмотра текстовой версии файла, попробуйте перетащить файл в медиаплеер VLC, чтобы проверить, содержит ли он медиафайл, содержащий видео или звуковые данные.

несколько текстовых файлов в Windows 10

Текстовый файл — это файл, содержащий текст, но есть несколько разных способов обдумать это, поэтому важно знать, какой текстовый документ у вас есть, прежде чем иметь дело с программой, которая может открыть или преобразовать его.

несколько текстовых файлов в Windows 10

Некоторые текстовые файлы используют расширение файла .TXT и не содержат изображений. Другие могут содержать как изображения, так и текст, но все же называться текстовым файлом или даже сокращенно как «текстовый файл», что может сбивать с толку.

Типы текстовых файлов

В общем смысле текстовый файл относится к любому файлу, который имеет только текст и не содержит изображений и других нетекстовых символов. Иногда они используют расширение файла TXT, но не обязательно. Например, документ Word, который представляет собой эссе, содержащее только текст, может быть в формате файла DOCX , но все еще называться текстовым файлом.

Другим видом текстового файла является файл «обычный текст». Это файл, который содержит нулевое форматирование (в отличие от файлов RTF ), что означает, что ничто не выделено жирным шрифтом, курсивом, подчеркнутым, цветным, с использованием специального шрифта и т. Д. Несколько примеров форматов простых текстовых файлов включают в себя те, которые заканчиваются на XML , REG , BAT , PLS , M3U , M3U8 , SRT , IES , AIR , STP, XSPF , DIZ , SFM , ТЕМА и TORRENT .

Конечно, файлы с расширением .TXT также являются текстовыми и обычно используются для хранения вещей, которые можно легко открыть в любом текстовом редакторе или записать с помощью простого скрипта. Примеры могут включать в себя хранение пошаговых инструкций о том, как что-то использовать, место для хранения временной информации или журналы, сгенерированные программой (хотя они обычно хранятся в файле LOG ).

Как открыть текстовый файл

Все текстовые редакторы должны иметь возможность открывать любой текстовый файл, особенно если не используется никакого специального форматирования. Например, файлы TXT можно открыть с помощью встроенной программы «Блокнот» в Windows, щелкнув файл правой кнопкой мыши и выбрав « Редактировать» . Аналогично для TextEdit на Mac.

Еще одна бесплатная программа, которая может открыть любой текстовый файл — это Notepad ++ . После установки вы можете щелкнуть файл правой кнопкой мыши и выбрать « Редактировать с помощью Notepad ++» .

Большинство веб-браузеров и мобильных устройств также могут открывать текстовые файлы. Однако, поскольку большинство из них не предназначены для загрузки текстовых файлов с использованием различных расширений, которые вам нравятся, вам может понадобиться сначала переименовать расширение файла в .TXT, если вы хотите использовать эти приложения для чтения файла.

Некоторые другие текстовые редакторы и средства просмотра включают Microsoft Word, TextPad , Notepad2 , Geany и Microsoft WordPad.

Дополнительные текстовые редакторы для macOS включают BBEdit и TextMate . Пользователи Linux могут также попробовать открыватели / редакторы Leafpad , gedit и KWrite .

Откройте любой файл как текстовый документ

Здесь нужно еще кое-что понять: любой файл можно открыть как текстовый документ, даже если он не содержит читаемого текста. Это полезно, если вы не уверены, в каком формате он находится, например, если в нем отсутствует расширение файла или вы думаете, что оно было идентифицировано с неверным расширением файла.

Например, вы можете открыть аудиофайл MP3 в виде текстового файла, подключив его к текстовому редактору, такому как Notepad ++. Вы не можете воспроизводить MP3 таким образом, но вы можете видеть, из чего он состоит, в текстовой форме, поскольку текстовый редактор может отображать данные только в виде текста.

В частности, для MP3-файлов самая первая строка должна содержать «ID3», чтобы указать, что это контейнер метаданных, который может хранить информацию, такую ​​как исполнитель, альбом, номер дорожки и т. Д.

Другой пример — формат файла PDF ; каждый файл начинается с текста «% PDF» в первой строке, хотя остальная часть документа полностью нечитаема.

Как конвертировать текстовые файлы

Единственная реальная цель для преобразования текстовых файлов — это сохранить их в другом текстовом формате, таком как CSV , PDF, XML, HTML , XLSX и т. Д. Это можно сделать с помощью самых современных текстовых редакторов, но не более простых, поскольку они обычно поддерживают только основные форматы экспорта, такие как TXT, CSV и RTF.

Например, упомянутая выше программа Notepad ++ способна сохранять огромное количество форматов файлов, таких как HTML, TXT, NFO, PHP , PS, ASM, AU3, SH, BAT, SQL, TEX, VGS, CSS, CMD, REG. , URL, HEX, VHD, PLIST, JAVA, XML и KML .

Другие программы, которые экспортируют в текстовый формат, могут, вероятно, сохранять несколько различных типов, обычно TXT, RTF, CSV и XML. Поэтому, если вам нужен файл из определенной программы в новом текстовом формате, рассмотрите возможность возврата к приложению, в котором был создан исходный текстовый файл, и экспортируйте его во что-то другое.

Все это говорит о том, что текст — это текст, если он представляет собой простой текст, поэтому для его «преобразования» может потребоваться просто переименовать файл, поменяв одно расширение на другое.

Смотрите наш список бесплатных программ для конвертации документов, чтобы узнать о некоторых дополнительных конвертерах файлов, которые работают с различными типами текстовых файлов.

Ваш файл все еще не открывается?

Вы видите беспорядочный текст при открытии файла? Может быть, большая часть или все это совершенно нечитаемо. Наиболее вероятная причина этого заключается в том, что файл не является простым текстом.

Как мы упоминали выше, вы можете открыть любой файл с помощью Notepad ++, но, как и в примере с MP3, это не означает, что вы можете использовать этот файл там. Если вы попробуете ваш файл в текстовом редакторе, и он не рендерится так, как вы думаете, переосмыслите, как он должен открываться; это, вероятно, не в формате файла, который может быть объяснен в удобочитаемом тексте.

Если вы не знаете, как должен открываться ваш файл, попробуйте некоторые популярные программы, которые работают с различными форматами. Например, хотя Notepad ++ отлично подходит для просмотра текстовой версии файла, попробуйте перетащить файл в медиаплеер VLC, чтобы проверить, содержит ли он медиафайл, содержащий видео или звуковые данные.

Читайте также: