Чем принципиально отличается формат текстового файла от формата документа word

Обновлено: 03.07.2024

-изучить текстовый процессор MS WORD. Возможностями ввода,вывода форматирования и ре. Создавать различные текстовые документы, научится вставлять в текстовый документ таблицы, формулы, иллюстрации, фигурный текст.

Методы: наглядный, словесный

Оборудование: рабочая тетрадь, канцелярские принадлежности, мультимедийный проектор

Тип урока : лекция

Организационный момент.

-подготовка рабочего места

II . Проверка знаний полученных ранее.

- комментированное выставление оценок

III . Изложение нового материала.

Форматы текстовых файлов

Основные термины текстовых редакторов

Текстовый редактор Microsoft Word .

КОНСПЕКТ УРОКА

Одной из самых популярных прикладных функций персонального компьютера сегодня является создание текстовой информации, то есть использование ПК в качестве пишущей машинки. Осуществить работу по созданию текстовых массивов позволяют текстовые блокноты, записные книжки, редакторы (процессоры), офисные издательские системы и другие программы, поставляемые в составе операционных систем и операционных оболочек. Они обладают минимальным набором выполняемых функций, однако, достаточными для выполнения элементарных операций с данными. Такие продукты позволяют пользователю не только набрать (напечатать) текст, но выполнить над ним ряд операций: редактирование, форматирование, разбивка текста на страницы, использование разнообразных шрифтов, печать и многое другое.

Технологии обработки текстов являются одними из наиболее распространенных технологий обработки информации. Текст – любая последовательность символов, к которым относятся буквы, пробел, знаки препинания, цифры, знаки арифметических операций и т.п. Текст можно создать карандашом, пером, авторучкой, на пишущей машинке, наконец, на компьютере.

К аппаратным средствам компьютера для ввода текстового документа относится клавиатура, световой карандаш со специальным планшетом, сканер.

К программным средствам , предназначенным для работы с текстами, относятся:

· системы, осуществляющие интеллектуальный поиск и интеллектуальную обработку текстов, размещенных в сетях.

Текстовый редактор – программное средство, предназначенное для создания (ввода, набора), редактирования и оформления текстов. Примеры: «Лексикон», «Слово и дело», «Edit», «Ched», «NotePad», «Write».

Текстовый процессор - это текстовый редактор, дополненный разнообразными средствами оформления текста.

Текстовый процессор отличается от текстового редактора более широкими функциональными возможностями:

· настраиваемое пользователем меню;

· использование контекстного меню;

· сопровождение текста таблицами и проведение в них простейших расчетов;

· вставка графических объектов (рисунков, диаграмм, заголовков и пр.) или создание рисунков с помощью встроенных инструментов;

· вставка формул, графиков, диаграмм;

· оформление текста списками, буквицами;

· использование инструмента автокоррекции текста и его автореферирования;

· создание и использование макросов;

· фоновая проверка орфографии, синтаксиса и др.

Примеры : Word (Microsoft Office), Word Pro (Lotus Smart Suite), Word perfect (Perfect Office), Accent, Word Pad.

Редакционно-издательские системы должны обеспечить все функции текстового процессора, а также:

· воспринимать тексты, созданные в различных текстовых редакторах;

· воспринимать отсканированные или нарисованные в графических редакторах иллюстрации, созданные на ПК разных платформ, и корректировать их цвета;

· иметь большой набор шрифтов и возможность их графического преобразования;

· иметь возможность для различного «обтекания» рисунка текстом;

· обеспечивать автоматическое оптимальное размещение текста на странице, автоматическую нумерацию страниц;

· обеспечивать адаптацию к различным печатающим устройствам и т.п.

Программы-переводчики или компьютерные словари содержат переводы на разные языки сотен тысяч слов и словосочетаний. Их возможности, предоставляемые пользователю, заключаются в следующем:

· выбор языка и направления перевода;

· предоставление не только общеупотребительных, но и специализированных слов;

· обеспечение быстрого поиска словарных статей;

· предоставление мультимедийных услуг – прослушивание слов в исполнении дикторов.

Рассматривая технологию создания текста, необходимо знать определение таких понятий как шрифт, графема, сериф, кегль, а также пагинация, выключка, кернинг, интерлиньяж.

Графема – единица письменного знака, выступающая в различных вариантах в зависимости от стиля письма, места в предложении и т.д.

Шрифт – выполненные в едином стиле графемы букв, используемых для письма.

Сериф – завиток (росчерк, засечка), образующий окончание линии, которой изображена буква или знак (литера).

Кегль – размер шрифта, определяемый литерой.

Выключка – выравнивание длины печатных строк по заданному размеру путем увеличения промежутков между словами.

Пагинация (от английского page – страница) – разбивка на страницы.

Кернинг – уменьшение расстояния между буквами для более удобного и комфортного восприятия текста глазом.

Интерлиньяж – регулировка промежутка между строками.

Формат файла определяет способ хранения текста в файле. Простейший формат текстового файла содержит только символы (числовые коды символов), другие же форматы содержат дополнительные управляющие числовые коды, которые обеспечивают форматирование текста.

Существуют универсальные форматы текстовых файлов , которые могут быть прочитаны большинством текстовых редакторов, и оригинальные форматы, которые используются отдельными текстовыми редакторами. Для преобразования текстового файла из одного формата в другой используются специальные программы – программы-конверторы.

Рассмотрим некоторые наиболее распространенные форматы текстовых файлов.

Только текст (TextOnly) (TXT). Наиболее универсальный формат. Сохраняет текст без форматирования, в текст вставляются только управляющие символы конца абзаца. Применяют этот формат для хранения документов, которые должны быть прочитаны в приложениях, работающих в различных операционных системах.

Текст в формате RTF (Rich Text Format) (RTF). Универсальный формат, который сохраняет все форматирование. Преобразует управляющие коды в команды, которые могут быть прочитаны и интерпретированы многими приложениями, в результате информационный объем файла существенно возрастает.

Документ Word (DOC). Оригинальный формат используемой в настоящее время версии Word. Полностью сохраняет форматирование. Использует 16-битную кодировку символов, что требует использование шрифтов Unicode.

Документ Word 2.0, Word 6.0/95 (DOC). Оригинальные форматы предыдущих версий редактора Word. При преобразовании из формата Word 97/2000/2003 форматирование сохраняется не полностью.

Works 4.0 для Windows (WPS). Оригинальный формат интегрированной системы Works 4.0. При преобразовании из формата Word форматирование сохраняется не полностью.

HTML-документ (HTM, HTML). Формат хранения Web-страниц. Содержит управляющие коды (тэги) языка разметки гипертекста.

Выбор требуемого формата текстового документа или его преобразование производится в процессе сохранения файла.

Основные понятия текстового редактора

Кроме того, особое место в группе пакетов, работающих с документами, занимают так называемые издательские системы — PageMaker , Ventura Publisher , QuarkXPress и др. Как правило, издательские системы специализируются на подготовке набранного документа к публикации (создание макета издания). Для набора текста удобнее применять текстовые процессоры типа Microsoft Word , а для создания и редактирования иллюстраций — графические системы: CorelDraw (векторные изображения), Adobe Photoshop (растровые изображения). Впрочем, издательские возможности процессора Word так велики, что многие публикации можно подготовить к печати, не прибегая к услугами издательских систем.

При помощи Word можно создавать практически любые документы и публиковать их в электронном виде или в виде печатных копий. Основные возможности Word можно разделить на несколько категорий.

Текст может быть введен в документ посредством набора на клавиатуре. Кроме того, можно вставить в документ определенные текстовые фрагменты или даже целые файлы. Word предоставляет множество функций, позволяющих выполнять корректорскую правку, редактирование и изменение текстовой информации наиболее удобным способом. Так, функция автотекста позволяет вставлять в документ часто используемые фразы при наборе лишь нескольких первых букв этих фраз. Функция автокоррекции автоматически исправляет наиболее распространенные опечатки, орфографические и грамматические ошибки, освобождая пользователя от необходимости заниматься их исправлением.

Word позволяет устанавливать межстрочный интервал, характер выравнивания и размер отступов, выбирать гарнитуру и размер шрифта, а также его начертание.

Гарнитура шрифта - полиграфический термин, характеризующий стилистические особенности изображения символов шрифта.

Пользователь может определять стили, включающие в себя несколько параметров форматирования, и применять все эти параметры одновременно или использовать темы для оформления Web -страниц в едином ключе при настраиваемых стилях, графике и фоновых рисунках.

Стиль - это набор правил для отображения шрифтов, выравнивания текста, параметров текста, фонового рисунка и других объектов документа.

Темами называются наборы взаимосвязанных стилей, направленные на достижение единства представления Web -страниц и других HTML -документов.

Форматирование - автоматическое придание тексту определенной формы - формата.

Формат - внешний вид документа или отдельных его частей.

Текстовая информация может быть представлена в виде таблиц, в документах могут быть определены колонтитулы, простые и концевые сноски, гюдписи или текстовые рамки к рисункам и таблицам.

Колонтитул - это текст или изображение, которое размещается на верхнем или нижнем поле страницы вне области основного текста.

В Word имеется набор встроенных средств для создания геометрических фигур, линий, прямоугольников, овалов и других простых графических объектов. Кроме того, имеется возможность выбирать и вставлять в документы десятки предопределенных фигур и готовых рисунков.

Word предоставляет всевозможные функции верстки, позволяющие размещать текстовую и графическую информацию на странице для подготовки практически любой полиграфической продукции, от указателей и бюллетеней до книг и журналов.

Верстка страниц - полиграфический термин, означающий размещение текстового и графического материала на печатной странице в соответствии с определенными правилами.

Например, можно форматировать текст в виде нескольких колонок, дополнять его графикой, задавать обтекание текста вокруг врезок и иллюстраций, определять чередующиеся верхние и нижние колонтитулы (различные для четных и нечетных страниц), создавать предметный указатель, оглавление и перекрестные ссылки.

Параметры Word могут быть настроены в соответствии с любыми конкретными требованиями к рабочей среде.

Каждый документ Word может содержать текст наряду с графикой, звуками, полями, гиперссылками или ссылками на другие документы и ' даже с видеоклипами. Документы могут быть сохранены в формате Web -страниц с добавлением HTML -сценариев.

Гиперссылка - средство указания смысловой связи фрагмента одного документа с другим документом или его фрагментом.

Каждая буква или специальный знак текста, размещаемого в документе, называется символом. Формат каждого символа может быть задан индивидуально, однако чаще форматируются целые слова, строки или абзацы текста. Для каждой буквы может быть изменен шрифт, начертание (например, полужирное или подчеркнутое), размер шрифта, положение, интервал или цвет. Кроме того, к тексту дркумента или Web -страницы могут быть применены некоторые специальные эффекты, такие как мерцание или эффект бегущей строки.

Документ разделяется на абзацы. Абзац - это часть текста, завершающаяся маркером конца абзаца. Эти маркеры автоматически вносятся в текст при нажатии клавиши Enter . Для каждого абзаца в отдельности может быть задан требуемый отступ, выравнивание, позиции табуляции и межстрочный интервал. Кроме того, абзац может быть оформлен обрамлением, оттенен фоном или отформатирован как маркированный, нумерованный или многоуровневый список.

Обрамление - это декоративная линия, ограничивающая страницу, рисунок и т.д.

Печатные документы разделяются на страницы. Функции форматирования страниц в Word позволяют определять размеры полей, колонтитулы, нумерацию страниц, количество колонок и прочие параметры страницы.

В сложных документах может возникнуть необходимость в использовании более одной группы параметров форматирования. Например, для различных частей документа может понадобиться различный текст колонтитулов или потребуются страницы, на которых текст форматируется как в одну, так и в несколько колонок.

В этом случае документ следует разбить на разделы. Каждому разделу соответствует свой набор параметров форматирования.

Шаблон - это документ, используемый в качестве образца для создания новых документов.

В Word шаблоны используются для сохранения информации о форматировании документов, горячих клавишах, пользовательских меню, панелях инструментов и прочей информации. Все новые документы создаются на основе шаблонов. В комплект поставки Word входят десятки предопределенных шаблонов для различных типов документов, включая служебные записки, письма, отчеты, резюме, бюллетени и юридические документы. Пользователь может изменять имеющиеся и создавать новые шаблоны в соответствии с потребностями.

Текстовый редактор Microsoft Word

На основе распространенного использования операционной системы Windows в ее среду был перенесен широко известный текстовый процессор фирмы Microsoft — Word . Оказавшись в новой среде, Word , сохранив мощь своего DOS -овского собрата, приобрел и новые, характерные для Windows -приложений, качества, которые еще более развились в Word версии 6.0 для Windows 3.1-3.11, версии 6.0 и 7.0 для Windows 95, версии Word 97 для Windows 98 и так далее вплоть до версии Word 2003 для Windows XP и Server 2003. В 2007 году компания Microsoft выпустит новый офисный пакет программ Microsoft Office 2007, в составе которого будет новая версия вышеуказанного редактора Word 2007.

Текстовый редактор это программа обработки текста, которая используется для создания новых документов (писем, отчетов, бюллетеней) или изменения уже существующих.

Современные текстовые редакторы (в том числе и редактор Word ) иногда называются текстовыми процессорами, поскольку содержат очень большое количество функций обработки текста. Ранние текстовые редакторы для DOS подразделялись на строчные и экранные, такие, например, как EDLIN , MULTIEDIT и EDIT .

Microsoft Word позволяет вводить, редактировать, форматировать и оформлять текст, грамотно размещать его на странице. С помощью этой программы можно вставлять в документ графику, таблицы и диаграммы, а также автоматически исправлять орфографические и грамматические ошибки. Текстовый редактор Word обладает и многими другими возможностями, значительно облегчающими создание и редактирование документов. Наиболее часто используемые функции:

автоматический переход на следующую строку;

возможность пользоваться дефисами для выделения пунктов списка, употреблять дроби, знак торговой марки или другие специальные символы, организация функций автоматического форматирования;

представление текста в виде таблицы, для этого Microsoft Word предлагает гораздо более эффективные средства. А если таблица содержит цифровые данные, то их легко превратить в диаграмму;

наличие режима предварительного просмотра позволяет увидеть документ в том виде, в каком он выйдет из печати. Кроме того, он дает возможность отобразить сразу все страницы, что удобно для внесения изменений перед распечаткой.

Работа текстового редактора всегда начинается с запуска (активизации) его программы. Для того, чтобы запустить Word в Windows , необходимо осуществить следующие действия.

Щелкнуть по кнопке «Пуск».

В развернувшемся меню найти пункт «Программы».

В меню «Программы» щелкнуть на Microsoft Word . Можно иначе активизировать Word , открыв меню и щелкнув на режиме «Создать» документ « Microsoft Office ». Либо через панель инструментов Microsoft Office , которая высвечивается на экране монитора. Для этого необходимо щелкнуть на кнопке «Создать документ», после чего раскроется окно «Создать документ Office ». В нем щелкните на режиме «Общие» и два раза на режиме «Новый документ».

Активизировав Word , можно открыть окно нового документа, которое готово к вводу текста, учитывая работу элементов этого окна.

Графический интерфейс данного текстового редактора представлен в виде:

информационной строки, где выводится информация о названии используемого текстового редактора и названии создаваемого документа;

кнопок управления окном, расположенных в верхнем правом углу экрана монитора и предназначенных для управления работой окна.

строки меню, представляющего собой основной перечень выполняемых функций редактора и содержащего группы команд, объединенные одним именем.

панели инструментов, кнопки которой обозначены соответствующими пиктограммами, при нажатии которых происходит выполнение команды, аналогичной меню. Панели являются одной из составных частей графического интерфейса текстового редактора Word . Текстовый редактор использует более 20 панелей инструментов, которые можно выбрать и эффективно разместить в окне. Маленькие кнопки позволяют выбрать часто встречающиеся команды с помощью щелчка мышью;

позиционных линеек, размещающихся под панелью инструментов и справа от рабочего поля редактора. Они предназначены для установки параметров отступов, абзацев, границ текста, позиций табуляторов;

рабочего поля редактора, которое составляет область интерфейса, используемую для ввода текста;

двух полос прокрутки, расположенных непосредственно под рабочим полем и справа от него. Полосы предназначены для быстрого перемещения курсора и содержимого текстового файла (документа) по рабочему полю редактора;

строки состояния, которая отражает все сведения о текущем документе, справочную информацию о командах, кнопках и их назначении;

помощника, который организован в дополнительном окне и выполняет консультационную функцию. При необходимости его можно убрать с экрана за ненадобностью. Для этого щелкните по кнопке Свернуть, расположенной в верхнем правом углу его окна.


Начиная с 2007 года обновленная версия Word (и Microsoft Office) для сохранения файлов стала использовать формат DOCX, вместо классического DOC. Это была не просто «экстремальная» версия формата 1990-х годов, дополнительный X в расширении обозначает стандарт Office Open XML.

В чём разница, и какой из них следует использовать? DOC – это формат документа, используемый Microsoft Word, а DOCX – его преемник. Оба являются относительно открытыми, но DOCX более эффективен и создает меньшие, менее повреждаемые файлы.

Если у Вас есть выбор, используйте DOCX, DOC необходим только в том случае, если файл будет использоваться версиями Word до 2007 года.

Краткая история формата DOC

Microsoft Word начал использовать формат DOC и соответствующее расширение файла более 30 лет назад в самом первом выпуске Word для MS-DOS. Word исполнял роль проприетарного процессора документов, формат также был проприетарным: Word был единственной программой, официально поддерживающей файлы DOC, до тех пор, пока Microsoft не откроет спецификацию в 2006 году, после чего она была перепроектирована.

Microsoft Word использует формат файла DOC более 30 лет

В 90-х и начале 2000-х годов различные конкурирующие продукты могли работать с файлами DOC, хотя некоторые из более экзотических форматов и опций Word не поддерживались в других текстовых процессорах. Поскольку Office и Word были де-факто стандартами для офисных наборов, соответственно, закрытый характер формата файла, несомненно, помог Microsoft сохранить свое господство над такими продуктами, как Corel WordPerfect.

С 2008 года Microsoft несколько раз выпускала и обновляла спецификацию формата DOC для использования в других программах, хотя не все расширенные функции Word поддерживаются открытой документацией.

После 2008 года формат DOC был интегрирован в платные и бесплатные программы обработки текстов многих поставщиков. Это значительно упростило работу с более старыми форматами текстовых процессоров, и многие пользователи по-прежнему предпочитают сохранять документы в старом стандарте DOC.

Введение Office Open XML (DOCX)

Под давлением растущей конкуренции открытого исходного кода и его конкурирующего формата открытых документов (ODF), Microsoft приняла решение о введение открытого стандарта в начале 2000-х годов. Это привело к разработке формата файла DOCX вместе со своими компаньонами, такими как XLSX для электронных таблиц и PPTX для презентаций.

Стандарты были представлены под названием «Office Open XML» (не имеет отношения к программе Open Office), поскольку форматы были основаны на Extensible Markup Language, а не на более раннем и менее эффективном двоичном формате. Этот язык позволил получить несколько преимуществ, в первую очередь, меньшие размеры файлов, меньше шансов на взлом и сжатые изображения.

Формат DOCX на основе XML стал стандартом для Word в версии программного обеспечения 2007 года. В то время многие пользователи полагали, что новый формат DOCX был просто средством для Microsoft поэтапного отказа от более старых версий программного обеспечения и продажи новых копий, поскольку более старые версии Word и Office не могли читать новый XML файлы.

Это было не совсем так: Word 2003 может читать специальные форматы файлов Word XML, а обновления совместимости позднее были применены к другим версиям. Но, в любом случае, некоторые пользователи вручную сохраняли файлы в более раннем стандарте DOC вместо DOCX ради совместимости.

Современные текстовые процессоры поддерживают форматы DOC и DOCX

Десять лет спустя DOCX стал новым стандартом де-факто, хотя он не столь универсален, как более старый формат DOC-файлов, благодаря конкурентам, таким как ODF, и общему уменьшению традиционного использования текстового процессора.

Какой из них следует использовать

DOCX – лучший выбор для любой ситуации. Формат создает меньшие, более легкие файлы, которые легче читать и передавать. Открытый характер стандарта Office Open XML означает, что его можно прочитать практически любым полнофункциональным текстовым редактором, включая онлайн-инструменты, такие как Google Docs.

Формат DOCX документа по сравнению с более старым DOC

Единственной причиной использования старого формата DOC может быть восстановление некоторых файлов старше десяти лет или работа с очень устаревшим текстовым процессором.

В любом случае, лучше сохранить файл в DOCX или какой-либо другой современный стандарт, например ODF, для простого преобразования.

Говоря о текстовых редакторах, мы сразу представляем корифея, как Microsoft Word, который на многие годы занял пьедестал среди офисных приложений. И хотя, его первая версия появилась еще в 1986 году для платформы IBM, настоящую популярность он получил в девяностые уже среди пользователей Windows. Как и все продукты компании Microsoft в те времена, Word имел свой собственный закрытый формат документов DOC. Однако монополия на формат doc многих не устаивала, и на волне развития движения open source в 2000-ые появился альтернативный текстовый процессор с открытым форматом odt. В 2006-ом он получил международный стандарт ISO/IEC 26300.

И не смотря на множество негатива в его сторону, он получил популярность среди любителей программного обеспечения с открытым исходным кодом. Но попасть на рынок корпоративных клиентов этому формату все же не удалось. Слишком долго Microsoft был доминирующим продуктом в сфере офисного ПО. Огромное количество документов было создано в формате doc и огромное количество пользователей было обучено работе с Word.

Тем не менее, Microsoft пришлось ответить на появление нового открытого формата, и в версии MS Office 2007 появляется новый открытый формат DOCX. Назначение его ничем не отличается от DOC, но по своей сути это уже совсем другой формат, использующий принципы ODT. В это же время Microsoft снял завесу таинства со своего уже устаревающего формата DOC. Более того, в последующих версиях, MS Word уже поддерживал и ODT. Но и посессорные продукты не остались в стороне. Сейчас уже любой «уважающий себя» текстовый процессор поддерживает все три формата.

Теперь давайте немного подробнее рассмотрим каждый из этих форматов.

Формат DOC

Его название — это не аббревиатура, а сокращение от document. Этот формат появился еще в начале 90х и до сих пор остается в строю. Хотя в 2007 году он потерял актуальность в связи с появлением нового, целевого формата docx. Тем не менее, после раскрытия спецификаций этого формата в 2007ом, его стали поддерживать все современные текстовые процессоры, потому что к этому моменту накопилось огромное количество документов doc.

Его внутреннее устройство довольно сложное и представляет собой целую файловую систему. Это двоичный файл, и открыть его можно только в специальном текстовом процессоре, таком как MS Word или OpenOffice Text. Формат doc позволяет хранить внутри документа изображения, мультимедиа и другие файлы, но главное его достоинство – поддержка каскадных стилей.

Этот формат расширяет возможности rtf и позволяет использовать каскадные стили, таблицы, разметку листа, макросы, форматирование документа, изображения, диаграммы, различные метаданные. Таким образом, он покрывает большинство потребностей пользователей для электронных документов.

Формат ODF

Как уже говорилось выше, этот формат был создан альтернативой doc. Над созданием стандарта трудилось множество организаций, входивших в сообщество OASIS. И в 2006 году был принят его стандарт ISO/IEC 26300.

Документ основан на языке разметки XML, помещенный в ZIP архив. Помимо самого документа в архив включены файлы, на которые ссылается документ (рисунки), метаданные и др. Но благодаря использованию архивации, файл формата odf получается очень легковесным, по сравнению с doc. Раз уж мы говорим о текстовом процессоре, то правильным будет говорить odt, а не odf. Ведь ODF отписывает целое семейство форматов: для текстового процессора - odt, для табличного процессора ods, для электронных презентаций – odp.

Нативным (разработанным именно для него) офисным решением, созданным под формат ODF считается OpenOffice. Также, как и Microsoft Office он включает в себя целый набор офисных программ для работы с: текстом, таблицами, презентациями, векторной графикой, базой данных и формулами.

Ранее мы уже отмечали, что формат ODT поддерживают множество текстовых процессоров, как MS Word, так и опен сорс решения LibreOffice, OpenOffice, и бесплатный Google Document.

Естественно, первая генерация формата ODF 1.0 имела свои недостатки, например:

  • Нет описания спецификации макросов;
  • Нет описания применения цифровых подписей, хотя офисный пакет позволяет их использовать;
  • В презентации нельзя вставлять таблицы, хотя MS PowerPoint это позволяет;
  • Нет стандарта языка формул.

Некоторые из них были исправлены в версии 1.2. Однако основным недостатком по мнению пользователей является невозможность корректно воспроизводить документы формата doc, созданные ранее в MS Office. То есть они, конечно, открываются, но выглядят не так, как в нативной программе. А ведь к моменту появления OpenOffice большинство электронных документов было именно в формате doc. Но с форматом docx дела обстоят значительно лучше.

Так или иначе, но Microsoft Office практически не уступил своих позиций на рынке, а благодаря появлению открытого формата docx завоевал доверие сторонников open source.

Формат DOCX

Формат DOCX, он же Office Open XML, он же Microsoft Open XML, он же Office Open XML. Был создан в 2007 году в ответ на появление открытого ODF и использует тот же принцип создания файла – zip архив, в который помещается xml самого документа и файлы, на которые ссылается документ (изображения), а также файлы с метаданными. Преимуществом перед ODF можно назвать мощный бэкенд в виде MS Office. Миллионы пользователей не хотели бы отказываться от удобного инструмента ради перехода на бесплатный формат. А ведь закрытый формат doc обязывал корпоративных клиентов платить немало денег Американской корпорации. Таким образом, Microsoft сохранил своих клиентов, которые «поглядывали» в сторону ODF.

DOCX стандартизирован: он пользуется спецификациями ECMA-376, ISO/IEC 295000 Transitional и ISO/IEC 29500 Strict.

Сравнение

И если формат doc конструктивно отличается от docx, то docx и odt по сути братья. Оба они представляют собой zip-контейнеры с xml документами внутри. Каждый из них имеет свои плюсы и минусы. Но оба они превосходят формат doc хотя бы по критерию размер файла. Благодаря архивированию содержимого документа, размер файла получается значительно меньше – в 2-3 раза в зависимости от количества мультимедиа и графического контента.

Какой же из двух форматов предпочесть, docx или odt. Хотя текстовые процессоры обеспечивают поддержку форматов конкурентов, все же их отображение отличается не в лучшую сторону от оригинала. Поэтому нельзя сказать, что есть универсальное решение для всех форматов. Придется выбирать формат из сферы применения. Если речь идет о крупных предприятиях, которые использовали раньше MS Office, то очевидно, они имеют большой архив документов в формате doc да и обмен документами с другими предприятиями производится скорее всего в формате docx. Никто лучше MS Word не сможет отображать документы в собственных форматах, по крайней мере на текущий момент. В таком случае предпочтительно и впредь использовать MS Word, с форматом docx.

Если ваша цель уйти от платного офисного программного обеспечения и вас не сильно беспокоит совместимость форматов, то odt вполне способен заменить и doc, и docx. Многие крупные предприятия уже перешли на OpenOffice, а значит эта задача вполне посильная.

DOCX и ODT в генераторе отчетов

Так выглядит оригинальный отчет, который мы будем экспортировать в оба этих формата:

Original report looks like

Давайте сделаем экспорт отчета в формат Microsoft Word (docx):

Docx export menu

Вот, как он выглядит в MS Word:

Docx export looks like in MS Word

А это экспорт в формат odt при просмотре в MS Word:

ODT export looks like in MS Word

Экспорт в DOCX почему-то имеет мелкие шрифты внутри таблиц, но рамка соответствуют оригинальному отчету.

ODT оказался ближе к оригиналу по размеру шрифтов, но рамки никуда не годятся. Обратите внимание, что Word открыл odt с несколько худшим форматированием, чем OO Writer.

Также, как отображение документов одного формата в разных программах не одинаково, так же и генератор отчетов преобразует отчет в разные форматы по-разному.

Из всего вышерассмотренного можно сделать вывод, что даже использование одного формата не даст одинаково выглядящего документа в разных текстовых процессорах из-за разной реализации. Поэтому лучше использовать текстовый редактор с нативным форматом и не зацикливаться на универсальности.

Вопросы и ответы в сфере it технологий и настройке ПК

Документ Microsoft Word представляет собой файл с расширением doc или docx. До 90-х годов XX века расширение doc использовалось для текстовых файлов, которые не содержат разметки. И сейчас можно убедиться, что файл такого типа легко создать с помощью, например, программы «Блокнот». Правда, он не будет иметь богатого форматирования, но легко открывается программой Ворд, в которой набранному в блокноте тексту можно придать более оформленный вид. Когда корпорация Майкрософт выпустила программу Ворд, разработчики решили использовать в ней расширение doc. К настоящему времени этот текстовый редактор является самым популярным в мире, поэтому файл с расширением doc ассоциируют с этим программным продуктом и называют просто «вордовский формат».

Что такое формат?

Старый формат DOC отличался сложным содержанием, и нормально читался только в MS Office

Старый формат DOC отличался сложным содержанием, и нормально читался только в MS Office

Современные форматы «вордовских» документов

Даже бесплатные современные редакторы документов умеют корректно работать с DOCX

Даже бесплатные современные редакторы документов умеют корректно работать с DOCX

Кроме того, сложности могут возникнуть даже при использовании разных версий офисного пакета Майкрософт. Дело в том, что начиная с версии Word 2007 года документ по умолчанию сохраняется с расширением не doc, а docx. Поэтому если установлен пакет офиса, выпущенный ранее, то необходима конвертация для устаревших версий. Конверторы для обеспечения совместимости предлагаются самой компанией Майкрософт (Microsoft Office Compatibility Pack), так что обычно при открытии docx, например, в версии Ворд 2003, сложностей не возникает, но при этом может потеряться часть данных форматирования и возможностей редактирования.

Компания Майкрософт была вынуждена пойти на изменение формата Word под давлением международных организаций, которые требовали подвести его под какие-либо стандарты. Был выбран вариант, основанный на языке разметки XML, который часто используется в документах интернет. Документ с расширением docx имеет некоторые преимущества перед устаревшим форматом, в частности, меньший вес, что имеет значение при передаче документа через интернет. Поэтому при ограниченных скоростях передачи данных пользователям имеет смысл использовать более современный формат Word.

Читайте также: