Что представляют собой файлы форматов pdf djvu

Обновлено: 05.07.2024

Большинство компаний рано или поздно сталкивается с необходимостью введения электронного документооборота. При этом одним из наиболее важных вопросов становится выбор формата, в котором документы будут создаваться, храниться и передаваться в другие фирмы или удаленные подразделения. Сегодня мы сравним два таких формата: PDF и DjVu.

Пара слов о DjVu

Сам по себе формат DjVu является очень интересным решением, представляющим собой технологию сжатия изображения с потерями. Суть ее заключается в разделении документа на три слоя: передний план, задний план и черно-белую маску. Каждый из них обрабатывается по-своему. При этом используется целый ряд различных технологий: алгоритм отделения текста от фона на отсканированном изображении, вейвлетный алгоритм сжатия фона IW44, алгоритм сжатия черно-белых изображений JB2, универсальный алгоритм сжатия ZP, алгоритм распаковки по запросу. Такой подход позволяет добиться максимальной степени сжатия при минимальных искажениях. Одна отсканированная из книги страница имеет в формате DjVu объем всего 10-25 кбайт.

Пара слов о PDF

Впервые о формате PDF (Portable Document Format) общественность услышала в 1991 году. Именно тогда компания Adobe Systems анонсировала его как новую технологию представления в электронном виде любой полиграфической продукции. Новинка получилась очень удачной. Уже в следующем году формат PDF получил приз на престижной международной выставке Comdex Fall. Компания Adobe Systems очень большое внимание уделяла развитию своей разработки. В 1994 году появилась версия 1.1 формата PDF, в которой была реализована поддержка внешних ссылок, машинно-независимого цвета, потоков статей, а также комментарии и некоторые функции, касающиеся безопасности. Следующая версия рассматриваемого формата появилась в 1996 году. В ней была реализована поддержка спецификации OPI 1.3 и цветового пространства CMYK.

Главным отличием формата PDF является его широкое распространение. Сегодня именно в этом формате поставляются многие руководства, технические документации, периодическая пресса и другие виды документов. И практически на каждом компьютере установлено программное обеспечение для просмотра документов в формате PDF.

Форматы DjVu и PDF: разные области применения

Однако обратите внимание, что каждый раз, говоря о файлах в формате DjVu, мы упоминаем о сканировании реально существующих на бумаге или другом носителе документах. И это неспроста. Данный формат изначально создавался для хранения именно отсканированных копий документов. И сегодня практически нет инструментов, да и необходимости, создавать DjVu-файлы как-то иначе.

Недостатков, препятствующих использованию формата DjVu в электронном документообороте, немало. Во-первых, в нем применяется сжатие данных с потерями. А это не очень хорошо, когда речь идет о договорах, актах, и других имеющих юридическую силу документах. Во-вторых, относительно малое распространение формата DjVu не позволяет компаниям свободно использовать его для обмена информацией со своими партнерами или клиентами. На подавляющем большинстве как корпоративных, так и домашних компьютеров просто-напросто нет программного обеспечения для просмотра таких электронных документов. В-третьих, в рассматриваемом формате полностью отсутствуют хоть какие-то средства для обеспечения безопасности и конфиденциальности документов.

Вторым преимуществом формата PDF является встроенная защита от несанкционированного доступа. С ее помощью пользователь может обезопасить любой свой документ от просмотра или использования посторонними лицами. В качестве защиты применяется криптографическая технология, многократно протестированная как разработчиками программного обеспечения, так и экспертами в области информационной безопасности.

Ну и, наконец, третьим преимуществом PDF является его стандартизация организацией ISO (International Organization for Standardization). На данный момент этот формат уже имеет статус стандарта для хранения архивных документов и для обмена компаниями информацией в электронном виде. И это только начало. Разработчики формата собираются передать его спецификацию общественной организации Association for Information and Image Management. В этом случае существует очень большая вероятность того, что PDF станет международным стандартом для организации электронного документооборота.

Какой же вывод можно сделать из всего вышесказанного? Оказывается, форматы DjVu и PDF нельзя считать соперниками. Они предназначены для решения различных задач, а поэтому не соперничают, а дополняют друг друга. В качестве основы системы электронного документооборота лучше брать, конечно же, формат PDF, который, де-факто, стал общемировым стандартом. Стоит отметить, что в некоторых компаниях уже существуют цифровые DjVu-архивы технической и другой документации, созданные путем сканирования бумажных документов. Однако это не является основанием для выбора именно этого формата. Лучше построить современную, реально работающую систему электронного документооборота, а уже существующие DjVu-файлы просто конвертировать в формат PDF.

Конвертируем документы из DjVu в PDF

По принципу работы программа Universal Document Converter является виртуальным принтером. В процессе установки она создает в операционной системе дополнительное печатающее устройство, доступное в любом программном обеспечении. Печатая на этом принтере, на выходе пользователь получает файл нужного формата. Такой подход наиболее удобен на практике. Во-первых, он позволяет осуществлять процесс конвертирования быстро, практически без предварительной работы. Во-вторых, он настолько прост, что не требует обучения конечных пользователей.

MAN B&W Diesel A/S

«Мы ежедневно экспортируем документы из Microsoft Word в формат PDF для отправки нашим клиентам и в наши сервис-центры. Благодаря тому, что "Универсальный конвертер документов" - это виртуальный принтер, а не программа со сложным интерфейсом, мы не тратим времени на обучение наших сотрудников.»

В начале 70-х годов американский писатель Майкл Харт (Michael Hart) сумел получить неограниченный доступ к компьютеру Xerox Sigma 5, установленному в университете штата Иллинойс. Чтобы достойно использовать ресурсы машины, он решил создать первую электронную книгу, перепечатав Декларацию независимости США.

Сегодня цифровая литература получила широкое распространение, во многом благодаря развитию портативных устройств (смартфонов, ридеров, ноутбуков). Это привело к появлению большого количества форматов электронных книг. Попробуем разобраться в их особенностях и расскажем историю наиболее популярных из них — начнем с формата DjVu.



/ Flickr / Lane Pearman / CC

Возникновение формата

DjVu был разработан в 1996 году компанией AT&T Labs с одной целью — дать веб-разработчикам инструмент для распространения изображений в высоком разрешении через интернет.

Дело в том, что в то время 90% всей информации все еще хранилось на бумаге, а многие из важных документов имели цветные изображения и фотографии. Чтобы сохранить читаемость текста и качество картинок, приходилось делать сканы в высоком разрешении.

Классические веб-форматы — JPEG, GIF и PNG — позволяли работать с такими изображениями, но ценой объема. В случае JPEG, чтобы текст был читаем на экране монитора, приходилось сканировать документ с разрешением 300 dpi. Цветная страница журнала при этом занимала порядка 500 Кбайт. Скачивание файлов такого объема из интернета в то время было довольно трудоемким процессом.

С целью решить эти проблемы AT&T и разработали DjVu. Он позволил сжимать отсканированные цветные документы с разрешением 300 dpi до 40–60 Кбайт, при размере оригинала в 25 Мбайт. Размеры чёрно-белых страниц DjVu уменьшил до 10–30 Кбайт.

Как DjVu сжимает документы

DjVu может работать как с бумажными отсканированными документами, так и с другими цифровыми форматами, например PDF. В основе работы DjVu лежит технология, разбивающая изображение на три компонента: передний план, задний план и чёрно-белую (битовую) маску.

Маска сохраняется с разрешением исходного файла и содержит изображение текста и прочие чёткие детали — тонкие линии и схемы — а также контрастные картинки.

Она имеет разрешение 300 dpi, чтобы тонкие линии и контуры букв оставались четкими, и сжимается с помощью алгоритма JB2, который представляет собой вариацию алгоритма JBIG2, предложенного AT&T для работы факсов. Особенностью JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. Таким образом, в многостраничных документах каждые несколько последовательных страниц пользуются общим «словарём».

Задний план содержит текстуру страницы и иллюстрации, а его разрешение меньше, чем у маски. Фон без потерь для восприятия сохраняется с разрешением 100 dpi.

Передний план хранит цветовую информацию о маске, и его разрешение обычно понижается ещё сильнее, так как в большинстве случаев цвет текста черный и одинаковый для одного печатного знака. Для сжатия переднего и заднего планов используется вейвлетное сжатие.

Заключительным этапом создания DjVu-документа становится энтропийное кодирование, когда адаптивный арифметический кодировщик превращает последовательности одинаковых символов в бинарное значение.

Достоинства формата

Задачей DjVu было сохранить «свойства» бумажного документа в цифровом виде, позволив работать с такими документами даже слабым компьютерам. Поэтому ПО для просмотра DjVu-файлов обладает возможностью «быстрого рендеринга». Благодаря ей в память загружается только тот кусочек DjVu-страницы, который должен отображаться на экране.

Это также дает возможность просматривать «недокачанные» файлы, то есть отдельные страницы многостраничного DjVu-документа. При этом используется прогрессивная прорисовка деталей изображения, когда компоненты как бы «проявляются» по мере закачки файла (как в JPEG).

20 лет назад, когда был представлен этот формат, загрузка страницы происходила в три этапа: сперва грузилась текстовая составляющая, через пару секунд подгружались первые версии изображений и фон. Уже после «проявлялась» вся страница книги.

Наличие трёхуровневой структуры также позволяет осуществлять поиск по отсканированным книгам (так как есть специальный текстовый слой). Это оказалось удобно при работе с технической литературой и справочниками, поэтому DjVu стал основой для нескольких библиотек научных книг. Например, в 2002 году он был выбран Архивом Интернета в качестве одного из форматов (вместе с TIFF и PDF) для проекта по сохранению отсканированных книг из открытых источников.

Недостатки формата

Однако, как и все технологии, DjVu имеет свои минусы. Например, при кодировании сканов книг в формат DjVu некоторые символы в документе могут подменяться на другие, внешне похожие. Наиболее часто это происходит с буквами «и» и «н», отчего эта проблема получила название «проблема инь». Она не зависит от языка текста и влияет, в том числе, на цифры и другие мелкие повторяющиеся знаки.

Её причина — ошибки классификации символов в кодировщике JB2. Он «дробит» сканы на группы по 10–20 штук и формирует для каждой из групп словарь общих символов. Словарь содержит образцы общих букв и цифр со страницами и координатами их появления. Когда вы просматриваете DjVu-книгу, символы из словаря подставляются в нужные места.

Это позволяет уменьшить размеры DjVu-файла, однако, если отображения двух букв визуально похожи, кодировщик может их или перепутать, или принять за одинаковые. Иногда это приводит к порче формул в техническом документе. Для решения этой проблемы можно отказаться от алгоритмов сжатия, однако это увеличит размеры цифровой копии книги.

Другим недостатком формата является то, что он не поддерживается по умолчанию во многих современных ОС (в том числе мобильных). Поэтому для работы с ним нужно ставить сторонние программы, такие как DjVuReader, WinDjView, Evince и др. Однако здесь хотелось бы отметить, что некоторые электронные читалки (например, ONYX BOOX) поддерживает формат DjVu «из коробки» — так как необходимые приложения там уже установлены.

Кстати, о том, что еще могут приложения для ридеров на базе Android, мы рассказывали в одном из предыдущих материалов.



Ридер ONYX BOOX Chronos

Еще одна проблема формата проявляется при работе с DjVu-документами на небольших экранах мобильных устройств — смартфонах, планшетах, ридерах. Иногда DjVu-файлы представлены в виде скана разворота книги, а профессиональная литература и рабочие документы часто имеют формат А4, поэтому приходится «двигать» изображение в поисках информации.

Однако отметим, что эта проблема также решаема. Проще всего, конечно, поискать документ в другом формате — но если такой вариант невозможен (например, вам нужно работать с большим количеством технической литературы в DjVu), то можно воспользоваться электронными читалками с большой диагональю от 9,7 до 13,3 дюйма, которые специально «заточены» под работу с подобными документами.

Например, в линейке ONYX BOOX такими устройствами являются Chronos и MAX 2 (кстати, мы подготовили обзор этой модели ридера, и в скором времени опубликуем его в нашем блоге), а также Note, который имеет экран E Ink Mobius Carta с диагональю 10,3 дюйма и повышенным разрешением. Такие устройства позволяют спокойно рассмотреть все детали иллюстраций в оригинальном размере и подойдут тем, кому часто приходится читать учебную или техническую литературу. Для просмотра файлов DjVu и PDF используется NEO Reader, который дает настраивать контраст и толщину оцифрованных шрифтов.

Несмотря на имеющиеся у формата недостатки, на сегодняшний день DjVu остается одним из самых популярных форматов для «сохранения» литературных произведений. Во многом это обусловлено тем, что он является открытым, а обойти его некоторые технологические ограничения сегодня позволяют современные технологии и разработки.

В следующих материалах мы продолжим рассказ об истории появления форматов электронных книг и особенностях их работы.

KW-slate-05-lg._V166788135_.jpg

Электронные книги (ридеры, читалки) уже давно стали привычными устройствами для широкого круга пользователей. Их достоинства: доступность контента (скачать необходимую книгу из интернета можно за считанные минуты), не портящий зрение экран E-ink, возможность иметь в ридере коллекцию из тысяч книг, долгая работа на одной зарядке, настройки типа и размера шрифта. Не так давно появились электронные книги с подсветкой экрана - они позволяют читать в полной темноте. В общем, преимущества ридеров можно перечислять очень долго.

Однако при знакомстве с читалками у пользователей часто возникает одна проблема. Люди, которые решают приобрести ридер в первый раз, сталкиваясь с понятием "форматы электронных книг", часто не понимают о чем идет речь. Проблема особенно актуальна для начинающих, которым аббревиатуры "FB2", "EPUB" или "MOBI" совершенно ничего не говорят.

Так называемые форматы - это различные типы электронных текстовых файлов, которые поддерживаются (воспроизводятся) тем или иным устройством для чтения электронных книг. В электронных библиотеках интернета часто предлагается большой набор типов файлов: FB2, EPUB, MOBI, PDF, DOC, RTF, TXT и других. Выбор широк, и это ставит перед новичками определенные проблемы. Мы опишем основные форматы электронных книг, расскажем о том, чем отличаются друг от друга, какими читалками поддерживаются, и на каком формате лучше остановить свой выбор, если у вас мультиформатный ридер, читающий все форматы.

111Formats.jpg

1. FB2 (FictionBook) - формат электронных книг, который был создан группой российских разработчиков. Книги в этом типе файлов имеют структурированный вид (то есть содержат разбивку по главам, содержание, иллюстрации, обложку). Кроме того, этот стандарт хранит информацию о файле (так называемые тэги: автор, название, жанр), которая считывается ридером и позволяет пользователю удобно сортировать файлы на устройстве. Данный типа файлов занимает небольшой объем, может быть заархивирован, а еще он хорошо конвертируется в другие форматы. Из особенностей: в виду того, что формат изначально был разработан под кириллицу, тексты на русском языке в FB2 имеют переносы слов.

Формат был изначально рассчитан на российских пользователей, и он практически не используется за границей. Именно поэтому FB2 не поддерживается популярными мировыми производителями читалок - Amazon и Barnes & Noble. Зато это основной формат файлов для популярных в России читалок от Pocketbook, Onyx и Wexler. Кроме того, ридеры Sony теперь поддерживают FB2 - после выхода на российский рынок компания разработала официальную прошивку для ридера Sony PRS-T1, которая позволяет читать книги в FB2.

2. EPUB (Electronic PUBlication) - самый популярный в мире электронный формат для читалок. С ним работают ридеры Barnes & Noble и Sony. По структуре верстки этот тип файла напоминает заархивированную веб-страницу, содержащую текст, графику, встроенные шрифты, иллюстрации.

Помимо западных брендов, формат EPUB поддерживается моделями производителей, ориентированных на российских рынок (Pocketbook, Onyx, Wexler) по причине стремительного роста популярности в нашей стране. Кроме того, данный стандарт электронных книг используют iPhone и iPad. Фирменная эппловская программа для чтения iBooks поддерживает именно EPUB.

3. MOBI - формат электронных книг ридеров Amazon Kindle. Получает распространение в российских онлайн-библиотеках по мере того, как Kindle становится все более популярным в России. Другие ридеры имеют поддержку этого формата "для галочки". MOBI по своим свойствам схож с EPUB. Недавно Amazon представил еще один формат электронных текстов Kindle Format 8 или KF8 (его отличает более богатое форматирование) с уточнением, что новые и старые читалки Amazon не перестанут поддерживать MOBI.

4. TXT - формат простых текстовых документов. Преобразовать текст из другого формата в TXT можно простейшим действием "копировать-вставить". Несмотря на то, что данный тип файла поддерживает практически всеми читалками и занимает в памяти очень мало места, читать в нем книги на ридерах мы бы не рекомендовали. В TXT отсутствует форматирование, разметка, переносы, выравнивание. Он подходит для коротких текстовых заметок, но не для полноценных электронных книг.

5. PDF (Portable Document Format) - формат электронных документов, созданный компанией Adobe Systems. Неудобен для использования на ридерах по ряду причин. Во-первых, файлы этого форматах очень громоздкие, так как рассчитаны под мощности компьютера, и на читалках открываются достаточно медленно. Во-вторых, если файл специально не сверстан под экран 6-дюймового ридера, имеющий формат аналогичный бумажному листу размера A6, то читать на нем PDF формата A4 (а большинство PDF-файлов представлены именно в размере стандартного бумажного листа), будет очень трудно. В PDF можно увеличить только масштаб, но не размер шрифта, а значит, на экране получится разместить только какую-то часть страницы. Читать страницы придется по частям, а это очень неудобно.

Для чтения PDF приспособлены 9-дюймовые электронные книги, размер экрана которых позволяет воспроизвести страницу в масштабе, достаточно крупном для комфортного чтения.

6. DJVU - формат, разработанный для хранения сканированных документов - книг, статей, рукописей. Книга в DJVU фактически представляет собой набор сканированных страниц. В плане комфортности чтения на 6-дюймовых читалках - все аналогично истории с PDF. Вы не увеличите размер шрифта, а только масштаб. При зумировании страница вылезет за пределы экрана, и надо будет постоянно перемещать область увеличенного текста для чтения – о комфортном чтении говорить не приходится. Для чтения DJVU выбирайте риедры с экраном 9 дюймов. Впрочем, даже на 9-дюймовых читалках возможности удобного чтения DJVU зависят от того, насколько качественно отсканирована книга, представленная в этом формате.

7. LRF - в прошлом фирменный формат ридеров Sony. На новых моделях Sony Reader (начиная с PRS-T1) уже не используется, так как уступил свое место EPUB. Очень плохо конвертируется в другие типы файлов. Несмотря на то, что кое-где в библиотеках еще представлен, использовать его рекомендуется исключительно владельцам старых моделей Sony.

8. RTF (Rich Text Format) - формат для хранения текстовых документов. Относится к категории "компьютерных", а не "книжных". На ридерах читать в RTF не слишком удобно - это большие по объему файлы, и скорость работы читалки на порядок снижается.

9. DOC (а также DOCX) - текстовые документы Microsoft Office. Эти форматы поддерживают достаточно много ридеров, но именно для чтения документов, а не книг. Файлы большого объема в этом формате могут быть велики по размеру, и работать с ними на ридерах непросто. Многостраничные книги в DOC лучше конвертировать в FB2 или EPUB.

Основные форматы электронных книг мы перечислили. Совсем экзотические типы файлов, которые иногда встречаются в интернете, мы рассматривать не станем, а лучше определимся, в каких из вышеперечисленных форматов удобнее всего читать книги на электронных ридерах.

Если у вас читалка с поддержкой всех форматов, то остановить свой выбор на определенном типе файла, можно исходя из ряда факторов. Допустим, Вы покупаете свою первую электронную книгу, и у вас нет предварительно собранной коллекции книг, например, в FB2. В этом случае выбирайте тот формат файла, который лучше всего воспроизводится вашим ридером. Традиционные "книжные" форматы EPUB или FB2 для ридера (да и для пользователя) более предпочтительны и удобны, чем "компьютерные" PDF, TXT, DOC, DOCX и RTF.

В случае с 9-дюймовыми читалками и необходимостью чтения DJVU и PDF при прочих равных советуем отдавать предпочтение последнему, так как PDF представляет собой более современный формат, а книги в DJVU часто бывают плохого качества.

С точки зрения удобства использования плюсы "книжных" форматов очевидны: EPUB, FB2 или MOBI визуально лучше выглядят в меню Вашего ридера (отображаются обложки книг), их удобнее сортировать (есть тэги: автор, название, жанр), они занимают в памяти гораздо меньше места и скорость работы читалки с такими форматами будет существенно выше.

На наш взгляд, совсем необязательно выбирать всеформатный ридер. Многие пользователи, имеющие читалки с поддержкой всех форматов, загружают книги одном-двух типах файлов. У всех читалок (в том числе у мультиформатных), так или иначе, есть основной формат, и размениваться на другие вы в итоге не станете. Для Pocketbook, Onyx и Wexler основные форматы - это FB2 или EPUB, для Barnes & Noble (электронные книги Nook) и Sony - EPUB, для Kindle - MOBI.

В случае с читалками Amazon и Barnes & Noble, если нужная книга оказывается в формате, который эти ридеры не поддерживают, можно воспользоваться конвертером (например, Calibre). Это программа, устанавливаемая на компьютер и позволяющая переконвертировать тот же FB2 в MOBI или EPUB за считанные минуты.

Читать книги в родном для ридера формате лучше, чем использовать установленные на читалку дополнительные программы. Наш совет: потратьте несколько минут для того, чтобы преобразовать книгу, например, из RTF в EPUB с помощью конвертера Calibre. Это удобней, чем читать ее "в оригинале" с помощью дополнительно установленной программы (на Sony PRS-T1 или Kindle) или столкнуться с более медленной работой устройства (например, на ридерах Pocketbook).

Помните, что главное - удобство пользования электронной книгой, а не количество форматов, заявленных у нее в параметрах.

Обычно таким образом распространяется в сети не художественная литература, а книги содержащие рисунки, графики, формулы и прочие вещи, которые довольно сложно перевести в цифровой формат с помощью программ распознавания текстов.

Коллаж на тему формата Djvu

Поначалу я считал, что этот странный формат djvu (дежавю — что это такое) представляет из себя обычный набор растровых изображений (фотографий), которые получились в результате сканирования книги. Но в этом случае размер файла был бы очень большим, а мы это не наблюдаем.

Что же представляет из себя файл с таким загадочным расширением и каким образом его можно открыть, чтобы начать чтение заключенной в «дежавю» информации, и какие программы при этом лучше всего использовать. На все эти вопросы я попытаюсь ответить в этой статье.

Что из себя представляет файл в формате Djvu

Оказывается, что djvu был разработан около пятнадцати лет назад и представляет из себя очень удачную смесь тестовых и графических форматов. В принципе, при оцифровке книг возможно два варианта развития событий:

  1. Производить распознавание текста на отсканированной странице и сохранять его с применение алгоритмов сжатия, что позволяет получить очень малый вес итогового файла. Недостатком является то, что теряются изображения, фон, записи на полях, загнутые уголки и прочие вещи, которые могут быть важны в некоторых случаях. Но зато по распознанным текстам можно будет вести полноценный поиск.
  2. Можно сохранять отсканированные тексты в виде картинок, для чего подойдут такие форматы растровой графики, как gif, png, jpeg или tiff. Однако при этом вес даже одной отсканированной страницы будет чрезмерно высок, если мы захотим сохранить качество. Ну, и невозможно будет вести поиск по текстам.

Достоинства описанных выше способов объединяет в себе Djvu, при этом практически не имея недостатков. Формат Дежавю можно отнести к текстово-графическим, что само по себе уже звучит необычно, но зато сулит массу дивидендов. Судите сами:

  1. Исходное отсканированное изображение сжимается в Djvu в десять раз плотнее, чем это было бы при использовании JPEG и при этом практически не изменяется его качество. При этом jpeg обязательно размоет и текст, и графику, и все что только можно, а наш герой все оставит в первоначальном виде.
  2. Лист формата A4, отсканированный и переведенный в дежавю, будет весить в районе 50 килобайт (читайте про то, сколько килобайт в мегабайте), если исходник был с цветной графикой (или фоном), и в районе 10 килобайт — если черно-белый. Лепота, и это с учетом того, что сканирование производилось в высоком разрешении 300 DPI. Тот же файл, сохраненный в формате tiff (без потери качества), весил бы в несколько сотен раз больше.
  3. Файл Djvu содержит текстовый слой, по которому можно вести полноценный поиск, а при желании можно оставить только его (удалив цветовую маску и фоновую информацию), что еще существеннее уменьшит размер.

Достигается все это благодаря довольно оригинальному подходу. Я могу ошибаться, но, по-моему, он заключается в следующем:

  1. Разделяют между собой текст страницы и ее фон. Алгоритм отслеживает много факторов и при правильных настройках может даже выдрать текстовую составляющую с обложки журнал, где слова могут использоваться и в качестве фона.
  2. Текст сохраняется в однобитовом варианте (черно-белом) и сжимается довольно плотно.
  3. Отдельно сохраняется фон, который сжимается чуть менее эффективно.
  4. Информация о цвете текста и используемых в книге иллюстраций так же сжимается, но уже по другому алгоритму.
  5. Как я уже упоминал, формат Djvu предусматривает наличие отдельного текстового поля, благодаря которому можно осуществлять поиск по отсканированным книгам.

Но вопросы создания и принципов формирования данных в файлах дежавю нас интересуют постольку-поскольку, а гораздо интереснее будет узнать, каким образом их можно открыть и прочитать Djvu.

Естественно, что для этой цели используются специальные программы для чтения (ридеры), которые имеют место быть и для компьютера, и для мобильных устройств на базе Андроида или iOs (ipad, iPhone). Удобно же ведь по дороге домой или на работу повысить свой уровень образованности благодаря чтению на мобильнике умной книжечки.

Чем открыть Djvu — программы для чтения на компьютере

Существуете несколько программ, которые ориентированы на работу только с файлами дежавю, а есть ряд универсальных решений, которые позволяют читать книги практически в любом виде. Так же имеются редакторы Djvu, которые позволяют корректировать или даже создавать свои собственные шедевры.

Среде ридеров Дежавю, предназначенных для компьютера, стоит выделить следующие читалки:

WinDjView — это первая программа, с которой я познакомился уже много лет назад и которой продолжаю пользоваться для чтения книг и журналов в формате Djvu до сих пор.

Она полностью поддерживает русский язык и ее даже успел охомутать «великий и ужасный» Yandex, принуждая вас чуть ли не силой сделать Яндекс домашней страницей и поиском по умолчанию во всех ваших браузерах:

Установка WinDjView на компьютер

В общем-то они дают возможность отказаться от всего этого богатства (включая Элементы), но далеко не все при установке программы обращают на это внимание. Конечно же, у той же поисковой системы Вебальты все это выглядит еще более навязчиво, но и ведущий поисковик рунета тоже уже все бесплатные программы заполонил своими надстройками по самое «не балуйся».

Окно программы WinDjView с открытой в ней книгой

Как я уже упоминал, в Djvu может быть зашит текстовый слой, поэтому при чтении книг содержащих его можно осуществлять поиск по словам и фразам.

Слева у WinDjView имеется навигатор с миниатюрами страниц, а вверху расположена панель инструментов, где можно открыть новый файл, поменять масштаб и тип отображения страниц (бесконечная лента или имитация разворота книги), а также повернуть их при необходимости на угол кратный 90 градусам.

Что примечательно, эта читалка формата дежавю открывает новые книги на новых вкладках, что позволяет работать сразу с несколькими материалами в одном окне программы. Еще имеется возможность делать закладки и оставлять комментарии (из контекстного меню правой кнопки мыши). Можно использовать экранную лупу с панели инструментов и полноэкранный режим просмотра (в этом случае странички можно листать простым щелчком мыши).

Если выбрать из меню программы WinDjView «Файл» — «Настройки», то на второй вкладке можно будет задать инвертирование цветов (например, для того чтобы читать белый текст на черном фоне), а так же настроить яркость, контрастность или гамму для лучшего восприятия документа в формате Djvu.

Настройки отображения в программе WinDjView

В начале статьи я упоминал, что в дежавю отсканированный документ разбивают на черно-белую текстовую составляющую, фон и информацию о цвете переднего плана. Так вот, в WinDjView все это можно наглядно увидеть, выбрав из меню «вид» — «режим».

DjVu Reader (DjVuReader) — говоря, что WinDjView была моей первой программой для открытия djvu, я немного ошибся, ибо таковым был именно дежавю ридер, который сейчас уже авторами не поддерживается.

Последняя актуальная версия датируется 2005 годом (версия 2.0.0.26) и ее совместимость с современными ОС не гарантируется, хотя на моей Windows Vista он по-прежнему работает, правда не так шустро, как его современный аналог описанный чуть выше. Установки он не требует и работает прямо из папки, куда вы распаковали архив с программой.

Окно программы DjVu Reader с открытой в ней книгой

Официальный сайт разработчика находится на Народе от Яндекса (который сейчас был отдан на растерзание Юкозу) и представляет из себя не очень приглядное зрелище. Собственно, сам разработчик советует использовать вместо его DjVu Reader современный WinDjView, что лично я и делаю.

STDU Viewer — по ссылке доступна как портативная, так и обычная версия универсальной программы-ридера, которой по силам не только открыть Djvu файл, но и PDF, FB2, EPub, постраничный TIFF и многие другие популярные форматы. В общем это комбайн, который очень даже неплохо справляется со своей задачей.

При установке нужно поставить галочку, что вы не будете использовать эту читалку в коммерческих целях, чтобы не платить за программу.

Обещание не использовать STDU Viewer в коммерческих целях

Ну, и так же STDU Viewer спросит вас, с какими именно расширениями файлов вы хотели бы его ассоциировать, кроме дежавю.

Выбор форматов, которые потом будет по умолчанию открываться в STDU Viewer

В принципе, в этой читалке нет чего-то такого глобального, чего не было бы в WinDjView, но. Во-первых, подкупает огромное количество форматов, которые можно открыть и прочитать с помощью этой программы.

Во-вторых, очень удобный и продуманный интерфейс.

Практически весь функционал ридера выведен в виде панелей инструментов, расположенных по всему периметру окна программы. То место, где обычно отображают миниатюры страниц читаемой книги, имеет целых шесть вкладок расположенных внизу.

Не все они применимы к Djvu, но все же. Те же закладки, которые можно будет оформить в виде дерева, вполне смогут заменить отсутствующую навигацию по вашей настольной книге или справочнику.

Настройки яркости и контраста тоже выведены в виде иконки в правом нижнем углу, где так же находятся и кнопки переключения режима отображения документа.

В-третьих, имеются некоторые приятные функциональные изыски, которые помогут при повседневной работе с STDU Viewer:

Ну и, в-четвертых, это огромное число настроек, которые можно сделать в STDU Viewer, чтобы данный ридер полностью подходил под ваши привычки и потребности.

Например, можно настроить (Файл — Настройки программы) даже внешний вид вкладок, что, конечно же, является пустячком, но довольно приятным:

Djvu читалки для Андроида и iOs (iPad и iPhone)

Почему-то читать книги у меня получается в основном в дороге, а за стационарным компьютером всегда находится масса других, более важных и интересных дел. В связи с этим у меня встала задача скачать какой-нибудь подходящий дежавю ридер для моего любимого iPad, полученного в подарок от Профит Партнера, но и в купе ко всему — для телефона на базе Андроида.

При этом я стараюсь перепробовать все бесплатные варианты программ и приложений, прежде чем прийти к выводу, что другого варианта, как расстаться с кровнозаработанными, у меня не остается. Собственно, основными кандидатами на место Djvu читалки для iOs в интернете рекомендуют DjVU Book Reader.

Вроде бы все хорошо, и отзывы, и скриншоты, но вот просят за него хоть и небольшую, но все же сумму денег (169 рублей). Мне подумалось, что на этой софтине свет клином не сошелся и я в Apple Store ввел в поисковой строке слово Djvu и попросил отфильтровать только бесплатные приложения.

Приложения для чтения Djvu на телефоне и планшете

После тестирования на предмет открывания различных файлов в формате дежавю и оценки удобства использования и функционала, среди бесплатных программ для iPad выявился однозначный лидер — KyBook.

Софтинка уникальная, на мой взгляд, ибо при своей бесплатности полноценно поддерживает EPUB, FB2, PDF, DJVU, CBR, CBZ и аудиокниги в формате MP3, M4A, M4B.

При чтении странички красиво перелистываются (анимацию можно настроить), есть масса настроек и функциональных возможностей, таких как создание закладок, оставление заметок, поиск по содержимому книги и т.п. вещей, которые доступны из верхней панели инструментов.

Настройки приложения KyBook на планшете

Настроек у читалки KyBook неожиданно много:

Открываем документ в формате Djvu в KyBook

В том числе имеется отдельная группа настроек этого ридера для форматов PDF и DJVU:

Настройки отображения документов в KyBook

В библиотеке данного ридера можно осуществлять сортировку книг, создавать для них полочки, перемещать файлы между ними, переименовывать и делать все, что обычно требуется от подобных программ.

Кроме этого, имеется возможность использовать имеющиеся у вас приложения для работы с облачными хранилищами типа Облака DropBox, Яндекс Облака или Гугл драйв.

чтение книг через KyBook из облачного хранилища

Правда, предоставляя доступ к своим файлам в Дропбоксе и других облаках, KyBook вас предупреждает, что он их даже может изменять, что лично мне не очень по душе.

Поэтому я Djvu файлы кидают в папку Dropbox на компьютере (по Wi-Fi), после чего открываю одноименное приложение на Ipad и добавляю их в избранное, чтобы они потом не тянулись по мобильному инету, который не всегда быстрый и к тому же лимитированный.

Когда хочу почитать одну из загруженных дежавю книг или журналов, то в Дропбоксе на Айпаде просто кликаю по нему, а потом выбираю вариант ее открытия в KyBook.

Открытие Djvu на планшете через KyBook

Мне кажется, что так будет безопаснее.

Теперича пора переходить к вопросу, как открыть Djvu на Андроиде. Интернет подсказал мне, что оптимальными вариантами являются два бесплатных приложения, которые и используются мною до сих пор, ибо особых нареканий по их работе у меня не появилось, но на всякий оставил их оба — вдруг какой-нибудь крученный файл дежа вю один из них открыть не сможет.

Итак, представляю вам читалки дежавю для Андроида:

EBookDroid — очень красивый и вполне работоспособный ридер форматов PDF, DjVu, XPS, Comic books, fb2, EPUB и RTF. Для заливки файликов на устройство я опять же использовал Dropbox, который при попытке открыть в нем дежавю-книжку предлагает мне выбрать одну из двух установленных на телефоне читалок:

Приложение EBookDroid

Библиотека в EBookDroid очень классно стилизована под книжные полки с паутинкой и вашими фолиантами, стоящими в рядок:

Книга в формате Djvu на полке в библиотеке EBookDroid

Просмотр книги в этой читалке осуществляется простым скроллингом пальцев, а из верхнего меню можно получить доступ к огромному числу настроек этой замечательной программы:

Orion Viewer — неплохая альтернатива описанной выше читалке. Умеет практически все то же самое, поддерживает форматы pdf, djvu, xps и cbz.

Приложение Orion Viewer для чтения Djvu на вашем телефоне или планшете

Из преимуществ перед предыдущим ридером, можно назвать хитрую систему разрезания больших листов (например, журнальных) на фрагменты как по горизонтали, так и по вертикали (например, на четыре экрана каждую страницу), которые будут подгружаться друг за другом простым двойным кликом по экрану.

Именно благодаря последней особенности Orion Viewer позволяет довольно комфортно читать большеформатный DjVu и PDF на сравнительно небольшом экране смартфона. Работает по субъективному впечатлению побыстрее, чем предыдущая читалка для Андроида, хотя разница не особо большая.

Комментарии и отзывы (7)

Спасибо, Дмитрий, за полезную статью.

В последнее время приходится встречаться с новыми (для меня) форматами электронных книг и порой не знаешь, как к ним подступиться.

Буквально вчера потратил несколько часов, чтобы разобраться с купленной в ОЗОНЕ книгой, которая оказалась ePub.

Хочу задать еще один вопрос по близкой теме.

AMAZON не продает книги в обычных электронных форматах, только бумажные. Для тех, кого это не устраивает предлагается приобрести специальную железяку () с программой — Kindle. Цена 69 дол., но при переводе валюты получается раза в 3 дороже. Если не заказывать часто книги на английском, то для 2-3 книг вроде и смысла нет.

А Вы знаете об этой Kindle?

Поделитесь своим мнением.

Блог по-моему о сайтах? или мы уже всё разобрали?)

Александр Логинов: не компетентен в этом вопросе.

Andrey: читаю в этом формате книжки про сайты, их создание, продвижение и т.п. — уже аргумент в пользу его обсуждения.

Ценность этого обзора разных программ — методов чтения книг в разных системах, увы!, уничтожается отсутствием дат этого творения, даты написания статьи.

Согласитесь, что программы 90-х годов очень отличаются от 2010—2016 гг.

Любая информация только тогда становится полезной, если она привязана к дате.

Иначе — это просто демонстрация собственной эрудиции, а не потребителя.

Спасибо большое. Очень хорошая статья, даже независимо от времени))) Все очень доходчиво. Спасибо.

Читайте также: