Как в djvu reader перевернуть изображение

Обновлено: 07.07.2024

  • ЖАНРЫ 360
  • АВТОРЫ 278 511
  • КНИГИ 657 983
  • СЕРИИ 25 232
  • ПОЛЬЗОВАТЕЛИ 614 322

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро

Итак: перед вами взятая у приятеля, из библиотеки, или просто хорошая, интересная книга, которую хотелось бы иметь на компьютере. И не просто иметь, а иметь в таком виде, который позволил бы выполнять поиск по тексту, удобно читать книгу на экране монитора или на устройствах еВоок, а если это не научно-техническая или справочная литература – еще и читать на любимом сотовом телефоне, iPhon'e или PDA. В этом пошаговом руководстве, основанном на собственном опыте, я постараюсь рассказать о том, как «выжать» максимум результатов из проделанной простой, но иногда весьма утомительной работы по сканированию книги.

Пусть вас не испугает длина этого руководства и кажущаяся сложность сканирования и обработки книги. Процесс действительно довольно сложен и многоступенчат, но поверьте мне, описать все эти операции было гораздо труднее, чем выполнить их шаг за шагом.

Шаг 1. Сканирование

1.1 Подготовка к процессу

Сканирование, с которого начинается, зачастую, долгий путь «в Сеть» любой изданной когда-либо книги (рынок легальных электронных книг, размещаемых издателями непосредственно после электронной верстки, у нас совершенно неразвит) – это самая монотонная часть всей предстоящей работы, поэтому к ней стоит тщательно подготовиться заранее – протереть стекло сканера, проверить наличие свободного места на диске – несжатый скан одной средней по размеру книги может занимать до 1 Гбайт. Потом начинается собственно сканирование.

Я намеренно не привожу здесь сравнительных характеристик разных моделей сканеров, поскольку каждый из нас в подавляющем большинстве случаев располагает только одним сканером, характеристики которого более или менее хорошо известны.

Phistek OpticBook: преимущества и недостатки

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - pic_1.jpg

Из всех сканеров, имеющихся на рынке, для сканирования книг в больших количествах нет ничего лучше серии Plustek OpticBook. Эти планшетные сканеры отличаются высоким корпусом и прозрачным основанием, выполненным "в край" – так, чтобы на него можно было уложить книгу, не ломая и не деформируя корешок. Такой сканер – идеален для перевода в электронный вид десятков томов, например из библиотеки университетской кафедры. Однако, для домашнего повседневного применения он практически непригоден. Причина этого – в сугубой спецbализированности устройства под книгосканирование и OCR. В конструкции PlusTek OpticBook в жертву быстродействию и разрешению принесено все, что только можно, включая четкость, избирательность и цветопередачу.

Сканирование всех своих книг я проводил и провожу на достаточно старом (2003 года выпуска) полупрофессиональном планшетном сканере для документсистем Hewlett-Packard ScanJet 6390с. Эта машина отличается высоким быстродействием (15-25 сек на страницу формата А4 в режиме градаций серого). Кроме того, в ее комплект поставки входит удобное программное обеспечение HP Precision Scan Pro. Именно на этой программе сделаны все скрины с примерами сканирования.

Заранее хочу предостеречь от использования в качестве основного инструмента сканирования программы FineReader. Оставим эту программу до стадии OCR. Пока она может лишь максимально усложнить нам задачу пакетной обработки, применив (причем, без нашего ведома) – свои не слишком хорошие алгоритмы чистки и сжатия сканов. А главное – она практически лишит нас шансов применить важнейший прием – оверсемплинг до разрешения 600 dpi.

Собственно сканирование состоит из трех этапов: сканирования обложки, основной части книги, цветных вклеек и иллюстрации. Последовательно описывать эти этапы нет смысла – они переплетаются друг с другом в зависимости от верстки книги. Стоит привести лишь параметры сканирования, оптимальные для разных типов книжных страниц.

Здесь приведу еще одно важнейшее предупреждение(!):

На некоторых очень старых моделях сканеров есть возможность вручную включать внутренний оверсемплинг, тo есть фактически сканировать с меньшим разрешением, чем имеет выходной файл. Обозначается такая установка разрешения обычно словом Software или Resampled. Эту установку использовать нельзя! Ее включение приведет в полную негодность полученные файлы, и их дальнейшая обработка окончательно потеряет смысл. Также нельзя использовать установку сканирования в режиме Linearеt или Black amp;White (одноцветный)

Общие рекомендации такие: для текстовых страниц используйте:

• Режим Grayscale (оттенки серого), для цветных иллюстраций и обложек – True Color (полноцветный).

• Разрешение сканирования – 300 dpi (только оптическое, повторимся еще раз!).

• Остальные установки можно оставить по умолчанию.

Таблица 1. Оптимальные параметры сканирования

Эти параметры не являются догмой. Они определены опытным путем на нескольких моделях неспециализированных сканеров, и служат ориентировочным целям. Собственный набор оптимальных параметров книгосканирования всегда стоит определить экспериментально, отсканировав любимую книгу со всеми иллюстрациями и обложкой. Приводя эти параметры, я стремился обобщить их для применения на максимальном количестве моделей сканеров.

Разрешение: 300 dpi

Резкость: Low или Medium

Яркость и контраст: Любые, специальные параметры не использовать

Разрешение: 300 dpi

Резкость: Medium. High

Яркость и контраст: Любые, можно применить пресет B amp;W Photo

Разрешение: 300 dpi

Резкость: High можно применить пресет B amp;W Photo

Яркость и контраст: Определяются по предварительному сканированию

Режим: True Color

Разрешение: 300 dpi

Резкость: Low, можно применить пресет Photo

Яркость и контраст: Определяются по предварительному сканированию

Тип страницы: Цветная обложка или иллюстрация страничного формата

Режим: True Color

Разрешение: 300 dpi

Резкость: Low, можно применить пресет Photo

Яркость и контраст: Определяются по предварительному сканированию

Формат выходного файла: Uncompressed (Несжатый) TIFF(!)

Почему не JPEG?

Формат JPEG для сохранения сканов книжных страниц использовать можно, но не нужно.

Во-первых: потому, что этот формат даже при включенном сжатии без потерь (Quality = 100) оставляет артефакты в виде «квадратиков».

Во-вторых и самых главных: многократное пережатие при сохранении обработанного файла JPEG вновь в «свой» формат за 2-3 цикла обработки приводит изображение в негодность.

Отдельно коснемся использования сжатого (Compressed) TIFF: при сохранении сжатого изображения в TIFF можно использовать алгоритмы сжатия: ZIP. LZW (без потерь). JPEG (с потерями). Без хлопот программы распознавания вроде FineReader понимают только JPEG.

Со всеми остальными форматами проблемы могут возникать непредсказуемо (например, у меня FineReader 7.0 испытывает устойчивую «идиосинкразию» конкретно к формату сжатия LZW). Поэтому если нет особых проблем с наличием места на диске, лучше всегда использовать несжатый файл.

Доброго времени суток!

Я почти уверен, что любители электронных книг уже десятки раз встречались с этим форматом - DjVu (даже его написание несколько необычно?).

Он обладает уникальной особенностью: степень сжатия сканированного документа в нем (да и вообще любых картинок) - превосходит всех конкурентов (удивительно, но она выше чем у PDF). Благодаря чему, даже самую большую книгу можно поместить в компактный файл и передать ее по сети.

Однако, в силу специфичности формата, открыть его можно далеко не в каждой программе (да и открыв, во многих ридерах читать и пользоваться документом не так удобно). В этой статье порекомендую несколько незаменимых программок, которые открывают 99,99% DjVu-файлов, корректно их отображают, и позволяют комфортно работать с ними.

Для чтения (ридеры)

WinDjView

Главное окно программы WinDjView

Главное окно программы WinDjView

WinDjView - одна из самых быстрых и компактных программ для просмотра этого формата. Очень удобно, что в ней реализована непрерывная прокрутка страниц, слева предусмотрена панель быстрого перемещения по документу (содержание).

Отмечу также наличие функции расширенной печати (позволяет настроить распечатку так, как нельзя сделать в аналогичном софте). Программа основана на свободно распространяемой библиотеке DjVuLibre.

  • возможность открывать сразу несколько документов (с помощью вкладок, подобно браузеру);
  • наличие полноэкранной версии (облегчает чтение документа);
  • возможность создания закладок;
  • возможность настроить контрастность, яркость, цветовую гамму и пр. для комфортного времяпровождения;
  • экспорт странички в формат картинки (GIF, JPG и JPEG);
  • поддержка русского и всех популярных версий Windows 7, 8, 10.

Sumatra PDF

Чтение руководства по эксплуатации в Sumatra PDF

Очень удобная и компактная программа для просмотра всех популярных форматов электронных книг: PDF, DjVu, ePub, MOBI, XPS, CHM, CBZ и CBR. Вкупе с интерфейсом в стиле минимализма, низкими системными требованиями и простотой использования - делают ее одним из любимейших продуктов миллионов пользователей по всему Миру!

К тому же, Sumatra PDF полностью бесплатна, потребляет меньше памяти чем многие аналоги (скажем, Adobe Reader), не требует установки (можно носить с собой на флешке), поддерживает горячие клавиши, настройку отображения и т.д.

В общем, очень рекомендую к знакомству всем, кто еще не слышал об этом ПО.

Из минусов : могут быть некоторые проблемы при открытии старых DjVu файлов (видимо, все-таки, без штатного DjVu-ридера пока не обойдешься. ).

DjVuReader

DjVuReader - читаю книгу и пишу статью.

DjVuReader - читаю книгу и пишу статью.

Несмотря на то, что эта программа давно не обновлялась, со своей задачей она справляется отлично! Ее основные преимущества:

  • поддержка практически любых DjVu файлов;
  • наличие бокового меню с содержание, эскизами и пр. - позволяет быстро перемещаться по документу;
  • настройка яркости и контрастности изображения;
  • низкие требования к ПК: особенно заметно при открытии больших файлах на слабых машинах;
  • удобная навигация с помощью клавиатуры (можно не использовать мышку вообще!)
  • маленький размер, нет необходимости в установке;
  • поддержка русского, поддержка Windows XP, 7, 8, 10.

Из минусов (чисто на мой взгляд): нет плавной прокрутки страниц (привык я к этому очень).

Для создания DjVu (кодирование/декодирование)

DjVu Small

DjVu Small - как создать за 4 клика мышки файл DjVu

DjVu Small - как создать за 4 клика мышки файл DjVu

Это одна из самых простых программ для создания DjVu-файлов (из обычных картинок, с которыми все привыкли работать: TIF, JPG, BMP, GIF и PNG). Программа очень удобна, универсальна, работает практически во всех ОС Windows 98/NT/XP/7/8/10.

Отмечу, что программа может как сжимать одну или несколько картинок в DjVu (это называется кодированием ), так и разжимать (т.е. декодировать - получить/извлекать из DjVu картинки).

Программа не нуждается в установке. Поддерживает русский интерфейс.

Для сжатия картинок в DjVu в ней необходимо (см. скрин выше):

  1. открыть папку или файлы;
  2. выбрать папку, где будет сохранен полученный файл;
  3. выбрать качество (вот здесь довольно сложно дать конкретную рекомендацию, т.к. выбирать нужно исходя из исходного качества. Для начала я рекомендую выбрать вариант "Default", если качество/размер файла не устроит - поменяете на отличный вариант);
  4. нажать кнопку "Пуск".

DjVu DocExpress

Открываем файл

Очень мощная программа для создания и редактирования DjVu документов. Например, программа может перевернуть сразу все страницы на 90-80 градусов, создать ссылки на страницы внутри файла или на отдельные страницы в сети интернет.

Что касается создания в ней файла DjVu, то здесь все просто:

  1. сначала открываете одну картинку (любую). Используйте меню "File/Open" (см. скрин выше);
  2. далее щелкаете по картинке правой кнопкой мышки и в меню выбираете вариант "Insert Pages After" (т.е. вставить еще дополнительно картинки после этой). Выбираете сразу 10-20 (или сотню ) и добавляете в проект.

Вставка доп. картинок после этой

Задаем настройки и место сохранения

Задаем настройки и место сохранения

PdfToDjvuGUI

Главное окно

Одно из самых простейших решений - это PdfToDjvuGUI. Суть в том, что можно создавать DjVu не из картинок (как в предыдущих вариантах), а из PDF файла. В некоторых случаях это гораздо удобнее и быстрее.

После запуска программы, достаточно выбрать файл (кнопка "Add PDF"), а затем кликнуть по кнопке "Generate DjVu" (при необходимости задать настройки сжатия).

После чего запуститься автоматическое конвертирование файла (просто подождите пока "черное" окно будет закрыто). Файл DjVu будет создан в том же каталоге, в котором находился добавленный на конвертацию PDF.

Онлайн-сервисы конвертирования

Сейчас в сети довольно-таки много сервисов, предлагающих загрузить к ним файл и быстро его конвертировать в DjVu. Конечно, их вряд ли можно использовать для сканированных документов (все-таки, в них часто содержаться личные и корпоративные сведения). Но для примера, приведу парочку вариантов:

Существуют различные форматы файлов: для изображений, видео, аудио файлов, текстовых файлов и многие другие. Файлы, в которых хранятся картинки, особенно отсканированный текст, имеют два наиболее часто встречающихся формата: PDF и DjVu.

Слово DjVu расшифровывается как DeJaVu и с французского языка переводится как "уже виденное". Это расширение используется для сжимания изображений и файлов, подобно популярному формату pdf. Он наиболее распространен среди студентов, потому что является удобной и мало весящей альтернативой текстовым документам (Word, Excel и другие).

Формат Дежавю возник в 1998 году, но наибольшую популярность он стал приобретать в последние годы. Он был разработан специально для хранения и просмотра отсканированных документов.

Его активно используют:

ПК (персональные компьютеры). Ноутбуки и макбуки. Смартфоны. Планшеты.

Немаловажным является и то, что этот формат может передавать не только содержание отсканированного текста или изображения, но и полностью передать оформление станицы. Особенно это важно для исторических справок и документов. Отлично просматриваются в DjVu сканированные страницы книг, поэтому можно встретить много электронных библиотек, построенных именно на этом расширении.

Технология образования файлов данного типа достаточно проста: изображение сильно сжимается, теряя малую часть данных, которая не влияет на его качество и способность просматриваться. Не углубляясь в теорию, можно сказать, что сохраняясь в данном формате, файл теряет часть своих данных.

Программы для просмотра файлов формата DjVu: чем открыть

Чем открыть файлы DjVu на компьютере, смартфоне или планшете? Для просмотра этих документов необходимо иметь одну из специальных программ:

DjVu reader. Одна из первых программ, для открытия файлов формата djvu. Простота интерфейса делает управление программой полностью интуитивным. Имеет только англоязычную версию, полностью бесплатна. WinDjView. Программа совместима с большинством ОС, имеет множество языков интерфейса. WinDjView пришла на смену более простой программы DjVureader.

Через последние и полные версии программ возможна печать документа прямо из формата DjVu.

Как конвертировать в формат DjVu

Конвертирование из формата djvu, возможно только в pdf, как и наоборот. Из расширения pdf можно вывести документ в разные форматы (jpg, doc и другие).

Для изменения формата файла можно воспользоваться двумя способами:

Конвертирование в онлайн режиме. Существует много сайтов, которые предлагают свою помощь в конвертировании файлов разных форматов. Например, сайт Convertonlinefree предлагает бесплатный мгновенный djvu конвертер файлов DjVu в формат PDF. Для этого необходимо файл, который мы будем изменять загрузить на сайт при помощи кнопки "Загрузка". После того как документ успешно закачается на сайт, следует нажать соответствующую началу конвертирования кнопку. Программа для конвертирования "PDF to DjVu Converter". Это специально созданная программа для перевода данных из файла в формате pdf в файл в формате djvu. Они имеет простой, интуитивный интерфейс, быстро скачивается и устанавливается. Во вкладке "Basic" в первой верхней строке указываем путь к конвертируемому файлу, а в нижней чистой строке, при помощи кнопки "Указать" - адрес, куда необходимо поместить преобразованный файл.

djvu — сравнительно недавно появившийся формат для сжатия графических файлов. Стоит ли говорить, что компрессия, достигаемая этим форматом, позволяет обычную книгу поместить в файл размером в 5-10мб! Формату pdf до этого далеко…

В основном, в этом формате по сети распространяются книги, картинки, журналы. Для их открытия вам понадобиться одна из ниже-перечисленных программ.

Как открыть файл djvu

1) DjVu Reader

Отличная программа для открытия файлов djvu. Поддерживает настройку яркости, контрасности изображения. С документами можно работать в двух-страничном режиме.

Для открытия файла, нажмите на file/open .

DjVuReader_2013-12-07_11-14-21

Далее выберите конкретный файл, который вы хотите открыть.

Открыть_2013-12-07_11-15-01

После этого вы увидите содержание документа.

DjVuReader_2013-12-07_11-15-15

2) WinDjView

Программа для открытия файлов djvu. Один из самых опасных конкурентов для DjVu Reader. Эта программа более удобна: есть прокрутка всех открытых страниц колесиком мышки, более быстрая работа, вкладки для открытых файлов и пр.

  • Вкладки для открытых документов. Есть альтернативный режим открытия каждого документа в отдельном окне.
  • Непрерывный и одностраничный режимы просмотра, возможность отображения разворота
  • Пользовательские закладки и аннотации
  • Поиск по тексту и копирование
  • Поддержка словарей, переводящих слова под указателем мыши
  • Список миниатюр страниц с настраиваемым размером
  • Оглавление и гиперссылки
  • Расширенные возможности печати
  • Полноэкранный режим
  • Режимы быстрого увеличения и масштабирования по выделению
  • Экспорт страниц (или части страницы) в bmp, png, gif, tif и jpg
  • Поворот страниц на 90 градусов
  • Масштаб: страница целиком, по ширине страницы, 100% и пользовательский
  • Настройка яркости, контраста и гаммы
  • Режимы отображения: цветной, чёрно-белый, передний план, задний план
  • Навигация и скроллинг как мышью, так и с клавиатуры
  • Если требуется, ассоциирует себя с файлами DjVu в Проводнике

Django. Подробное.руководство.djvu - WinDjView_2013-12-07_11-22-41

Открытый файл в WinDjView.

Как создать файл Djvu

1) DjVu Small

Программа для создания файла djvu из картинок формата bmp, jpg, gif и пр. Кстати, программа может не только создавать, но и извлекать из djvu все графические файлы, которые находятся в сжатом формате.

Пользоваться ей очень просто. После запуска программы, вы увидите небольшое окно, в котором за несколько шагов можно создать файл djvu.

1. Для начала нажимаете на кнопку Open Files (красная единичка на скрине ниже) и выбираете те картинки, которые вы хотите запаковать в данный формат.

2. Вторым шагом выбираете место, где будет сохранен созданный файл.

Program Manager_2013-12-07_11-31-40

3. Выбираете, что сделать с вашими файлами. Document — > Djvu — это преобразовать документы в формат djvu; Djvu Decoding — этот пункт нужно выбирать, когда вы вместо картинок в первой вкладке выбираете файл djvu, чтобы его извлечь и получить его содержимое.

4. Select encoding profile — выбор качества сжатия. Лучшим вариантом будет эксперимент: взять пару картинок и попробовать их сжать, если качество вас устроит — то затем можно и всю книгу сжать с этими же настройками. Если же нет — то попробовать увеличить качество. Dpi — это количество точек, чем выше это значение — тем лучше качество, и тем больше получается размер исходного файла.

5. Convert — кнопка, которая запускает создание сжатого файла djvu. Время на эту операцию будет зависеть от количества картинок, их качества, мощности ПК и т.д. На 5-6 картинок ушло примерно 1-2 сек. на среднем по мощности компьютере на сегодняшний день. Кстати, ниже приведен скриншот: размер файла получился примерно 24 кб. из 1мб исходных данных. Нетрудно посчитать, что файлы были сжаты в 43* раза!

Program Manager_2013-12-07_11-32-25

2) DjVu Solo

Еще одна неплохая программа для создания и извлечения файлов djvu. Многим пользователям она кажется не такой удобной и наглядной, как DjVu Small, но все равно рассмотрим процесс создания файла и в ней.

1. Открываете файлы картинок, которые вы отсканировали, скачали, взяли у друзей и пр. Важно! Сначала откройте всего лишь 1 картинку из всех желаемых конвертировать!

DjVu Solo_2013-12-07_11-49-32

Важный момент! Многие не могут открыть картинки в этой программе, т.к. по умолчанию она открывает файлы формата djvu. Чтобы открыть другие графические файлы, просто поставьте в графе типы файлов значение как на картинке снизу.

2. После того, как ваша одна картинка была открыта, можно добавить остальные. Для этого в левом окне программы вы увидите столбик с маленьким превью вашей картинки. Щелкните по ней правой кнопкой мышки и выберите пункт «Insert page after» — добавить страницы (картинки) после этой.

DjVu Solo - [DjVu Small_2013-12-07_11-31-51.jpg]_2013-12-07_11-51-05

Затем выделяете все картинки, которые хотите сжать и добавляете в программу.

Открыть_2013-12-07_11-51-15

3. Теперь жмете на file/Encode As Djvu — произвести кодирование в Djvu.

DjVu Solo - [DjVu Small_2013-12-07_11-31-51.jpg]_2013-12-07_11-51-28

Далее просто нажимаете на «OK».

DjVu Solo - [DjVu Small_2013-12-07_11-31-51.jpg]_2013-12-07_11-51-35

В следующем шаге вас просят указать место, где будет сохранен кодированные файл. По умолчанию вам предлагается папка для сохранения та, из которой вы добавляли файлы картинок. Можно выбрать и ее.

Сохранить как_2013-12-07_11-51-44

Теперь вам необходимо выбрать качество, с которым программа сожмет картинки. Лучше всего, его подобрать экспериментально (т.к. у многих вкусы разные и давать конкретные цифры бесполезно). Просто оставьте сначала по умолчанию, сожмите файлы — затем проверьте, устроит ли вас качество документа. Если не устроит — то затем увеличьте/уменьшите качество и опять проверьте и т.д. пока не найдете свой баланс между размером файла и его качеством.

Compression Dialog_2013-12-07_11-51-51

Файлы в примере были сжаты до 28кб! Довольно неплохо, особенно для тех, кто хочет сэкономить место на диске, или у тех у кого медленный интернет.

Свойства djvu small_2013-12-07_11-31-51.djvu_2013-12-07_11-52-17

Как извлечь картинки из Djvu

Рассмотрим по шагам, как это делается в программе DjVu Solo.

1. Открываете файл Djvu.

2. Выбираете папку, куда будет сохранена папка со всеми извлеченными файлами.

Open Folder_2013-12-07_12-19-14

3. Нажимаете кнопку Convert и ждете. Если файл не большой (менее 10мб), то он раскодируется очень быстро.

DjVu Small_2013-12-07_12-19-24

Затем можно зайти в папку и увидеть наши картинки, причем в том порядке, в котором они были в файле Djvu.

Читайте также: