Djvu чем открыть форум

Обновлено: 06.07.2024

Очень хочется много интересных книг передать людям, а как создавать этот классный и компактный тип файлов я так и не нашел, подскажите пожалуйста как качественно перегнать книгу в DjVu? :7:

как создавать этот классный и компактный тип файлов я так и не нашел, подскажите пожалуйста как качественно перегнать книгу в DjVu? :7:

не понял что значит Качественно

Я имел ввиду как выглядит сам процесс создания файлов, как правильно очищать страницы после сканирования, как их откалибровать по размеру и как очистить от грязи, помогите плиз. я хочу не только брать книги с сайта, но и давать их людям. И еще: подскажите кто-нибудь, кто уже создавал книги в этом формате, сколько примерно килобайт должна весить отсканированная страница, в каком графическом формате лучше ее сохранять, с какими именно параметрами. Я сейчас собрался отсканировать детскую иллюстрированную энциклопедию по биологии, короче подскажите мне оптимальный баланс между размерами файлов и качеством. Не, ДеЖаВууу фиговый формат. Это чисто мое мнение. Почти pdf.
Подходит только для всяких там журналов с обилием графики.
Люди! Имейте совесть! Можно и через OCR прогнать книжку и получить махонький такой текстовый файлик. Хочешь - doc, rtf, txt. И распечатать можно, и форматнуть. А на Рапиде лежат иной раз чисто текстовые книги, блин, в djvu и pdf! А есть и по 30-60 метров! Безобразие!
Ну взял ты книгу у друга, кинул на сканер, потом вычитал, выложил.
Лепота! Любо-дорого как говорится и с экрана почитать, и распечатать можно в том виде, как душе угодно. Труд по вычитке, конечно, грандиозный, предлагаю организоваться народу по вычитке и выкладке неграфических djvu-шек (ну, где текстовой информации значительно больше). djsi, вообще-то и Djvu и pdf предусматривают возможность текстового слоя, и такие файлы не намного больше doc. Но это также естественно требует OCR и вычитки А все-таки:
djsi, вообще-то и Djvu и pdf предусматривают возможность текстового слоя, и такие файлы не намного больше doc. Но это также естественно требует OCR и вычитки
Чем и как такое можно сотворить, кто-нить подскажет?:6: подскажите еще плииз как мне отсканированный журнал в djvu загнать:)
:wow:

VyazalKa, DjvuOCR 2.0 final

В Document Express Editor, можно открывать и конвертировать файлы таких форматов: DjVu (*.djvu, *.djv), BMP (*.bmp), GIF (*.jpg), JPEG (*.jpg, *.jpg), PNM (*.pnm, *.ppm, *.pgm, *.pbm), TIFF (*.tiff, *.tif), PICT (*.pict).

Для создания DjVu-файла нужно отсканировать страницу (меню “File” -> “Scan Pages”), либо открыть уже готовое изображение поддерживаемого формата (меню “File” -> “Open”). Если в документ должен быть многостраничный, то при помощи меню “Edit” > “Insert Pages(s) Before” или “Edit” > “Insert Pages(s) After” вставить в документ до или после открытого изображения остальные изображения.

Затем при помощи меню “File” -> “Save As” сохранить документ в формате DjVu.

При сохранении файла программа предложит выбрать настройки: распознавать ли текст; профиль; разрешение (от 100 до 600 dpi); качество текста (возможны 5 уровней от «агрессивного», т.е. со значительной потерей до «без потери»), сохранять изображения каждое в отдельном или все в одном файле.

Так называемый профиль – это тоже настройки, только пользователь выбирает тип документа, а программа автоматически подстраивается под тип изображения.

Всего доступны 7 профилей:
1. «Нормальный» – для большинства отсканированных печатных документов
2. «Электронный» – для растровых изображений электронного происхождения, таких, как скриншоты и т.п.
3. «Фото» - для фотографий. При этом функция OCR не работает, поэтому функция поиска и копирования текста в созданном документе не будет работать.
4. «Битональный» - для черно-белых изображений
5. «Рукопись» - для старых или рукописных изданий без рисунков или фотографий
6. «Рисунок» - похож на «Рукопись», но с поддержкой рисунков и фотографий
7. «Карта» - похож на «Рисунок», но с лучшей поддержкой перевернутого текста

Этими настройками, как правило, действительно можно добиться удовлетворительного результата. После того, как настройки заданы, нужно выбрать место на локальном диске и сохранить файл в формате DjVu.
После сохранения добавляется возможность подсвечивать области в документе, вставлять внутренние (для самого документа) и внешние гиперссылки и т.п. Так же если при создании DjVu-документа не было задано распознавание текста, это можно сделать позже. Document Express Editor 6.0.1 умеет распознавать около 100 языков, в том числе русский и украинский.

Вообще вопрос о необходимости добавления текстового OCR-слоя при создании DjVu-документа является дискуссионным. Помимо того, что процедура распознавания текста занимает значительное время, OCR-слой увеличивает размер DjVu-файла. Однако наличие текстового слоя очень удобно при дальнейшей работе с электронной книгой. Во-первых, появляется возможность копировать нужные фрагменты текста для последующей обработки; во-вторых – искать по ключевому слову или выражению в самом DjVu-документе и среди всего множества DjVu-документов как на локальных дисках, так и в сети. Функция поиска по ключевому слову присутствует практически во всех DjVu-программах. Для поиска в Интернет нужно использовать специальные программные средства, например, Google Desktop Search + DjVu Indexer Plugin или LizardTech DjVu IFilter 1.1.

Читайте также: