Как из электронной книги сделать бумажную

Обновлено: 06.07.2024

Если в прошлом книги существовали в бумажном виде, то в последнее время появились цифровые форматы, в частности электронные книги.

С развитием Kindle и iPad, цифровое чтение стало гораздо более популярным, а электронные книги занимают довольно доминирующее положение на рынке. Это привело к дискуссии о том, заменят ли электронные книги бумажные.

Сейчас, конечно, никто не может ответить на этот вопрос наверняка, но есть вещи, на которые стоит посмотреть с обеих сторон. Они могут

Есть веские основания полагать, что электронные книги заменят бумажные, особенно когда мы движемся к миру, в котором доминируют технологии. Вот некоторые из основных причин, по которым мы думаем, что электронные книги в конечном итоге заменят печатные.

Представьте, что вы отправляетесь в отпуск на неделю или около того, и вам нужен материал для чтения. Если вы ненасытный читатель, вы можете взять с собой две или даже три книги! Многие книги, выпущенные сегодня, имеют тенденцию к увесистым томам, и они добавляют дополнительный вес и занимают место в багаже!

Что ж, если вы используете Kindle или электронную книгу, вы можете взять с собой сотни книг на одном небольшом устройстве. Это значительно удобнее. Кроме того, электронные книги на самом деле стоят дешевле, чем бумажные книги. Это верно для большей их части, и есть множество электронных книг, которые можно получить бесплатно.

Покупка электронной книги в магазине Kindle обойдется вам дешевле, чем покупка бумажной копии, и вы можете сделать это из собственного дома, даже не вставая с постели. Они не могут

Несмотря на некоторые очевидные моменты, вполне возможно, что печатные книги будут существовать еще долгое время. Вот почему мы думаем, что печатные книги еще долго будут популярными.

Конечно, это субъективно, но, как правило, книги обладают удивительной эстетической красотой. Подумайте о том, как хорошо переплет выглядит на вашей книжной полке. Подумайте, насколько изящная и умная коллекция Гарри Поттера выстроена в ряд. Это то, что вы просто не можете получить от хранения электронных книг на устройстве. В визуальной красоте бумажных книг есть что-то, что нельзя подделать.

Вот некоторые аргументы за и против электронных книг, заменяющих печатные. Все это может в конечном итоге произойти, но в будущем. Совершенно очевидно, что популярность электронных книг растет, но рынок бумажных книг все еще существует, и, пока они продолжают продаваться, они будут выпускаться.

Детство и юность, проведенная в маленьком городе, где в районной библиотеке из энциклопедий был лишь "Большой энциклопедический словарь" приучила к бережному, практически благоговейному отношению к любой технической книге. Я понимаю, почему люди пережившие блокаду все время держали дома запас продуктов. Первое время, получив доступ к более или менее скоростному интернету все время хотелось скачивать новые книги и сохранять их на жестком диске, сохранять, сохранять :). Потом появился twirpx и я понял, что книги, как и знания, должны участвовать в постоянном круговороте, иначе они мертвы. Стоило один раз отсканировать монографию своего научного руководителя и услышать десятки отзывов скачавших, как лавину уже было не остановить. Я заметил, что сегодня поделившись редкой книгой, завтра я увижу две, а то и три не менее редких, которыми поделились другие.


image

В годы студенчества из-за довольно узкой специализации, библиотека была практически вторым домом. Но библиотека библиотеке, как водится, рознь и при прочих равных гораздо удобнее читать (а также распознавать и сразу копировать в курсовую) странички, пусть и цифровые, но сидя дома. Поэтому сначала был планшетный сканер Mystek BearPaw2400, тонкий, с питанием от USB, но ужасно медленный. С уменьшением стоимость цифровых камер (и ростом разрешения) его заменил отличный быстрый фотоаппарат Canon PowerShot A720IS (имхо, один из лучших в линейке PowerShot-ов). Именно с его помощью я прочувствовал всю мощь оптической стабилизации :). Вопрос со скоростью сканирования был решен, но в угоду спешке пострадало качество. Чтобы не ходить по пятьдесят раз и не перефотографировать испорченные/пересвеченные/недосвеченные и т.п. страницы было решено решать возникшие проблемы программно.

Опыт, наработанный в результате изысканий (и десятков отсканированных книг) вылился в целые серии статей, посвященных особенностям обработки сырого книжного материала и доводки его до состояния "неплохой djvu копии". В том числе причиной написания были вопросы друзей и знакомых "а как это djvu сделать вообще, мне вот дали хорошую книгу на пару дней". Ниже привожу, на всякий случай ссылки:

  • Цифровое «книгопечатание». Книга за 5 минут.Часть 1, часть 2
  • Цифровое «книгопечатание» Пошаговое руководство по оцифровке книг.Часть 1, часть 2, часть 3
  • Цифровое «книгопечатание». Фотоаппарат вместо сканераСтатья

Увлечение сканирование пришлось на то время, когда только начинал наполнятся twirpx и нормально работал avaxhome. Отсканировав около полусотни книг, постепенно начали выкристализоваться алгоритмы, которые бы позволяли получать материал удобный для чтения на 10" планшете (не говоря уже про монитор компьютера) достаточно высокого качества и при этом экономить время, которое затрачивается на обработку одной книги.

Честно скажу, мне несколько раз очень хотелось сделать настоящий книжный сканер, вроде описанного на Хабре (Книжный сканер своими руками), или еще лучше такой как cделал крутой немецкий дедок (видео ч.1, ч.2, ч.3). Но мысли о самоделках посещают тогда, когда есть уйма свободного времени для размышлений (и материал, и инструмент и т.д., и т.п.). Чаще же всего этого под рукой нет, а книга нужна. И нужна срочно, да еще и в приемлемом качестве.

Поэтому уже довольно давно я пользуюсь несложным программно-аппаратным комплексом, который позволяет мне создавать довольно качественные копии книг за короткое время. К примеру на обработку одной 300 страничной книги (начиная от фотографирования и заканчивания кодированием в djvu) уходит примерно час, с использованием ПК на базе AMD Athlon II X4 640/16 Gb RAM/4 Tb SATA 3.0 HDD.





В джентельменский набор железа мобильного цифрового книгопечатника входят следующие позиции:

1) Смартфон Nokia PureView 808
2) Подвижный штатив-струбцина
3) Крепление для смартфона
4) Bluetooth пульт управления Coco CC-PC101

Смартфон от Nokia выбран за свою надежность и максимальный размер матрицы. Ну и люблю я его очень :) (и на Хабре ему пели дифирамбы). Из недостатков можно отметить то, что в отличие от Android-смартфонов мне пришлось довольно долго искать подходящий пульт, который бы заработал с моим телефоном. В итоге я остановился на Coco CC-PC101. Притом этот пульт работает только с программой CameraPro (cтандартное приложение его не подхватывает). При использовании Android подойдет любой копеечный пульт с Aliexpress.







Подвижная штанга, с помощью которой можно регулировать высоту смартфона над книгой — обычная селфи-палка палка-себяшка, но с наличием в нижней части стандартной резьбы 1/4" для прикручивания к струбцине/любой другой стойке. На aliexpress много вариантов, мне по цене/параметрам понравился "монопод для GoPro Hero 5 4 3"




Крепление для смартфона тоже первое попавшееся с резьбами 1/4", не самое дешевое (в отличие от проволочных вариантов), но мне понравилось своей формой. И пока никаких проблем с ним нет.

Штатив-струбцина — советского производства УТМ ЛСНХ. Чистый дюралюминий, настоящая радость для инженера, ну и просто очень надежный инструмент с множеством регулировок.


image

Смартфон у меня достаточно тяжелый, + вес телескопической штанги, поэтому пластиковым китайским струбцинкам я не доверяю. Но они имеют место быть.

Дополнение: При фотографировании в полевых условиях ч/б книг очень важным фактором является освещенность. Естественной (свет в библиотеке) часто бывает недостаточно. Помочь решить эту проблему могут переносные фото-лампы с aliexpress:




Из преимуществ можно отметить малый вес и встроенный башмак с резьбой 1/4" для крепления на стандартный штатив. Можно взять несколько таких ламп и расположить вокруг объекта фотографирования для создания равномерного освещения. Чтобы удобнее было лампы крепить — можно дополнительно к ним приобрести фото-клипсы с креплением 1/4" на том же aliexpress:




Сам процесс фотографирования особой сложностью не отличается. Книга располагается так, чтобы попадать в фокус камеры и с помощью пульта происходит фокусировка/съемка. Перевернули страниц — "фокусировка/съемка". При этом располагать книгу я стараюсь так, чтобы были видны все края (это нужно для выравнивания изгиба страниц в программе ScanTailor). Несколько хвалебных слов о ней. Раньше мне приходилось использовать либо довольно капризную (часто вылетала с ошибкой) и платную программу BookRestorer, либо "косноязычную" ScanKromsator (хотя более чем уверен, что у нее найдутся свои фанаты :) ). Но слава богу появилась ScanTailor и жизнь таких вот как я "книгопечатников" сильно упростилась. Вот что говорит Википедия по этому поводу:

Scan Tailor (англ. scan — сканировать, tailor — портной) — компьютерная программа для обработки изображений, полученных при помощи сканера. Является кроссплатформенной программой и работает под управлением операционых систем Microsoft Windows, Linux и Mac OS X. Высокий уровень программы был отмечен по итогам первого конкурса «Лучший свободный проект России» в 2009 году, проводимым журналом Linux Format
Основной плюс программы — это автоматическая обрезка, чистка и распрямление строк. Притом распрямление работает по тому же принципу, что и у японского «робота для сканирования книг» о котором писали на Хабре (Японский сканер оцифровывает книгу в 250 страниц за минуту). Позволю себе выдержку из этой статьи:
Открытая книга фотографируется с использованием лазеров (они формируют сетку на поверхности). При этом фотографирование производится сразу с нескольких ракурсов, после чего происходит автоматическое объединение всех трех кадров. Разработчики утверждают, что их способ позволяет избежать искажений, обычно проявляющихся при стандартном сканировании.

Тот же принцип используется и в ScanTailor, только расположение разметочной сетки на странице регулируется самим пользователем. Я выравниваю сетку по краям страниц (для этого при съемке они должны быть видны).



Пример страницы с использованием распрямления строк


После окончания работы программы в папке out будут готовые страницы. Их загружаем в любой конвертер DJVU (выбирать можно на сайте). Я использую DEE — Document Express Editor v6.0.1 Build 1320 LE (for NT) (Light Edition for NT) за маленький размер и шуструю работу. В принципе, после DEE книжку можно закидывать на любимую читалку/смартфон и использовать по назначению. Если время и силы позволяют — можно добавить OCR-слой и оглавление. Эти процедуры подробно описаны в моих статья, на которые я ссылался в начале статьи.

Надеюсь мой опыт будет полезен всем тем, кто фотографирует книги на телефон и читает их потом с картинок в галерее :)


Литару провёл несколько тестов и выяснил, что таким образом один пользователь, приноровившись, сможет за пять-десять минут оцифровать 600-страничную книгу. Сам он в 2004 году для дипломной работы вручную оцифровал тридцать тысяч страниц материалов из более чем семисот документов, используя обычную цифровую камеру и дешёвую настольную лампу. Большую часть этой работы Литару выполнил в течение пятнадцати часов в один из выходных дней.

Так это, дорогой Калев Литару, если читаешь Хабр — напиши мне, может чего посоветую :)

Важно! Все обновления и промежуточные заметки из которых потом плавно формируются хабра-статьи теперь можно увидеть в моем телеграм-канале lab66. Подписывайтесь, чтобы не ожидать очередную статью, а сразу быть в курсе всех изысканий :)

В современном мире, мире доступных знаний и относительно дешёвых книг, остаётся одна главная проблема: наличие времени на чтение. Желание читать предполагаем по-умолчанию.
Современные методики тайм-менеджмента, типа системы Дэвида Аллена под общепринятым названием «GTD» (Getting Things Done), или, если по-русски, «Как держать дела в порядке», позволяют проанализировать использование времени и выделить время почти на все интересующие дела, используя временные «дыры» - стояние в очереди, поездку в общественном транспорте, обед на работе и прочее подобное
Поэтому очень удобно иметь под рукой нужные книги в компактном устройстве, которое позволит читать во время таких перерывов. Но что делать, если книгу надо быстро прочитать, а в электронном виде её нет? Ответ прост – сделать её электронной!


Это не так сложно, как кажется

Ну, самый простой, который и способом-то назвать нельзя – это простое фотографирование на тот же смартфон отдельных глав книги, их проработка, и затем фотографирование следующих глав.

Для получения же полноценного файла в формате DOC, PDF или FB2, нам понадобится немного больше времени и используемых инструментов, среди которых:

1. Сканер
2. Программа анализа и распознавания отсканированных страниц - Abbyy FineReader или аналогичный софт
3. Текстовый редактор для подготовки итогового файла. Например, Microsoft Word, с которым удобно взаимодействует Abbyy Finereader. Так же новые версии Word позволяют сразу экспортировать получившийся документ в PDF.
4. Программы htmlDocs2fb2 и Fb2Fix для конвертации полученного документа формата DOC в формат FB2 для удобного чтения на практически любых устройствах.

Сначала мы просто сканируем книгу


Обычно, это один из самых времяёмких этапов создания электронной книги, но он же и самый простой и механистичный. Просто перелистывать страницы и сканировать. В зависимости от мощности компьютера и размера сканируемого изображения, количество времени на сканирование каждого разворота книги варьируется от нескольких десятков секунд до нескольких минут. Обычно же сканирование одного разворота занимает менее минуты.
Разрешение при сканировании ставлю не менее 300 DPI. Начиная с этого разрешения, распознавание происходит с минимальным числом ошибок.


Для книги я создаю отдельную папку, в которой накапливаются изображения. И через некоторое время, когда вся книга будет отсканирована, в этой папке будет множество изображений, с которых и будет происходить распознавание текста.


Для распознавания текста я использую программу Abbyy FineReader, которая не только хорошо распознаёт текст, но и предоставляет удобные инструменты для предварительной работы с изображениями.
Изначально в программе есть три базовых режима работы со вновь открываемыми изображениями, это:

-Открыть
-Открыть и распознать
-Открыть и проанализировать


«Открыть» - просто откроет изображение в программе, предоставляя пользователю самому решать, что делать дальше.

«Распознать» - программа сразу после открытия проанализирует файл на наличие текста, рисунков и таблиц, и распознает его, переведя текст в нормальный и привычный текст, доступный для редактирования, таблицы – сделает таблицами, а рисунки оставит рисунками.


После правки текста в Word, мы сохраняем его в формате DOC, т.е. получаем электронную версию книги для чтения на компьютере. Но программы для чтения эл. книг на смартфонах, а так же на «читалках» e-ink, как правило, могут прочитать в файлах DOC только текст. Картинки, таблицы и содержание пропадают. И тут на помощь приходят конвертеры файлов DOC в формат FB2, в котором практически все девайсы читают все типы данных, отображая и рисунки, и содержание.
Для конвертации я использую программу htmlDocs2fb2, которая производит файл формата FB2 из файла формата DOC, и программу Fb2Fix, которая анализирует получившийся файл FB2 на ошибки и исправляет их. Так же часто эта программа исправляет уже готовые, скачанные из Интернета, файлы FB2, и они начинают открываться на устройствах, на которых раньше не открывались.

Такая связка из двух программ была найдена путём долгих экспериментов с различными конвертерами. А эксперименты были вызваны поиском решения проблемы отображения таблиц. При конвертации DOC в FB2, таблицы превращаются просто в текст, который уже невозможно читать таблицей. Ключевая особенность программы htmlDocs2fb2 в том, что она превращает таблицы в рисунки, и, тем самым, позволяет их просматривать в любой программе для чтения электронных книг формата FB2. Оглавление так же сохраняется и его можно вызвать через отдельное меню, предусмотренное в программах.


Чаще всего я не сканирую книги с нуля, а конвертирую найденный в Интернете файл формата DOC в FB2. Различные материалы по экономике, с множеством таблиц и графиков, вполне корректно конвертируются.

Вот такой небольшой практикум. Тема очень обширна, и если расписывать все тонкости, то уйдёт с десяток страниц. Так что если появились вопросы по теме – попробую ответить, задавайте:)

В последние годы в обиход понемногу входят электронные новшества, например, гаджеты для чтения электронных книг. Они позволяют значительно уменьшить вред, который наносится вашим глазам, но полностью от него избавить не могут. Идеальным вариантом чтения литературы, полученной из интернета, является печать какой-либо книги на бумаге.

Как распечатать электронную книгу

  • Как распечатать электронную книгу
  • Как распечатать документ книжкой
  • Как напечатать книгу pdf
  • - электронный вариант книги;
  • - лазерный принтер.

Перед распечаткой или простым копированием электронных книг на свой компьютер полезно будет знать, что не каждый сайт отвечает за легальность появления данного материала, поэтому рекомендуется искать официальный источник раздачи бесплатных книг. Если вы желаете, можете купить произведение.

Помимо менеджера загрузки вам понадобится текстовый редактор. Вы можете воспользоваться и стандартным «Блокнотом», но рекомендуется использовать профессиональные программы с возможностью форматирования текста, например, Microsoft Office Word либо Open Office Writer (бесплатный аналог).

Вы не сможете распечатать без самого принтера. Если вы собираетесь распечатывать не одну книгу, выбор стоит делать в сторону лазерных принтеров, ориентируясь на будущее. Лазерные принтеры обеспечивают быструю печать, небольшой расход тонера (для монохромной печати) и окупают себя за полгода активного использования.

Откройте файл электронной книги, воспользовавшись контекстным меню либо при помощи уже открытой программы. Нажмите в главном окне программы сочетание клавиш Ctrl + O и выберите файл, затем нажмите кнопку «Открыть».

Нажмите сочетание клавиш Ctrl + P для вызова окна настроек печати. Укажите необходимое количество печатаемых страниц и нажмите кнопку «Печать». Также вы можете нажать кнопку «Свойства» напротив окна с выбором принтера, чтобы включить режим «Экономии тонера», если такой доступен для вашей модели.

Учтите, что опция «Двусторонняя печать» подразумевает изначально печать нечетных страниц, а затем только четных, т.е. по завершению печати одной партии вам необходимо перевернуть напечатанные страницы и снова их погрузить в лоток принтера.

Во время печати с электронных книг формата pdf и djvu у вас могут возникнуть некоторые трудности, например, не все страницы с первого раза отпечатаются или распечатанный текст оказывается не того масштаба, который вы хотели бы увидеть. Чтобы этого избежать рекомендуется использовать конвертер таких файлов в фотографии формата jpeg, которые можно будет легко и быстро распечатать.

Читайте также: