Создание электронных книг из сканов, DjVu или Pdf из бумажной книги легко и быстро - TWDragon, 4u4undr (2009)
-
Год:2009
-
Название:Создание электронных книг из сканов, DjVu или Pdf из бумажной книги легко и быстро
-
Автор:
-
Жанр:
-
Серия:
-
Язык:Русский
-
Рейтинг:
-
Ваша оценка:
Итак: перед вашими глазами позаимствованная у знакомого, из библиотеки, или просто напросто интересная, хорошая книга, которую хотелось бы иметь на компьютере. И не чтобы она просто была, а была в таком виде, который дал бы возможность производить поиск по тексту, удобно читать книгу или на устройствах еВоок или на экране монитора, а если это не техническо-научная или литература для справок – еще и читать на своем фавортином мобильном телефоне, iPhon'e или PDA. В этом поэтапном справочнике, основанном на личном опыте, я попытаюсь рассказать о том, как «выжать» наибольшее количество результатов из проделанной легкой, но порой весьма муторной работы по сканированию книги.
Пусть вас не страшит длина этого справочника и мнительная сложность обработки и сканирования книги. Процесс и в правду довольно сложен и многоэтапен, но поверьте мне, объяснить весь этот процесс было в разы сложнее, чем исполнить их шаг за шагом.
Создание электронных книг из сканов, DjVu или Pdf из бумажной книги легко и быстро - TWDragon, 4u4undr читать онлайн бесплатно полную версию книги
Предисловие автора
Итак: перед вами взятая у приятеля, из библиотеки, или просто хорошая, интересная книга, которую хотелось бы иметь на компьютере. И не просто иметь, а иметь в таком виде, который позволил бы выполнять поиск по тексту, удобно читать книгу на экране монитора или на устройствах еВоок, а если это не научно-техническая или справочная литература – еще и читать на любимом сотовом телефоне, iPhon'e или PDA. В этом пошаговом руководстве, основанном на собственном опыте, я постараюсь рассказать о том, как «выжать» максимум результатов из проделанной простой, но иногда весьма утомительной работы по сканированию книги.
Пусть вас не испугает длина этого руководства и кажущаяся сложность сканирования и обработки книги. Процесс действительно довольно сложен и многоступенчат, но поверьте мне, описать все эти операции было гораздо труднее, чем выполнить их шаг за шагом.
Итак, ПОЕХАЛИ!
Шаг 1. Сканирование
1.1 Подготовка к процессу
Сканирование, с которого начинается, зачастую, долгий путь «в Сеть» любой изданной когда-либо книги (рынок легальных электронных книг, размещаемых издателями непосредственно после электронной верстки, у нас совершенно неразвит) – это самая монотонная часть всей предстоящей работы, поэтому к ней стоит тщательно подготовиться заранее – протереть стекло сканера, проверить наличие свободного места на диске – несжатый скан одной средней по размеру книги может занимать до 1 Гбайт. Потом начинается собственно сканирование.
Я намеренно не привожу здесь сравнительных характеристик разных моделей сканеров, поскольку каждый из нас в подавляющем большинстве случаев располагает только одним сканером, характеристики которого более или менее хорошо известны.
Phistek OpticBook: преимущества и недостатки
Из всех сканеров, имеющихся на рынке, для сканирования книг в больших количествах нет ничего лучше серии
Plustek OpticBook. Эти планшетные сканеры отличаются высоким корпусом и прозрачным основанием, выполненным "в край" – так, чтобы на него можно было уложить книгу, не ломая и не деформируя корешок. Такой сканер – идеален для перевода в электронный вид десятков томов, например из библиотеки университетской кафедры. Однако, для домашнего повседневного применения он практически непригоден. Причина этого – в сугубой спецbализированности устройства под книгосканирование и OCR. В конструкции PlusTek OpticBook в жертву быстродействию и разрешению принесено все, что только можно, включая четкость, избирательность и цветопередачу.
Сканирование всех своих книг я проводил и провожу на достаточно старом (2003 года выпуска) полупрофессиональном планшетном сканере для документсистем
Hewlett-Packard ScanJet 6390с. Эта машина отличается высоким быстродействием (15-25 сек на страницу формата А4 в режиме градаций серого). Кроме того, в ее комплект поставки входит удобное программное обеспечение
HP Precision Scan Pro. Именно на этой программе сделаны все скрины с примерами сканирования.
1.2 Сканирование
Заранее хочу предостеречь от использования в качестве основного инструмента сканирования программы
FineReader. Оставим эту программу до стадии OCR. Пока она может лишь максимально усложнить нам задачу пакетной обработки, применив (причем, без нашего ведома) – свои не слишком хорошие алгоритмы чистки и сжатия сканов. А главное – она практически лишит нас шансов применить важнейший прием – оверсемплинг до разрешения 600 dpi.
Собственно сканирование состоит из трех этапов:
сканирования обложки, основной части книги, цветных вклеек и иллюстрации. Последовательно описывать эти этапы нет смысла – они переплетаются друг с другом в зависимости от верстки книги. Стоит привести лишь параметры сканирования, оптимальные для разных типов книжных страниц.