• Пожаловаться

TWDragon Array: Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро

Здесь есть возможность читать онлайн «TWDragon Array: Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро» весь текст электронной книги совершенно бесплатно (целиком полную версию). В некоторых случаях присутствует краткое содержание. год выпуска: 2009, категория: Программирование / на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале. Библиотека «Либ Кат» — LibCat.ru создана для любителей полистать хорошую книжку и предлагает широкий выбор жанров:

любовные романы фантастика и фэнтези приключения детективы и триллеры эротика документальные научные юмористические анекдоты о бизнесе проза детские сказки о религиии новинки православные старинные про компьютеры программирование на английском домоводство поэзия

Выбрав категорию по душе Вы сможете найти действительно стоящие книги и насладиться погружением в мир воображения, прочувствовать переживания героев или узнать для себя что-то новое, совершить внутреннее открытие. Подробная информация для ознакомления по текущему запросу представлена ниже:

TWDragon Array Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро
  • Название:
    Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро
  • Автор:
  • Жанр:
  • Год:
    2009
  • Язык:
    Русский
  • Рейтинг книги:
    3 / 5
  • Избранное:
    Добавить книгу в избранное
  • Ваша оценка:
    • 60
    • 1
    • 2
    • 3
    • 4
    • 5

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Эта мини инструкция в картинках, описывающая полный цикл создания электронной версии научно-технической книги, и предназначена для человека, искренне захотевшего сделать приемлемого качества е-книгу, но не знающего с чего начать. Итак: перед вами взятая у приятеля, из библиотеки, или просто хорошая, интересная книга, которую хотелось бы иметь на компьютере. И не просто иметь, а иметь в таком виде, который позволил бы выполнять поиск по тексту, удобно читать книгу на экране монитора или на устройствах еВоок, а если это не научно-техническая или справочная литература – еще и читать на любимом сотовом телефоне, iPhon'e или PDA. В этом пошаговом руководстве, основанном на собственном опыте, я постараюсь рассказать о том, как «выжать» максимум результатов из проделанной простой, но иногда весьма утомительной работы по сканированию книги. Пусть вас не испугает длина этого руководства и кажущаяся сложность сканирования и обработки книги. Процесс действительно довольно сложен и многоступенчат, но поверьте мне, описать все эти операции было гораздо труднее, чем выполнить их шаг за шагом.

TWDragon Array: другие книги автора


Кто написал Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро? Узнайте фамилию, как зовут автора книги и список всех его произведений по сериям.

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро — читать онлайн бесплатно полную книгу (весь текст) целиком

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема

Шрифт:

Сбросить

Интервал:

Закладка:

Сделать

Уже упомянутый флажок Splitотвечает за разбиение на страницы. Флажки Deskew(выровнять) и Despeckle(очистить от мусора) установлены по умолчанию для всех страниц. Флажки Art(свободный наклон) и Ortho(принудительный поворот) задают специальное выравнивание страницы. В подавляющем большинстве случаев можно обойтись без них. Группа параметров Page align(выравнивание текста) сообщают программе о типе верстки страницы. Буква А в списках означает автоматическое детектирование верстки. Практически для любой книги (если только это не зоологический справочник с обилием таблиц, вклеек и разной версткой по разделам) выравнивание текста по горизонтали следует выставить по центру («С»), а вертикальное – автомат («А»).

Вертикальное выравнивание стоит устанавливать только для страниц имеющих явно - фото 15

Вертикальное выравнивание стоит устанавливать только для страниц, имеющих явно нестандартную верстку (например, когда в текст книги включаются формы документов, выровненные посередине высоты страницы).

Вкладка Book.

На этой вкладке задаются единицы измерения ( Units ), величины добавляемых полей ( Gaps ) и размеры выходного изображения. Особое внимание стоит уделить полям Gap value (ширина поля).

При обработке ScanKromsator добавит белое поле именно такой ширины в изображение страницы.

Величину добавляемых полей можно установить в интервале 180-250 в зависимости от изначальной ширины полей книги.

Флажок vert.gap = hor.gap уравнивает ширину горизонтальных и вертикальных полей.

Остальные параметры можно не трогать, кроме флажка Merge pages after split (объединить после разбиения). Этот флажок пригодится, например, когда книга готовится к печати полными разворотами на листах альбомного формата (так иногда собирают дубликаты в библиотеках). Если этот флажок установлен, на выходе вы получите страницы с полями, склеенные по переплету.

Вкладка Files На этой вкладке в поле Output folderпапка назначения задается - фото 16
Вкладка Files

На этой вкладке в поле Output folder(папка назначения) задается имя папки для выходных файлов, а в поле Ouput Prefix(префикс имени выходного файла) можно ввести «добавку» к имени файла, которая позволит отличить «сырые» сканы от обработанных. Параметры Start from / Step(Начальный номер/шаг) задают именование выходных файлов.

Особого внимания заслуживает группа параметров Ouput Format(выходной формат). В первом по счету списке выставляется формат упаковки TIFF-файла (уже упомянутый TIFF Uncompress). Следующий список задает разрешение вывода (DPI). Здесь нужно ОБЯЗАТЕЛЬНО выставить 600 dpi! Это включит оверсемплинг и облегчит в дальнейшем задачу распознавания, сжатия и печати.

Зачем нужен оверсемплинг?

При распознавании текста программа «оконтуривает» символы по их контрасту с окружающим полем страницы. Затем полученные контуры сравниваются с эталонными, содержащимися в языковой базе данных. Если процент сходства достаточно велик, контур признается распознанным как тот или иной символ шрифта.

В общих чертах, именно так работают алгоритмы OCR. Успех их работы сильно зависит от того, насколько велик абсолютный (в пикселах) размер символа в графическом файле. А этот самый размер напрямую зависит от разрешения файла. При разрешении 600 dpi на реальную ширину и высоту «бумажного» символа придется ровно вдвое больше пикселов графического изображения, чем при разрешении 300 dpi. Соответственно, вероятность успешного распознавания тоже вырастет, причем весьма существенно. Задача оверсемплинга – поднять разрешение скана до выходного, пересчитав определенным образом точки графического изображения.

Оверсемплинг позволяет впоследствии спасти изображение от дефектов сжатия (за счет оольшого числа точек они становятся незаметны), а также помогает вывести изображение на печать наилучшим образом. Например, при печати файла DjVu 300 dpi на полном формате (масштаб 100 %) шрифт получается «рваным» из-за того, что преобразование серого скана в чисто черно-белое изображение дает много дефектов по краям букв, а принтер, имея собственное разрешение немногим больше 300 dpi, не в состоянии их исправить. Совсем иное дело – при печати документа с разрешением 600 dpi. В этом случае входное изображение принтера, имеюшее огромное количество точек, «ужимается» в размер реальной бумажной страницы.

Читать дальше
Тёмная тема

Шрифт:

Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро»

Представляем Вашему вниманию похожие книги на «Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё не прочитанные произведения.


Отзывы о книге «Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро»

Обсуждение, отзывы о книге «Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.