LibKing » Книги » Справочная литература » Прочая справочная литература » TWDragon - Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро

TWDragon - Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро

Тут можно читать онлайн TWDragon - Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - бесплатно полную версию книги (целиком). Жанр: Прочая справочная литература, год 2009. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте LibKing.Ru (ЛибКинг) или прочесть краткое содержание, предисловие (аннотацию), описание и ознакомиться с отзывами (комментариями) о произведении.
 TWDragon - Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро
  • Название:
    Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро
  • Автор:
  • Жанр:
  • Издательство:
    неизвестно
  • Год:
    2009
  • ISBN:
    нет данных
  • Рейтинг:
    3.9/5. Голосов: 101
  • Избранное:
    Добавить в избранное
  • Ваша оценка:

TWDragon - Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро краткое содержание

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - описание и краткое содержание, автор TWDragon, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - читать онлайн бесплатно полную версию (весь текст целиком)

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - читать книгу онлайн бесплатно, автор TWDragon
Тёмная тема

Шрифт:

Сбросить

Интервал:

Закладка:

Сделать

Использовать Dithered Image возможно только на изображениях с высоким разрешением. Дело в том, что при отображении на экране или бумаге диффузного изображения с высоким разрешением происходит уменьшение, и отдельные черные и белые точки пересчитываются в серые. Если изображение не уменьшается при отображении, расположение точек становится заметным глазу, и изображение приходит в негодность.

Применять диффузное кодирование при работе в ScanKromsator имеет смысл при работе с фотографическими изображениями, напечатанными офсетом (на них виден небольшой растр) и глубокой печатью (на них мал общий контраст). Высококонтрастное или фактически одноцветное изображение кодировать диффузным способом опасно — можно «обсыпать» края контрастных объектов отдельными точками. Фактически, можно применить диффузное кодирование к любому изображению с достаточно высокой плотностью серого цвета и достаточно малым общим контрастом (например, таким, как показанное на рисунке выше).

Диффузное кодирование задается для выделенного рисунка кнопкой Exclude and Mark as Dithered Zone

картинка 26

(Исключить и отметить как зону диффузного кодирования) инструментальной панели, или командой меню Zones => Exclude and Mark as Dithered Zone. При включении диффузного кодирования рисунок не изымается из страницы при обработке.

2.5 Обработка и подготовка выходных файлов

После того, как все настройки заданы и рисунки оформлены в виде зон — нужно проверить качество выходных файлов. Для этого следует выбрать несколько страниц, которые вам покажутся самыми «проблемными». Как правило, это страницы с рисунками, чертежами и таблицами. Каждая страница передается на обработку командой Process => Current Fileили клавишами Ctrl+P.

ScanKromsator произведет обработку страниц по заданному настройками сценарию, а потом выведет специальный маленький просмотрщик с окном, подобным старым версиям ACDSec.

Перед запуском обработки программа может выдать запрос на изменение разрешения - фото 27

Перед запуском обработки программа может выдать запрос на изменение разрешения (DPI) изображения. На этот запрос нужно всегда отвечать утвердительно, иначе оверсемплинг применен не будет, и выходные файлы придут в негодность.

Когда экспериментальные файлы удовлетворили требованиям к качеству, приходит время запускать основной процесс обработки. Сами первичные выходные файлы лучше удалить, чтобы программа не застопорилась на них с запросом о перезаписи. Обработка запускается нажатием кнопки Process!инструментальной панели.

Длительность обработки целиком зависит от быстродействия компьютера, и в среднем составляет для 400-страничной книги от 20 минут до полутора часов.

После обработки в выходной папке будут находиться:

• Собственно выходные файлы со страницами книги, преобразованными в черно-белые одноцветные изображения;

• Рисунки, сохраненные под именами типа picOOOl. tif.

В самих страницах на месте выделенных рапсе рисунков останутся «дыры».

Поэтому для получения изображений, пригодных для распознавания, нужно объединить страницы с рисунками. Это делается командой меню Zones => Picture Zone => Merge Zones. После окончания процесса объединения все выходные файлы будут готовы для распознавания.

Шаг 3. Распознавание и первичная вычитка

Вот, наконец, и пришло время для включения в процесс FineReader.

Да, великого и ужасного. Для цели книгосканирования лучше всего подойдет версия 9.0 Pro, но мне впору пришлась лицензионка 7.0 Pro, списанная за ненадобностью на работе. Шучу.

Первое, что нужно сделать — зайти в диалог опций пакета, и сбросить там все флажки на вкладке Сканирование/Открытиев группе Обработка изображений.

После этого нужно переместить куда-нибудь в известное место сам пакет, чтобы потом легко найти его. Я предпочитаю сохранять в папку, куда выводил изображения страниц ScanKromsator. Когда страницы открыты, можно сразу запускать распознавание.

Первичная вычитка в FineReader сводится к легкой коррекции самых заметных ошибок.

Главное правило при работе если вы собираетесь сохранять файл в DjVu, ни в коем случае не удаляйте знаки переноса строки и концевые дефисы абзацев! Тогда внедрить текстовый слой в DjVu-файл можно будет легко и быстро, и не возникнет проблем при модификации готовой книги.

Шаг 4 Сохранение и финальное редактирование 41 PDF или DjVu Вопрос выбора - фото 28

Шаг 4. Сохранение и финальное редактирование

4.1 PDF или DjVu?

Вопрос выбора формата обязательно встает ребром, как только принимается решение преобразовать книгу в электронный вид. При выборе формата нужно учитывать несколько факторов. Чтобы лучше разобраться в них, приведу краткое сравнение особенностей форматов PDF и DjVu.

PDF изначально «компьютерный» издательский формат, рассчитанный на максимально точное отображение электронного документа на любых устройствах. Соответственно, он показывает наилучшие результаты именно при сохранении изначально электронных документов. PDF использует формат сжатия JPEG для графики и LZW для текста. Соответственно, лучше всего этому формату удается сохранение мультимедийных документов с полноцветным оформлением и обилием графики. Однако при сохранении сканированных страниц получается своего рода «суррогат»: текст, наложенный на сжатое JPEG изображение полного формата страницы. Такая методика дает большой проигрыш в размере (средняя книга из 300 страниц весит несколько сотен мегабайт), но приемлемое качество. PDF не переносит диффузных (Dithered) изображений, опять-таки из-за наличия в составе алгоритма JPEG. Сжатие превращает такие иллюстрации в подобие картин Казимира Малевича. Может, кому-то это понравится, но, ради спортивного интереса — посмотрите когда-нибудь на свой портрет, сжатый подобным образом…

DjVu— динамично развивающийся формат, разработанный специально для хранения сканированных документов большого объема. По сути это многостраничный графический формат, являющий собой своеобразную надстройку над алгоритмом сжатия графики JBIG. Главная особенность DjVu — использование так называемых словарей, то есть наборов описаний контрастных контуров, специфичных для страницы. Таким образом, при достаточном единообразии изображения (например, типографского шрифта) — сжатие может проводиться в сотни раз!

Использование словарей позволяет делить изображение на «слои», содержащие текст, графику и задний план. Специальных средств отображения текста формат DjVu не имеет, но позволяет хранить невидимый текстовый слой со сведениями о координатах расположения строк на изображении страницы. Такая структура дает возможность проводить текстовый поиск в файлах.

Читать дальше
Тёмная тема

Шрифт:

Сбросить

Интервал:

Закладка:

Сделать


TWDragon читать все книги автора по порядку

TWDragon - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро отзывы


Отзывы читателей о книге Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро, автор: TWDragon. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
Большинство книг на сайте опубликовано легально на правах партнёрской программы ЛитРес. Если Ваша книга была опубликована с нарушениями авторских прав, пожалуйста, направьте Вашу жалобу на PGEgaHJlZj0ibWFpbHRvOmFidXNlQGxpYmtpbmcucnUiIHJlbD0ibm9mb2xsb3ciPmFidXNlQGxpYmtpbmcucnU8L2E+ или заполните форму обратной связи.
img img img img img