Talk:Djvu

see source

http://www.nixuz.net/main/824-skaniruem-v-pdfdjvu.html http://www.nixuz.net/articles/55-sozdanie-djvu-dokumentov.html

<!-- Загрузка. Пожалуйста, подождите...

NixuZ.net Источник Open Source Разделы сайта

* Главная * Новости Портала * Новости Hardware * Новости Software * Статьи o Все o Основы *NIX o FreeBSD o Debian / Ubuntu o RHEL-based o MS Windows o Разное * Софт o Все o Обзоры программ o Сети o Медиа o Графика o Офисное ПО o Диагностика o Утилиты o Web-редакторы o Разное * Игри o Все o Action / FPS o Аркады o MMORPG / Онлайн-игры o Racing Simulators / Гонки o RPG o Пошаговые стратегии o Другие * HTPC o HTPC o Железо o ПО + Linux + Windows o ОС + Linux + Windows * Менеджер окон

Для посетителей » SUSE Linux Enterprise 11 » Знакомство с VirtualBox » Ускорения игр под Х » Сканируем в PDF/DJVU » Shutter » Desktop Data Manager » ImageMagick import » Укрощение терминала » Screengrab » scrot Голосование

Как вам новый дизайн ? Лучше Хуже

Облако тегов 1080p, articles, battle for wesnoth, Bios, Conky, DEB покеты, Debian, development, DVD, FileZilla, game, games, GCC 4.4, Gedit, GNOME, HD video, KDE, Konserve, Linux, MediaPortal, MythTV, Network, Pico-ITX, Player, screenshot, screenshot to linux, Server, strategy game, TBS, Ubuntu, web, web development editors, web editor, Wine, Линукс, менеджер окон, Настройка, программы, Создание снимков экрана, Установка

Показать все теги Забыл пароль Регистрация Поиск по сайту Новости SUSE Linux Enterprise 11 OpenSUSE 11.2 Новые возможности грядущего HDMI 1.4 Вышел Skype 2.1 для Linux 8 причин отказаться от Windows 7 Создатель MySQL уволился из Sun Революция вирусов и эволюция спама DSTL1 - смартфон на платформе Android AMD Catalyst 9.2 для Linux Dreamlinux 3.5 Linux - главный двигатель рынка смартфонов? Вышел PlayOnLinux v3.0 Как поддержать Open Source проект без написания кода Теперь Linux можно устанавливать в BIOS Статьи Коды ошибок BIOS Настройка Linux Arch mutt + vim + lynx + koi8-r Настройка ширифтов в ubuntu Настройка pppoe Bridge Linux Создание DJVU документов Установка видеодрайвера RadeonHD в Ubuntu Устанавливаем в Ubuntu Conky - мощный монитор Установка ATI Catalyst 8.5 в Ubuntu 8.04 (Hardy) VMware + Ubuntu + Web Server Основные прикладные программы в Линукс Установка программ в Debian-основанных дистрибутивах Простая настройка сетевого интерфейса: как быстро настроить сетевую карту в Линукс Cdemu 1.0.0 на Gentoo (эмулятор дисков аля Daemon Tools) Cedega Сборка Wine[X] для игровых задач Ubuntu/Debian GNU/Linux как играть в Counter Strike (CS) под wine. Ставим Linux на флешку Софт Deluge Epiphany Wine Работаем с gEdit LMMS Miro WinFF Avidemux KShutDown Krita PyTube Konserve Nemo Hardinfo Grip Server Density DVD::RIP Звуковыжималка Audacity Sweep Сканируем в PDF/DJVU

* Написал: driver 9 мая 2010 *         o 0 o 1 o 2 o 3 o 4 o 5 (голосов: 0) *

Сканируем в PDF/DJVU

Сберегите ваши бумажные журналы и документы, пока они не пожелтели, не распались на кусочки и не разлетелись по ветру, отсканировав их и сохранив в форматы PDF/DjVu.Просто подключите сканер — и вы готовы к работе. Во-первых, установите gscan2pdf. Домашняя страница. Также его можно найти в репозиториях. Для установки через терминал введите:

sudo apt-get install gscan2pdf

Установите также pdftk. Это пакет для резки/сборки/калибровки PDF-файлов, я использую его для всех своих PDF-проектов.

sudo apt-get install pdftk

Кроме того, вам потребуется pdf2djvu, чтобы, имея на руках высококачественные PDF, вы смогли их переконвертировать в формат djvu 400 dpi, сохранив тем самым уйму места без потери качества. Просто введите в терминале:

sudo apt-get install pdf2djvu

Это всё, что вам потребуется. Приступим к сканированию! Запустите gscan2pdf и щёлкните по кнопке сканирования. Если вам повезёт, сканер обнаружится автоматически, и вы сможете изменить некоторые его настройки. Я использую сканер HP Scan-Jet 6300 с устройством автоподачи на 25 листов. Для тех, кто не знает, что такое устройство автоподачи: мой сканер немного напоминает факс. Сканируем в PDF/DJVU

В нём можно выбирать скорость сканирования. Я всегда выбираю самую быструю. Затем нужно выбрать разрешение — я всегда выбираю 300 DPI. Теперь выберите режим сканирования.

чёрно-белый полутона оттенки серого цветной

Чёрно-белый режим отлично подходит для сканирования страниц, на которых присутствует только чёрный цвет. Не используйте его, если на странице есть фотографии, иначе они будут выглядеть ужасно. Отсканированное изображение занимает немного места.

В режиме полутонов тёмный исходный документ будет выглядеть довольно блёкло на остканированном изображении. Я никогда не использую этот режим.

Оттенки серого— используйте этот режим при сканировании чёрно-белых страниц из журналов или газет, на которых есть фотографии. В этом режиме вы получите довольно неплохую ч/б репродукцию. Файлы изображений занимают побольше места, но всё же не так много, как в полноцветном режиме.

Полноцветный режим— название говорит само за себя. Сканируем в PDF/DJVU

Чтобы получить электронную копию журнала, отсканируйте 10-20 страниц и сохраните их в PDF-формате. Можно выбрать различные настройки сохранения отсканированных страниц. Например, вы можете сохранить каждую страницу отдельно или все вместе, в единый PDF-файл. Кроме того, вы можете выбрать формат jpeg или один из нескольких других форматов.

Во время моих экспериментов я научился использовать сжатие jpeg при сохранении PDF. Jpeg — это формат сжатия с потерями, поэтому в битве за качество я сохранял проекты с качеством 84%. При выборе качества 85% размер файла сразу возрастал в невероятных пропорциях. Продолжайте процесс сканирования вашей книги, в результате в каталоге сохранения будут появляться файлы с отсканированными страницами, примерно вот с такими именами:

Сканируем в PDF/DJVU

Предположим, что каждый файл содержит 20 страниц и имеет размер 20 Мб. Поэтому, когда вы соедините их все вместе, на выходе получится единый PDF-файл размером 100Мб и с уже пронумероваными страницами. Чтобы добиться такого результата, перейдите в командную строку, затем в каталог с сохранёнными страницами и запустите pdftk. Это приложение поможет проделать все нужные операции с PDF-файлами. С его помощью мы объединим отсканированные страницы, тем самым создав одну большую книгу. Оно с лёгкостью сделает всё, что захотите, ведь pdftk имеет множество настроек, но о них я не буду рассказывать подробно. Введите в терминале:

pdftk my.ma

Теперь нажмите клавишу Tab, и, как по волшебству, перед вами появится:

pdftk my.magazine.part

Как я и говорил, командная строка — это очень мощный инструмент. Ваш каталог будет просканирован и часть имени «magazine.part» подставится автоматически. Теперь нажмите 1, чтобы получилось:

pdftk my.magazine.part1

Нажмите Tab ещё раз, и вы получите:

pdftk my.magazine.part1.pdf

Удобно, не правда ли? Снов нажмите Tab для остальных номеров 2, 3, 4 и 5, чтобы в итоге получить следующую команду:

pdftk my.magazine.part1.pdf my.magazine.part2.pdf my.magazine.part3.pdf my.magazine.part4.pdf my.magazine.part5.pdf

Затем вам нужно сказать pdftk, что вы собираетесь соединить все эти файлы вместе в один большой файл. Поэтому, добавьте следующее:

cat output my.my.magazine.pdf verbose

Добавьте это в конец предыдущей команды, чтобы всё вместе выглядело примерно так:

pdftk my.magazine.part1.pdf my.magazine.part2.pdf my.magazine.part3.pdf my.magazine.part4.pdf my.magazine.part5.pdf cat output my.my.magazine.pdf verbose

С командой verbose в конце вы будете видеть в терминале всё, что выполняет приложение. Это поможет избежать вопросов в дальнейшем. Если же вы не укажете эту команду, то не получите никакого отклика от приложения. Теперь нажимайте Enter и следите заходом выполнения. Через несколько секунд вы снова увидите командную строку с мигающим курсором.

Теперь в каталоге вы должны увидеть ваш окончательный документ под названием my.magazine.pdf. Откройте его (с помощью программы для просмотра PDF) и пролистайте, чтобы убедиться, что в нём действительно 100 страниц. Теперь взгляните на размер файла, он должен быть примерно 110 Мб или, возможно, чуть больше. Теперь, чтобы переконвертировать его в формат djvu, сохранив при этом высокое качество изображений, но уменьшив размер файла, снова откройте командную строку и введите:

pdf2djvu -o my.dkvu -d 400 -v my.pdf

Сканируем в PDF/DJVU

Немного поясню: вы только что сказали программе, что выходной файл будет называться my.magazine.djvu, что вы хотите использовать сжатие 400 DPI (-d400), хотите получать сообщения о том, что делает программа (-v) и что имя исходного файла — my.magazine.pdf. Теперь нажмите Enter. Вы должны увидеть что-то вроде этого:

Сканируем в PDF/DJVU

Думаю, вы поняли, что к чему.

Теперь перейдите в каталог, и вы увидите .djvu-файл, исходные части PDF и окончательный PDF. Удалите файлы частей .part1.pdf, но оставьте окончательные PDF- и DjVu-файлы. Чтобы удалить файлы, просто перейдите в каталог, выделите их и нажмите клавишу delete. Не удаляйте большой PDF-файл. С исходным PDF легче работать, чем с DjVu, поэтому в дальнейшем производите любые изменения в PDF-файле, а затем перековертируйте его в DjVu.

При сканировании страниц убедитесь, что настроили яркость и контраст в gscan2pdf. При полноцветном сканировании вам, возможно, придётся изменить яркость/контраст до 30 или 40, чтобы предотвратить просвечивание страниц, а также чтобы фон был более чётким. Я выяснил, что при сканировании в чёрно-белом режиме это также может быть необходимо. Кроме того, это помогает уменьшить желтизну старых журнальных страниц и сократить размер файла. Попробуйте поэкспериментировать с этими настройками. Уделите этому некоторое время, пока вы, увлёкшись, не отсканировали сотню-другую книг.

* Просмотров: 29 * Комментировать (0)

Другие новости по теме:

* Создание DJVU документов * Ukop * Ускорения игр под Х * Ставим Linux на флешку * Устанавливаем в Ubuntu Conky - мощный монитор

Информация Посетители, находящиеся в группе Гости, не могут оставлять комментарии в данной новости.

*

Главная | Добавить новость | Контакты | Правила сайта | Правообладателям | Карта сайта| Карта Категорий | RSS

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения администрации сайта. При этом ссылка на сайт обязательна. *   *

=
===== Загрузка. Пожалуйста, подождите...

NixuZ.net Источник Open Source Разделы сайта

* Главная * Новости Портала * Новости Hardware * Новости Software * Статьи o Все o Основы *NIX o FreeBSD o Debian / Ubuntu o RHEL-based o MS Windows o Разное * Софт o Все o Обзоры программ o Сети o Медиа o Графика o Офисное ПО o Диагностика o Утилиты o Web-редакторы o Разное * Игри o Все o Action / FPS o Аркады o MMORPG / Онлайн-игры o Racing Simulators / Гонки o RPG o Пошаговые стратегии o Другие * HTPC o HTPC o Железо o ПО + Linux + Windows o ОС + Linux + Windows * Менеджер окон

Для посетителей » SUSE Linux Enterprise 11 » Знакомство с VirtualBox » Ускорения игр под Х » Сканируем в PDF/DJVU » Shutter » Desktop Data Manager » ImageMagick import » Укрощение терминала » Screengrab » scrot Голосование

Как вам новый дизайн ? Лучше Хуже

Облако тегов 1080p, articles, battle for wesnoth, Bios, Conky, DEB покеты, Debian, development, DVD, FileZilla, game, games, GCC 4.4, Gedit, GNOME, HD video, KDE, Konserve, Linux, MediaPortal, MythTV, Network, Pico-ITX, Player, screenshot, screenshot to linux, Server, strategy game, TBS, Ubuntu, web, web development editors, web editor, Wine, Линукс, менеджер окон, Настройка, программы, Создание снимков экрана, Установка

Показать все теги Забыл пароль Регистрация Поиск по сайту Новости SUSE Linux Enterprise 11 OpenSUSE 11.2 Новые возможности грядущего HDMI 1.4 Вышел Skype 2.1 для Linux 8 причин отказаться от Windows 7 Создатель MySQL уволился из Sun Революция вирусов и эволюция спама DSTL1 - смартфон на платформе Android AMD Catalyst 9.2 для Linux Dreamlinux 3.5 Linux - главный двигатель рынка смартфонов? Вышел PlayOnLinux v3.0 Как поддержать Open Source проект без написания кода Теперь Linux можно устанавливать в BIOS Статьи Коды ошибок BIOS Настройка Linux Arch mutt + vim + lynx + koi8-r Настройка ширифтов в ubuntu Настройка pppoe Bridge Linux Создание DJVU документов Установка видеодрайвера RadeonHD в Ubuntu Устанавливаем в Ubuntu Conky - мощный монитор Установка ATI Catalyst 8.5 в Ubuntu 8.04 (Hardy) VMware + Ubuntu + Web Server Основные прикладные программы в Линукс Установка программ в Debian-основанных дистрибутивах Простая настройка сетевого интерфейса: как быстро настроить сетевую карту в Линукс Cdemu 1.0.0 на Gentoo (эмулятор дисков аля Daemon Tools) Cedega Сборка Wine[X] для игровых задач Ubuntu/Debian GNU/Linux как играть в Counter Strike (CS) под wine. Ставим Linux на флешку Софт Deluge Epiphany Wine Работаем с gEdit LMMS Miro WinFF Avidemux KShutDown Krita PyTube Konserve Nemo Hardinfo Grip Server Density DVD::RIP Звуковыжималка Audacity Sweep Создание DJVU документов

* Написал: driver 12 июня 2008 *         o 0 o 1 o 2 o 3 o 4 o 5 (голосов: 0) *

Создание DJVU документов в Линукс

Задача: имеется отсканированная большая книга, и требуется перевести её в компактный формат для последующего просмотра. Решение: в Linux просто и легко конвертируем насканированные страницы в DJVU.

Почему DJVU? Потому, что есть множество отсканированных книг, и есть потребность их компактно хранить и работать с ними. Для этой задачи орлы из AT&T Labs разработали специальные алгоритмы сжатия, которые легли в основу формата DJVU.

Такие электронные книги занимают меньше места, чем, скажем, в PDF, PS или других форматах, и быстрее отображаются при просмотре.

Что потребуется для создания DJVU файлов из изображений Для того, чтобы сконвертировать много изображений в DJVU нужно установить следующие пакеты: aptitude install djview djvulibre-bin netpbm

При сканировании следует именовать файлы подряд так, чтобы они сортировались в порядке нумерации страниц. То есть вот так:

000.jpg, 001.jpg, 002.jpg, ..., 012.jpg

а не так: 0.jpg, 1.jpg, 2.jpg, ..., 12.jpg

потому как 12.jpg появится перед 2.jpg - так что при сканировании нужно об этом подумать.

Файлы изображений помещаются в отдельный каталог, после чего переходим в этот каталог и даём команду: ./any2djvu-bw

Эта команда - вызов скрипта оболочки, текст которого приведён ниже:


 * 1) !/bin/bash
 * 2) any2djvu-bw
 * 1) any2djvu-bw

if [ -z `which anytopnm` -o -z `which ppmtopgm` -o -z `which pgmtopbm`\ -o -z `which cjb2` ]; then usage echo "Error: anytopnm, ppmtopgm, pgmtopbm and cjb2 are needed" echo exit 1 fi

shopt -s extglob

DEFMASK="*.png" DPI=300 OUTFILE="#0-bw.djvu"
 * 1) DEFMASK="*.jpg"
 * 1) uncomment the following line to compile a bundled DjVu document

function usage { echo echo "usage:" echo echo "$0 [\"REGEXP\"]" echo " converts single pages with the default mask $DEFMASK (or REGEXP if provided)" echo " in the current directory to single-page black and white djvu documents" echo " and bundles them as a djvu file $OUTFILE" echo }
 * 1) uncomment the following line to compile a bundled DjVu document

if [ -n "$1" ]; then MASK=$1 else MASK=$DEFMASK fi

for i in $MASK; do if [ ! -e $i ]; then usage echo "Error: current directory must contain files with the mask $MASK" echo exit 1 fi if [ ! -e $i.djvu ]; then echo "$i" anytopnm $i | ppmtopgm | pgmtopbm -value 0.499 > $i.pbm cjb2 -dpi $DPI $i.pbm $i.djvu rm -f $i.pbm fi done
 * 1) in netpbm >= 10.23 the above line can be replaced with the following:
 * 2) anytopnm $i | ppmtopgm | pamditherbw -value 0.499 > $.pbm

djvm -c $OUTFILE $MASK.djvu
 * 1) uncomment the following line to compile a bundled DjVu document

Красным в скрипте выделена строчка, где определяется, какой формат файлов будет преобразован в DJVU. В данном примере это png.

Итак, в результате работы скрипта появятся промежуточные файлы djvu и файл #0-bw.djvu - это и есть конечный файл, содержащий в себе все страницы. Переименовываем его в то, что более приятно глазу, и готово. После этого можно открыть полученный файл при помощи djview или evince.

Так же перевести документы в формат DJVU можно и другими утилитами.

any2djvu

Это веб-сервис, находящийся тут. Он позволяет перевести отканированные изображения непосредственно в файл DJVU. Удобно для тех, у кого широкий и дешёвый интернет-канал.

Конвертируем PDF-документ в DJVU

Сконвертированные документы DJVU из PDF, как правило, имеют меньший размер и гораздо быстрее просматриваются, что особенно актуально для портативных устройств.

Для того, чтобы сконвертировать файл PDF в DjVu, требуется в текущем каталоге выполнить: ./pdfs2djvu

Это тоже скрипт на баше, код которого такой:


 * 1) !/bin/bash
 * 2) pdfs2djvu
 * 1) pdfs2djvu

if [ -z `which pdftoppm` -o -z `which cjb2` -o -z `which djvm` ]; then echo echo "Error: pdftoppm, cjb2 and djvm are needed" echo exit 1 fi

shopt -s extglob

OUTFILE="#0.djvu" DEFMASK="*.pdf" DPI=600

if [ -n "$1" ]; then MASK=$1 else MASK=$DEFMASK fi

for PDF in $MASK; do if [ ! -e $PDF ]; then echo echo "Error: current directory must contain files with the mask $MASK" echo exit 1 fi echo $PDF pdftoppm -mono -r 600 -aa yes $PDF $PDF for PBM in $PDF*.pbm; do echo $PBM cjb2 -dpi $DPI $PBM $PBM.djvu rm -f $PBM done done

djvm -c $OUTFILE $MASK*.pbm.djvu

Выполнение скрипта приведёт к тому, что все файлы PDF в текущей директории будут сконвертированы в DJVU. Аналогом является программа от Гугл под названием dpf2djvu.

Единственное условие: скрипт не переваривает кириллические названия с пробелами. Так что желательно временно переименовать файл так, чтобы он содержал только латинские символы и желательно без пробелов.

Ещё можно попробовать программу gscan2pdf, которая позволяет сканировать изображения в форматы PDF и DJVU.

Автор

* Просмотров: 2501 * Комментировать (0)

Другие новости по теме:

* Сканируем в PDF/DJVU * mutt + vim + lynx + koi8-r * Простая настройка сетевого интерфейса: как быстро настроить сетевую карту в ... * Подключение антивирусного пакета BitDefender к MTA Postfix * rtorrent+wtorrent

Информация Посетители, находящиеся в группе Гости, не могут оставлять комментарии в данной новости.

*

Главная | Добавить новость | Контакты | Правила сайта | Правообладателям | Карта сайта| Карта Категорий | RSS

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения администрации сайта. При этом ссылка на сайт обязательна. *   *

-->