Jak zrobić ładnego pdfa ze zeskanowanej, bądź sfotografowanej książki?

Zaprezentowany sposób nie jest idealny - średnio nadaje się do beletrystyki czy czytania na komórkach i czytnikach - tam zdecydowanie lepiej sprawdzi się program OCR. Jednak metoda w przypadku wszelakiej maści podręczników, zwłaszcza ze schematami/rysunkami jest świetna. Idealna do czytania na komputerze czy tablecie.

Dwa kroki do wykonania (a jak chcemy na szybko to i jeden):

Przedkrok - instalujemy pakiet imagemagick
Raz. Zamieniamy jpegi na gify z kilkoma parametrami dodatkowymi. Dlaczego gif? - lepiej nadaje się do przechowywania czarno białego tekstu ;) m.in mniejszy rozmiar.

Skrypcik:

#!/bin/bash
mkdir gotowe
MAX=`find ./ -name "*.jpg" | wc -l`
COUNT=1
echo "start"

for i in *.jpg
        do
                convert $i -colors 2 -scale 50% -normalize gotowe/$i.gif
                #Inne przykładowe ustawienia:
                #convert $i -colors 16 -scale 50% -normalize -unsharp 1.5×1.0+1.5+0.02 gotowe/$i.jpg
                echo "$i >>>done $COUNT from $MAX<<<"
                let COUNT=COUNT+1
        done
echo "<<<>>> >>>ALL is DONE!<<< <<<>>>"

Oczywiście powyżej założenie do ksiażki czarnobiałej - parametr -colors.
Opcje -scale również najlepiej dobrać pod konkretny przyadek w zależności od wielkości pliku wejściowego.

Dwa. Zamieniamy nasze pliki na pdf'a (tak samo możemy przeprowadzić konwersję wprost z plików *.jpg - wystarczy zmienić rozszerzenie)

convert *.gif ksiazka.pdf

Gotowe.


Komentarze

comments powered by Disqus