Lubię mieć najważniejsze książki w postaci elektronicznej, a konkretnie zapisane w otwartym standardzie ISO 32000-1:2008, czyli po ludzku .pdf. Ze względu na problemy moralne, jakie rodzi obowiązujące prawo autorskie, niektóre książki 'tłumaczę' sobie na .pdf domowym sposobem. W dalszej części artykułu opisuję, w jaki sposób, za pomocą jakich narzędzi. Większość operacji wykonuję w narzędziach graficznych pod KDE.
 
Zapraszam do lektury!
 
Czego potrzebujemy, z podziałem na sprzęt i oprogramowanie.
 
Niezbędny sprzęt:
  • Skaner
Jak to bywa pewne skanery działają lepiej, pewne działają gorzej. Pewne są obsługiwane pod GNU/Linux lepiej, pewne gorzej. Ja mam to szczęście, że mam do swojej dyspozycji skaner Mustek 1248UB. Jego ogromną zaletą jest wykorzystanie portu USB zarówno do przesyłu danych jak i do zasilania. Dzięki temu do połączenia skanera z komputerem wystarczy tylko jeden kabel! Dzięki temu, że skaner wykorzystuje standard USB jest w miarę szybki. Na moje potrzeby w zupełności wystarczy.
 
Jeżeli zastanawiasz się, czy Twój sprzęt będzie poprawnie obsługiwany pod GNU/Linux, zajrzyj na stronę projektu SANE.  Podobnie, jeżeli poszukujesz sprzętu poprawnie działającego pod GNU/Linux, zajrzyj na  stronę projektu SANE.
 
Niezbędne oprogramowanie:
  • Sterowniki obsługujące skaner.
  • Program do skanowania i przetwarzania zeskanowanego materiału na format .pdf
  • Program do łączenia ze sobą plików .pdf
Sterowniki obsługujące skaner powinny już się znajdować w Twoim systemie. Jeżeli tak nie jest, musisz zainstalować następujące paczki:
 
sane
sane-utils
 
Program do skanowania i przetwarzania zeskanowanego materiału np. na format .pdf znajduje się w pakiecie:
 
xsane
 
Program do łączenia ze sobą plików .pdf znajduje się w pakiecie:
 
pdftk
 
Procedura pracy jest następująca:
1. Skanujemy pojedyncze strony książki.
2. Pojedyncze strony książki zapisywane są w postaci pojedynczych plików .pdf.
3. Po zeskanowaniu książki łączymy ze sobą pliki .pdf w celu uzyskania np. pojedynczego pliku - naszej książki w postaci elektronicznej.
 
Większość działań można w pewnym stopniu zautomatyzować, dzięki bardzo dobrej aplikacji 'XSane Image Scanner' (pakiet xsane). Warto uruchomić tę aplikację na osobnym pulpicie, (wirtualnym biurku) ponieważ uruchamia ona od razu kilka okienek (por. rys. 1). 
images/stories/yasig_output/640_xsane1_1.jpg
 W skrócie omówię ważniejsze opcje. Najważniejsze jest okienko o nazwie 'xsane 0.995' (lewa górna część rys. 1). Ustawiamy następujące opcje:
  • Sposób postępowania z efektem pracy skanera - wybieramy 'Zapis'. Dzięki temu kolejne skany będą automatycznie zapisywane we wskazanym miejscu, a nam pozostanie już tylko przekładanie kolejnych kartek.
  • Folder, w którym będą przechowywane wyniki pracy skanera oraz nazwa plików wynikowych - w przykładzie z rys. 1 nazwa folderu to '/home/mslonik/skany_Mustek_1248UB/' natomiast nazwa pliku to 'ptaki'.
  • Automatyczne nazwy kolejnych plików uzyskujemy poprzez wciśnięcie przycisku z rozwijanym menu obok obrazku buta. Warto zostawić opcję domyślną ('+1'). Dzięki temu kolejne pliki będą nazywane: 'ptaki001', 'ptaki002', 'ptaki003' itd.
  • Format plików wynikowych, czyli format, do jakiego będą przekształcane dane uzyskiwane przez skaner - wybieramy Typ 'PDF' (por. rys. 1). Aplikacja automatycznie doda nazwę rozszerzenia do wszystkich plików. Wybór typu oznacza także zgodę na automatyczną konwersję wyników pracy skanera na wskazany typ.
  • Sposób pracy skanera - skanowanie w kolorze, czarno białe - wybieramy kolor.
  • Rozdzielczość pracy skanera. Z moich osobistych doświadczeń wynika, że wystarczy 150 dpi.
  • Opcje sprzętowe dotyczące sposobu odwzorowania barw. Liczba opcji jest uzależniona od posiadanego typu skanera i możliwości sterownika. Ja ustawiłem wartości domyślne.
Kolejne okienko, na którym warto skupić uwagę, to okienko o nazwie 'Podgląd'.
  • Skanowanie książki polega na systematycznym powtarzaniu tego samego ułożenia kartek względem powierzchni skanera. Warto jednak zawęzić obszar skanowany do faktycznie pokrywającego się z powierzchnią kartek. Przyczyni się to do zmniejszenia czasu potrzebnego do zeskanowania pojedynczej kartki. Warto także przemyśleć ułożenie kartki względem skanera. Kartki książki mają najczęściej kształt prostokątów. Obszar pracy skanera również ma kształt prostokąta. Element światłoczuły przesuwa się równolegle do dłuższego boku obszaru pracy skanera. Jeżeli ułożymy książkę tak, by jej dłuższy bok był równolegle do krótszego boku obszaru pracy skanera, to element światłoczuły będzie miał do pokonania krótszą drogę i tym samym przyspieszy się proces skanowania.
  • Warto także nakazać oprogramowaniu od razu obracanie obrazków kartek do pożądanej orientacji. Być może skróci to proces przygotowania pliku wynikowego.
Wciskamy przycisk 'Pobierz podgląd'. W efekcie dostaniemy podgląd całego obszaru, który ogarnia nasz skaner, a w szczególności obszar pojedynczej kartki naszej książki (por. rys. 1). Zawężenie obszaru skanowanego realizujemy przeciągając myszą boki prostokąta z linii przerywanych. Na rys. 1 widoczny jest efekt tych działań. Obszar skanowany został zmniejszony do wielkości okładki. Jak widać warto obrócić książkę o 90 stopni, by uwzględnić powyższą uwagę o prędkości pracy skanera.
 
Wybór orientacji obrazka wynikowego zapewnia nam przycisk z rozwijanym menu przy symbolu kąta.
 
Na koniec warto zwrócić uwagę ponownie na okienko 'xsane 0.995'. W dolnej części okienka aplikacja pokazuje obliczoną wielkość pliku wynikowego.
 
Do dzieła! W okienku 'xsane 0.995' wciskamy przycisk 'Skanuj'. Po zakończeniu skanu przekładamy kolejną kartkę książki i powtarzamy czynność. Itd.
 
Po zakończeniu skanowania mamy pliki .pdf, po jednym na stronę, czy też na dwie strony. Pozostaje je teraz połączyć, ewentualnie jeszcze obrócić. Przechodzimy do konsoli (aplikacja o nazwie 'konsole').  Przechodzimy do katalogu, w którym zgromadziliśmy pliki .pdf. Posługujemy się bardzo prostą w użyciu aplikacją 'pdfk'. Najczęściej wykorzystywane opcje zostały opisane w pliku manuala (polecenie 'man pdftk'). Przykładowo scalenie ze sobą wszystkich plików:
 
pdftk *.pdf cat output PtakiWtwoimOgrodku.pdf
 
Gotowe.
 
Na koniec kilka uwag:
  • Powstały w ten sposób plik .pdf to w zasadzie zbiór rastrowych plików graficznych. Tym samym nie jest możliwe np. wyszukiwanie łańcuchów tekstowych, nie ma hiperłączy, nie ma indeksów. Wszystko, co mamy do swojej dyspozycji, to 'obrazki' pojedynczych stron.
  • Wynik naszej pracy może osiągnąć znaczne rozmiary. Przykładowo kolorowa książka, 80 stron, to wielkość między 100 a 150 MB. Warto więc przemyśleć, czy chcemy skanować w kolorze i z jaką rozdzielczością.
  • Ktoś może zapytać po co skanować książki i tracić w ten sposób czas. Cóż, co kto lubi. Książki są ciężkie i zajmują sporą objętość. Osobiście wolę czytać książki, natomiast jeżeli wyruszam w podróż i potrzebuję chociaż kilka pozycji, bez wahania wybieram postać elektroniczną. Moim zdaniem mimo wszystko tak jest po prostu wygodniej.
  • Czas potrzebny do skanowania. Nie jest tak źle. Kluczem do sukcesu jest systematyczność. Wystarczy, że poświęcimy na skanowanie powiedzmy np. 15 min. dziennie podczas np. oglądania Teleexpressu.
  • O ileż piękniejszy byłby świat pozbawiony praw autorskich. Raz zeskanowana książka mogłaby swobodnie się rozejść po świecie z wykorzystaniem internetu... Ale to już inna historia. Stosując obecnie obowiązujące prawo autorskie możemy zeskanować książkę pod warunkiem, że się nią nie podzielimy.
  • Istnieją maszyny, które potrafią automatycznie skanować cały plik kartek, jedna za drugą. Wyniki, np. w postaci plików .pdf, są przesyłane np. pod wskazany adres e-mail. Ale to też już inna historia.
Dodaj komentarz