Scannen grosser Datenmengen auf der Linux-Kommandozeile


Vor Jahren hatte ich mir 2 teure Dokumentenscanner (i.e. Scanner mit Stapeleinzug) für Windows und Mac gekauft.
Zum Glück wurden seit WinXP und MacOS-Leopard vom Hersteller keine Treiber mehr angeboten, so dass ich nun endlich gezwungen war, ein Script zu schreiben, mit welchem man beide Scanner unter Linux viel schneller und komfortabler auf der Kommandozeile mit allen Parametern bedienen kann (der GUI-Zwang vorher hatte schon immer gestört ;-). Z.B. wurden meine Diplomarbeit und Dissertation auf dieser Homepage hierüber scanned.

Sofern also sane-utils, i.e. die Bibliothek für Scanner-Backends, imagemagick und ghostscript, sowie ein PDF-Viewer für die implizite Ergebnisanzeige (hier mupdf) installiert sind, generiert das Script myscan des Downloadbereiches sehr gut komprimierte Scans bis zu 999-seitiger Dokumente in der korrekten Reihenfolge (!).

Beispielsweise erzeugt

myscan -C -d -r 150 -o Meine_Fachzeitschrift

aus Hochglanzzeitschriften mit 150 Farbseiten etwa 30 MByte große Dateien sehr guter Bildqualität.

Mit der Defaulteinstellung -r 100 ergibt sich etwa für die Archivierung von Schriftstücken ein in der Praxis sehr guter Kompromiss hinreichender Darstellungsqualität bei minimalen Datenmengen. Am Beispiel der Hochglanzzeitschriften erhält man so ceteris paribus mit 20 MByte vergleichsweise sehr kleine PDFs mit guter Lesbarkeit.

Die Optionen des Beispieles beziehen sich auf die Scannermodelle und können sehr einfach auf andere Scannermodelle übertragen werden (cf. hierzu sane-Dokumentation).
Wer wissen möchte, wie man für alle Arten von Endgeräten Duplex-Dokumentenscanner in einem Netzwerk über einen Raspberry Pi bereitstellt, erfährt das hier.

Übersicht der Optionen ...



... ein Beispiel der mit myscan -t -d -r 150 erzeugten Datei grid.jpg, um die Schnittkanten fuer das Begrenzen und Aneinanderfügen von Buchseiten zu ermitteln ...



... und eine aus je 2 beschnittenen Seiten über den Aufruf myscan -d -r 150 -c "850x1200+190+0" -A -o Stochastik.pdf" zusammengefügte Doppelseite des anschließenden Buchscans mit den vorig bestimmten Parametern




Impressum und Datenschutzerklärung