Elektrobuch

Als Leseratte hab ich mir vorletztes Jahr einen Ebook-Reader geleistet und einiges geschmökert (ausschließlich DRM-freie Exemplare).

Tablet

Jetzt habe ich mein erstes Elektrobuch selbst erzeugt, und zwar „Framstag Sam“ von Paul van Herck. Ich habe es vor einigen Jahren antiquarisch für teuer Geld erstanden:

Papierbuch

Mein erster Versuch – die Textseiten mit Fotoapparat aufzunehmen – ging einigermaßen in die Hose, also habe ich die Seiten auf den Scanner gelegt. Resultat waren einigermaßen durchwachsene Aufnahmen:

scan0

Die Doppelseiten habe ich mit ImageMagic convert und einem Tcl-Script zu kontrastreicheren Einfach-Seiten konvertiert. Hier das Script resize:


#!/usr/bin/tclsh

proc echo args {puts $args}

set cnt 0

foreach img [lsort -dictionary [glob Scans/*.jpg]] {
    # convert s10-11.jpg -crop 1400x2081+1400+400 +repage X:
    echo img $img
    exec\
	convert $img\
	-crop 1400x2081+0+400 +repage\
	-brightness-contrast 0x50\
	p[format %03d [incr cnt]].jpg
    exec\
	convert $img\
	-crop 1400x2081+1400+400 +repage\
	-brightness-contrast 0x50\
	p[format %03d [incr cnt]].jpg
}

Die resultierenden Seiten sahen dann so aus:

scan1

Mit diesem Kommandozeilenbefehl habe ich die Scans mit OCR (Tesseract) zu Texten konvertiert:


$ for i in *.jpg
> do tesseract $i $i -l deu
> done

Die Einzeltexte wurden zu gesamttext.txt eingesammelt:


$ cat *.txt > gesamttext.txt

Das OCR-Programm hat anhand der Einrückungen Absätze selbsttätig erkannt und mit doppeltem Zeilenumbruch abgeschlossen. Puh. Gottseidank.

Die Textdatei habe ich in mehrstündiger Arbeit nach Fehlern durchflöht. Hat wenig Spaß gemacht, außer – in einem Rutsch – auf neue Rechtschreibung umzuheben, also hauptsächlich die vereinfachte „ß“-Regelung umzusetzen.

Sodann habe ich den erzeugten Text mit copy-&-paste nach Onehand kopiert, Überschriften ausgezeichnet, mit einem CSS-basierten Layout versehen und zu einem HTML-Dokument produziert.

Dieses neu erzeugte HTML habe ich mit Calibre eingelesen und als EPUB-Dokument abgespeichert. Sieht einigermaßen schick aus.

Titelblatt-300px

Ich würde es gerne zum Download anbieten, aber ich trau mich nicht, weil öffentliche Verfügbarkeit (hab keine Lust, mich mit strafbewehrten Abmahnungen rumzuschlagen).

Wer mich aber besucht und einen Stick bei hat, kann es gerne kopieren. Sehr lustiger SF, außerordentlich erbaulich trotz übermäßigem Alkoholkonsum und gehäuftem Auftreten von Marsmännlein.

Außerdem beantworte ich gerne Anfragen, falls jemand selbst machen will, aber nicht klar kommt.

(Ursprung – Mittwoch, den 12. März 2014, 15:47:31 Uhr)

<< Home | Sitemap | A-Z | Impressum | Suche >>