Utente:Aubrey/Progetto Dizionario

Pagina di coordinamento per il Progetto dizionario.

To do
  • trovare un nome adeguato a questa pagina e spostarla di conseguenza
  • definire la procedura in tutti i suoi dettagli

Procedura modifica

  1. Scaricare la cartella con i jpeg delle immagini
  2. Convertire i jpeg con ImageMagick
  3. Rinominare le immagini con nomi utili (Aubrey)
  4. Spezzare le immagini con unpaper
  5. Fare djvu multipagina (Aubrey)
  6. Fare pdf da mandare ad Internet Archive.


ImageMagick modifica

Software per la conversione di immagini, da linea di comando. Scaricare e installare la versione preferita (esiste anche portable) da qui:

Installato ImageMagick guardare questa documentazione.

Per convertire, da terminale, scrivere secondo l'esempio:

convert filein.jpg fileout.tiff

Questo comando fa leggere le immagini da 1 a 5

convert image-%d.jpg[1-5]

Creazione di pdf modifica

Assumendo di avere le scansioni originali in originali, il seguente codice le taglia in modo lossless (con jpegtran) e le converte in pdf (con sam2p).

#!/bin/bash
mkdir jpeg_single pdf_jpeg_single
for i in $(seq -w 0869)
do
  jpegtran -crop 1768x2662 originali/A$i.JPG > jpeg_single/z$(printf %04d $(expr $i '*' 2 - 1)).jpeg
  jpegtran -crop 1768x2662+1768 originali/A$i.JPG > jpeg_single/z$(printf %04d $(expr $i '*' 2)).jpeg
done
for i in `seq -w 1738`
do
  sam2p jpeg_single/z$i.jpeg pdf_jpeg_single/z$i.pdf
done

Per creare un pdf multipagina si può usare pdftk; la sintassi è:

pdftk input1.pdf ... inputN.pdf cat output output.pdf

La creazione dei djvu è simile, usando c44 al posto di sam2p e djvm al posto di pdftk. - Laurentius (disc.) 22:03, 11 mar 2011 (CET)

Vedi anche modifica