Aiuto:Guida alla pubblicazione di un testo/Costruire il file djvu

Il wiki-bibliotecario buono ti dà il benvenuto
Struttura di un file Djvu.Da destra a sinistra, la pagina risultante, il livello di testo, il livello di sfondo e l'eventuale OCR.

Qui da noi, in Wikisource, uno dei formati più utilizzati per i file di origine dei testi è l'ormai famoso djvu (si pronuncia "déjà vu").

È un formato grafico raster appositamente sviluppato per l'editoria e l’archiviazione di scansioni, la cui caratteristica più simpatica (e utile!) è la grande possibilità di compressione delle immagini dei testi, con poca o nulla perdita di qualità. Il trucco sta nel distinguere l'immagine dello sfondo della pagina (cioè proprio il bianco!) dalle eventuali figure e dalle immagini dei singoli caratteri, e comprimere in modo diverso (e a risoluzioni diverse) queste tre tipologie di informazioni. Quanto di meglio per le necessità che abbiamo di presentare testi leggibili senza richiedere apparati ultrapotenti.

Le opere che aspirano ad avere i quadratini verdi di qualità del SAL 100% (fonte indicata, testo completo, formattato correttamente, riletto usando la fonte cartacea digitalizzata) hanno bisogno di riportare a fronte l'immagine della fonte cartacea, perché questa ha proprio lo stesso ruolo dei "<ref>" su Wikipedia. Per questa ragione l'uso del formato djvu è diventato molto importante e largamente diffuso. Dunque il bravo wikisourciano che voglia contribuire all'eccellenza di questo progetto deve produrre l'immagine dei testi originali in formato djvu.

Come può fare? Semplice: segue queste istruzioni. E ci mette un po' di buon senso :-)

Per esempio, col buon senso, distingue da solo quando si parla di file djvu puramente di immagine (foto, disegni) e file djvu relativi a testi e articolati in più pagine. Capisce che quando si parla di "lavorare dentro il file", sarà il secondo caso...

Procurarsi un tool per gestire i file djvu

modifica

La strada facile

modifica

Scaricare il tool DjVuToy (freeware)! Ne parliamo ampiamente nella pagina Aiuto:DjvuToy. Il bravo wikisourciano che vorrà giocare con i file djvu dovrebbe procurarselo scaricandolo qui. Altrimenti buona parte di questa pagina non gli servirà.

Sulla vecchia strada

modifica
 
Meglio usare DjVuToy... datemi retta :D

Se proprio non vuole/può usare il DjvuToy, il buon wikisourciano si procura un visualizzatore per i file djvu da questo indirizzo.

Il visualizzatore, che si chiama DjView.exe, può essere eseguito semplicemente facendo un doppio click su di esso.

Verrà creata una cartella chiamata DjVuLibre. Tranquillo: l'installazione è una pura "scompattazione", non ci sono "rovistamenti" del sistema.

Dentro la cartella DjVuLibre ci sono le "routine" per modificare i file. Si tratta di file exe che sono programmi che possono essere chiamati individualmente, attraverso una console di sistema (una finestra con il vecchio prompt C:>) oppure attraverso un file bat oppure da una chiamata scritta in un programma qualsiasi.

Per non dover sistemare i parametri di sistema, il buon wikisourciano scarica i file djvu su cui deve operare direttamente dentro la cartella DjVuLibre, fianco a fianco dei file exe.

Se da bravo amante della cultura open usi Linux, non ti preoccupare, qui trovi altre spiegazioni su come procurarti il necessario.

Ottenere un testo partendo da un altro formato

modifica

Ottenere un file djvu dal testo scansionato

modifica

Tramite DjVuToy

modifica

DjVuToy crea file djvu di buona qualità e molto velocemente. Con enorme vantaggio rispetto alla pur sempre lenta lavorazione attraverso il server (metodo vecchiotto con any2djvu) ottenibile con la banda ADSL italiana :-( Inoltre permette una gestione totale dei file ed elimina la necessità di spedire ai server gli eventuali nuovi file corretti o elaborati successivamente.

  1. Lanciare il tool.
  2. Scegliere "Maker" e seguire le relative semplicissime istruzioni che si trovano qui. Si ottiene un file "bundled" con tutte le pagine del testo ben allineate.
  3. Se le pagine sono di varie misure, ridefinire i DPI e/o le dimensioni (istruzioni qui).
  4. Controlla la qualità generale del file ― leggibilità, ordine delle pagine, ecc. ― e porre rimedio a eventuali manchevolezze (istruzioni qui).

Tramite any2djvu

modifica
  1. Comprimere le scansioni delle pagine in un file-archivio .zip o .tar.
  2. Controllare il file-archivio. Per evitare altre complesse lavorazioni future sul file djvu, i file devono essere in ordine numerico (e quindi le pagine) e devono esserci tutti :-)
  3. Caricare il file-archivio (zip o tar) sul server di any2djvu (http://djvu.org/) seguendo le semplici istruzioni (in inglese ma davvero semplici): si otterrà un file il cui nome sarà un lunghissimo numero.
  4. Scaricare il file sul proprio disco rigido e rinominarlo come si preferisce. Sarà meglio per lui se userà lo stesso nome che poi il testo avrà qui da noi su wikisource. Con ciò, infatti, il buon wikisourciano eviterà molti grattacapi in seguito.

Facciamo lavorare Internet Archive

modifica
 
Libertà è collaborazione, chirp!

Trasformare "a casa" un file pdf in djvu è, se non impossibile molto molto complesso e comunque negato ai comuni wiki-mortali che non hanno l'eternità a disposizione.

Allora, il buon wikisourciano può ottenere un duplice risultato caricando il file pdf su Archive.

"Loro" ottengono del materiale che non avevano, lo elaborano e "noi" ne ricaviamo il desiderato file in formato djvu - con anche un OCR, della cui qualità ci è però permesso discutere :-)

Caricare

modifica

Allora, il buon wikisourciano:

  1. entra quatto quatto in I.A. e se già non lo ha fatto si registra (altrimenti non accettano il materiale),
  2. vede, in alto a destra della loro "Pagina Principale", un tasto "Upload",
  3. clicca e appare una seconda schermata con ― sempre in alto a destra ― un tasto "Share". Clicca anche quello,
  4. vede quindi una finestrella intitolata "Seleziona i file da caricare con www.archive.org". Con il solito sistema egli cerca nella pancia del suo computer il file che vuole caricare. Trovatolo, seleziona e clicca "Apri",
  5. vede aprirsi un'ulteriore schermata con
    • in alto, riquadrato in verdolino, il nome del file e, sotto questo, una lineetta che man mano si allunga. Sotto questa lineetta legge un "Uploading" che alla fine si trasformerà in "Complete",
    • più sotto quattro campi da riempire con
      • titolo dell'opera,
      • descrizione (serve breve descrizione di cosa si tratti; romanzo, saggio, poema, ecc.),
      • parole chiave suggerite per la futura ricerca,
      • autore dell'opera (I.A. dice che non è obbligatorio perché spesso sono anonimi ma se l'autore è conosciuto meglio metterlo).
 
Caricare; scaricare; finire mai, eh!? Grunt!!

Infine, il buon wikisourciano clicca sul tipo di licenza che pensa sia adatto. Quando apparirà il "Complete" di cui parlavamo sopra basta che clicchi sul bottone "Share my File(s)".

Sarà necessario che il buon wikisourciano attenda che il file sia elaborato. Dopo qualche ora (dipende da molti fattori e specialmente dal "peso" del file) il file sarà diventato come tutti gli altri file di I.A. e il buon wikisourciano ivi troverà il file in formato djvu.

Suggerimento: sarà utile al buon wikisouciano copiare l'identifier-access così poi trovare il file sarà immediato.

Scaricare

modifica

Il buon wikisourciano:

  1. cerca il suo file djvu con l'identifier access. In mancanza di questo va nella Home Page di I.A. (quella gialla e verde) e clicca su "Contributions" e poi su "tasks that are done" dove trova tutti i suoi contributi al sito,
  2. porta gli estremi sul monitor dove la pagina diventa bianca e rossa,
  3. sulla sinistra nota il quadretto "View the book", in basso, legge "All files: HTTP",
  4. clicca su questo link e trova una lista di link ai file nei vari formati,
  5. scarica il file djvu nel proprio PC. Se necessario lo rinomina.

Gestire i file djvu

modifica

Naturalmente non sempre i file djvu che abbiamo sotto mano sono già perfetti, a volte occorre modificarli un po' prima che sia possibile caricali su Wikisource. Vediamo come fare.

Eliminare pagine

modifica

Il buon wikisourciano dovrà spesso eliminare alcune pagine ridondanti, ad esempio quelle warning di google. Ecco allora qualche suggerimento.

Alta comodità

modifica

Premesso che il comportamento più astuto è quello di rivolgersi a Aiuto:DjvuToy, riportiamo qui sotto antiche metodologie di uno sciamano (carnico, pare) che possono ancora essere utilizzate come succedanei.

The long and winding road

modifica

(uno dei pezzi più romantici mai scritti. Mmhmmm!)

Se proprio diventa necessario, si può operare usando il programma djvm.exe, eseguendolo direttamente dalla riga comandi in questo modo:

  1. aprire la riga comandi (da Start / Esegui / Apri scrivere "cmd") e posizionarsi nella cartella dove si trovano sia il file djvm.exe che il file .djvu dal quale dobbiamo rimuovere la pagina. Per posizionarsi nella cartella giusta bisogna usare pazientemente il comando cd (cd nomecartella porta alla sotto-cartella indicata - cd.. sale di una cartella - cd\ porta alla root),
  2. digitare il comando "djvm -d nomefile.djvu 1" che significa: "esegui djvm in modalità delete sul file nomefile.djvu eliminando la pagina 1". Attenzione, dopo che si esegue il comando viene eliminata la pagina indicata e, di conseguenza, le pagine seguenti saranno tutte ricalcolate. Quindi, prima di eseguire nuovamente il comando per un'altra pagina aprire il file .djvu e verificare quale sia effettivamente il numero di pagina da cancellare.

Estrarre pagine

modifica
 
Grattare, grattare!

Se il buon wikisourciano si trova nella necessità di estrarre solo alcune pagine dal file (ad esempio un articolo di 20 pagine da una rivista di 400) può usare DjVuToy, in cui però allo stato attuale (giugno 2011) questa funzione è piuttosto lenta con rischio di vedere che il programma "non risponde". Il buon wikisourciano può allora rivolgersi al buon vecchio DjvuView che permette di eliminare tutto in un colpo o una alla volta le varie pagine di un djvu, ma solo quelle prima e/o dopo il testo che si vuole estrarre!

Così.

Il buon wikisourciano dovrà quindi:

  1. fare un backup preventivo del file da lavorare (non si sa mai...),
  2. aprire il file, controllando da quale pagina inizia il testo e quale sia l'ultima che si vuol tenere,
  3. andare in "File/Salva come" per aprire la finestrella,
  4. cliccare su "Pagine da-a",
    1. per "da" inserire la prima pagina che si vuol tenere,
    2. per "a" inserire l' ultima pagina che si vuol tenere,
  5. decidere dove salvare scegliendo la cartella (magari cambiando il nome del file per sicurezza),
  6. premere "Salva".

Il buon wikisourciano otterrà un file con le sole pagine da-a, con il nomefile da lui deciso, nella directory da lui scelta.

Nota: a volte, dopo aver salvato il file, il DjvuWiev si blocca ma il file viene salvato. Nessun problema.

Aggiungere pagine

modifica

Nell'ipotesi che al testo così faticosamente ottenuto manchi qualche dettaglio (una pagina mancante o scansionata male, un'altra non scansionata in un file ma presente in un altro - cosa che succede spesso con Books) sarà necessario "aggiungere".

Premesso che ogni lavorazione di questo tipo deve mantenere la coerenza interna dell'edizione (non si possono avere pagine chiaramente differenti tratte da edizioni diverse, per esempio con il numero di pagina non sequenziale o con il testo diversamente impaginato), ancora una volta il buon wikisourciano avrà di fronte un'alternativa.

L'Editor di DjVuToy

modifica

Permette di lavorare dentro il file con facilità. Per informazioni basta andare a vedere (eh già!) questa sezione della pagina di aiuto.

Il certosino

modifica

L'alternativa, modello pazienti certosini, che il buon wikisourciano userà se ha necessità/voglia di adoperare DjVuView per togliere o aggiungere ogni pagina, è questa.

  1. Con Con DjVuWiew, apre il file DjVu.
  2. Nel menù, con "File/esporta come" può esportare le pagine in formato immagine TIFF o BMP o altro (e finché sono poche...).
  3. Sceglie quelle che gli servono.
  4. Le "zippa" assieme alle altre, in ordine, in un archivio.zip.
  5. Fa creare un file djvu al solito server di any2djvu.

Domande?

modifica

Se hai domande, dubbi, proposte o necessiti di chiarimenti sulla costruzione del file djvu premi qui e lascia un messaggio nella pagina di discussione.

Collegamenti esterni

modifica