Aiuto:Gestione file djvu per esperti

Aiuto: Gestione dei file DjVu per esperti

Categoria: Guida alla digitalizzazioneManuale   Guida alla digitalizzazione   Gestione file djvu per esperti 

File DjVu

modifica

DjVu è una tecnologia di compressione d'immagine che permette di creare immagini di alta qualità ma leggere. E' stato concepito espressamente per la digitalizzazione di opere cartacee, operazione che necessita di:

  • file leggeri (elevato numero di scansioni delle pagine)
  • alta risoluzione (leggibilità della scansione)

Immagini DjVu sono dunque fortemente consigliate per l'utilizzo dei libri con testo a fronte (proofread extension) e la loro gestione è integrata nel software wikimedia. Per un'introduzione al tema vedi Aiuto:Gestione file djvu; per le caratteristiche tecniche vedi wikipedia.

Il programma DjvuToy

modifica

Semplice programma per Windows (in inglese) che permette di svolgere varie azioni sui file DjVu .

DjvuSolo non viene più aggiornato da tempo e questo lo ha reso incapace di elaborare i file .djvu più moderni. Ultimamente era necessario ricorrere all'uso delle routine con metodi legato all'"antico" DOS.

Oggi, la sorte unita all'intelligenza di un giovane (?) cinese ci ha fornito un tool che permette la gestione completa dei file .djvu in tutte le necessità che generano. Soprattutto l'"Editor" è un concentrato di utilità per lavorare sulle riproduzioni dei libri. Ma anche altre funzioni sono (finalmente!) alla portata di chiunque. Compresa la possibilità di creare, partendo da immagini (scansioni di testi, foto, disegni), file DjVu di buona qualità, cosa finora demandata obbligatoriamente a server esterni, con tempi piuttosto lunghi e legati ai collegamenti web.

N.B. Il programma non converte file .pdf in .djvu. (Speriamo in futuro...).

Un piccolo help work in progress per iniziare a usare DjvuToy si trova in Aiuto:DjvuToy.

Download (in questo indirizzo viene inserita sempre l'ultima release del programma il cui nomefile (.zip) non cambia (quindi attenzione alle sovrapposizioni...)

http://www.comicer.com/stronghorse/software/exe/DjVuToy_eng.zip

Il programma Djvu Solo

modifica

Il programma Djvu Solo, sia per Windows che per Mac e Linux, è reperibile nel sito SourceForge. E' in grado di modificare molti file DjVu (come quelli restituiti dal sito Any2Djvu), aggiungendo, spostando, rimuovendo pagine. E' anche in grado di costruire un file DjVu importando, anche a grossi gruppi, immagini di vario formato (in genere jpg). Può creare file molto compatti in bianco e nero, o file più pesanti in qualità fotografica. Oltre all'applicazione GUI (interfaccia grafica a finestre), vengono forniti una serie di programmi separati da utilizzare da riga di comando (permettendo quindi l'avvio di varie elaborazioni dal prompt di sistema, da un file batch (.bat sotto Windows), o da programmi che sono in grado di inviare comandi al sistema operativo, come python).

Si tratta dell'unica applicazione free disponibile per la gestione dei file DjVu, e si tratta quindi di un tool indispensabile per chi voglia gestire in proprio la parte grafica dell'elaborazione proofread.

Non è in grado di aprire/modificare i file DjVu di Internet Archive, che possono essere caricati "tali quali" su Commons; in alternativa, può essere utilizzato il file pdf di Internet Archive, dopo conversione in file DjVu attraverso il servizio online Any2Djvu (il DjVu fornito da Any2Djvu può essere gestito con DjvuSolo)

Per l'uso del servizio Any2Djvu vedi Aiuto:Gestione file djvu.

Le routine DjvuLibre

modifica

L'attuale standard del file DjVu richiede l'uso delle routine DjvuLibre, una collezione di programmi a riga di comando, scaricabile dal sito http://djvu.sourceforge.net .

Le routine consentono il completo controllo di tutti i componenti dei file DjVu; consentono l'estrazione e il montaggio delle immagini, con conversione in vari formati; consentono inoltre il controllo completo dello "strato testo". Permettono di effettuare direttamente dai file DjVu "bundled" alcune frequenti operazioni come l'eliminazione o l'aggiunta di pagine.

I programmi "a riga di comando" possono essere utilizzati:

  1. direttamente dal prompt di sistema (sotto windows, nella finestra aperta da cmd.exe);
  2. attraverto uno script di sistema (sotto windows, da un file di testo .bat);
  3. attraverso una chiamata al sistema da un programma esterno (ad esempio, attraverso la funzione os.system() di python).

Gli script a riga di comando hanno lo svantaggio di richiedere grande attenzione e parecchio studio di documentazione spesso difficile per essere utilizzati, ma hanno il grande vantaggio di permettere l'automazione delle procedure, in quanto le chiamate alle funzioni possono essere integrate in un programma scritto dall'utente.

Le routine djvuLibre si integrano con il visualizzatore DjView, che permette di esplorare quasi ogni aspetto del contenuto dei file e consente anche l'esportazione di immagini e testo.

Seguono alcune "ricette" per l'uso delle routine; per il loro funzionamento è previsto che l'utente:

  1. abbia installato sul proprio pc de routine DjvuLibre e il visuyalizzatore DjView;
  2. abbia aperto una cartella denominata djvu;
  3. sia in grado di inserire in tale cartella un collegamento al file cmd.exe, e l'abbia configurato in modo che all'atto della sua apertura, la cartella corrente sia la cartella djvu;
  4. le routine DjVu siano raggiungibili dalla riga di comando avendo aggiornato il PATH di sistema.

Le ricette

modifica

Le seguenti ricette prevedono:

  • che si siano scaricate le routine DjvuLibre
  • che si operi nella directory contenente le routine DjvuLibre oppure che la directory sia stata aggiunta al path di sistema
  • che si conoscano rudimenti dell'uso dell'interfaccia "riga di comando" (cmd sotto windows)

Estrarre una pagina

modifica

Primo passo per la comune operazione di inserire pagine vuote, allo scopo di correggere errori di scansione (pagine non scansionate)

  • Scaricare il file djvu
  • Aprire il file djvu con DjView
  • posizionarsi sulla pagina da estrarre (una pagina vuota qualsiasi)
  • File -> Save as...
  • scegliere l'opzione "Current page" e un nome per la pagina estratta
  • OK e viene creato un file djvu, del nome scelto, fatto della sola pagina selezionata

Cancellare una pagina

modifica
  • aprire cmd e spostarsi nella directory contenente il file djvu
  • aprire il file djvu e posizionarsi sulla pagina da cancellare; annotare il numero della pagina
  • dare nella console cmd il seguente comando1:
    djvm -d "[nome file djvu]" [numero pagina]
  • verificare con DjView che le cose siano andate bene

Esempio, il comando cancella la pagina 5 del file Deledda - La giustizia, 1914.djvu:

djvm -d "Deledda - La giustizia, 1914.djvu" 5

Inserire una pagina

modifica
  • predisporre la pagina da inserire (in genere una pagina bianca)
  • aprire cmd e spostarsi nella directory contenente il file djvu
  • aprire il file djvu in cui va inserita la pagina e posizionarsi sulla pagina SUCCESSIVA rispetto alla pagina da inserire; annotarsi il numero dalla pagina
  • dare nella console cmd il seguente comando:
    djvm -i "[nome file djvu]" "[nome pagina djvu da inserire]" [numero pagina in cui inserire]
  • verificare con DjView che le cose siano andate bene

Esempio, il comando inseriosce la pagina "bianca.djvu", precedentemente preparata, PRIMA della pagina 5 del file Deledda - La giustizia, 1914.djvu:

djvm -i "Deledda - La giustizia, 1914.djvu" "bianca.djvu" 5
Suggerimento
dovendo aggiungere varie pagine in punti diversi del file, è opportuno procedere, per non sbagliare, dall'ultima all'indietro.
  1. Le virgolette attorno al nome del file sono indispensabili solo se il nome file contiene spazi; ma non fanno comunque danni

Modifiche alle singole pagine di un file DjVu

modifica

Per modificare le singole pagine di un file DjVu (in particolare, per eseguire un ritaglio dei margini bianchi, il "cropping", spesso opportuno per lavorare più comodamente nelle pagine Pagina:), è necessario esportare le singole immagini dal file DjVu in formato jpg o tiff, modificarle e poi riassemblare il file DjVu con la pagine modificate. Vi sono molti metodi per trasformare un file DjVu in una sequenza di immagini, eventualmente anche usando un server wiki (all'atto della visualizzazione di una pagina DjVu all'interno di una pagina wiki, la pagina è automaticamente trasformata in una immagine jpg). Esistono anche altre strategie, che dipendono dalla disponibilità di file alternativi contenenti le stesse immagini (pdf, tiff) o dall'esportazione diretta mediante i tool a riga di comando accessori. Sono necessari test per identificare la strategia più comoda; tuttavia molto dipende dall'utente e dalle sue competenze e abitudini; la strategia via server wiki non richiede alcun software particolare, ed è alla portata di qualsiasi utente che disponga unicamente di Djvu Solo.

(continua)

Domande?

modifica

Se hai domande, dubbi, proposte o necessiti di chiarimenti su come effettuare la rilettura di un testo premi qui e lascia un messaggio nella pagina di discussione.