Aiuto:Gestione file djvu: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
m migrazione automatica di 1 collegamenti interwiki a Wikidata, d:q19845842
Nessun oggetto della modifica
Riga 115:
|''Tratta dal PDF su cui è stato fatto il DjVu ''
|}
 
 
== Dentro il djvu: struttura e manipolazione dello strato testo ==
 
Ogni pagina djvu può contenere uno strato testo, comprendente sia il testo vero e proprio della pagina, che annotazioni, che non vengono normalmente visualizzate.
 
Lo strato testo è organizzato in elementi annidati, di dettaglio man mano più alto (dal testo dell'intera pagina al suingolo carattere), e ciascun elemento è ''mappato'' sull'immagine della pagina, ossia sono salvati sia il suo contenuto testuale che le coordinate assolute dell'immagine dell'elemento testuale sulla pagina.
 
Non sempre il dettaglio possibile viene registrato fino al carattere; in genere il dettaglio maggiore registrato è quello della ''parola'', in alcuni casi della ''linea''.
 
L'albero degli elementi annidati comunque è sempre ''completo'', da quello di dettaglio minimo (pagina) a quello di maggiore dettaglio.
 
I livelli sono:
*pagina
** colonna
*** regione
**** paragrafo
***** linea
****** carattere
 
Usando DjView, opzione diplay->hidden text, gli elementi di maggiore dettaglio del testo vengono visualizzati sopra l'immagine, permettendo un rapido sguardo sull'organizzazione del testo.
 
L'estrazione di tutti i dati relativi al testo può essere effettuata da due diversi programmi a linea di comando DjvuLibre, che producono un output di struttura completamente diversa: '''djvused.exe''' e '''djvutoxml.exe'''. Essendo a linea di comando, entrambi possono essere integrati in programmi capaci di effettuare chiamate di sistema (es. python).