Aiuto:Gestione file pdf

Aiuto: Gestione dei file pdf

Categoria: Guida alla digitalizzazioneManuale   Guida alla digitalizzazione   Gestione file pdf 

icona simbolo del formato

Il PDF (Portable Document Format) è il secondo tipo di file multipagina utilizzabile per la procedura proofread di wikisource; il secondo formato, che presenta vari vantaggi, è il djvu.

Opportunità per wikisource

modifica

E' probabile che in varie circostanze sia opportuna una manipolazione automatica di due tipi di pdf:

  • i pdf che costituiscono un semplice "raccoglitore di immagini", spesso prodotti direttamente dallo scanner come formato di output (es. pdf di Opal Libri Antichi);
  • i pdf "ricercabili", in cui oltre all'immagine esiste uno "strato testo" mappato, che permette di ricercare e evidenziare il testo nelle immagini (es. pdf prodotti da FineReader e da Internet Archive). Questi pdf sono utilizzabili come file per il prooofread, il testo viene recuperato come "ocr", ma al momento non sono adatti al Match & Split, che funziona solo con i file djvu


+++