Aiuto:Gestione file pdf
- Aiuto
Il PDF (Portable Document Format) è il secondo tipo di file multipagina utilizzabile per la procedura proofread di wikisource; il secondo formato, che presenta vari vantaggi, è il djvu.
Opportunità per wikisource
modificaE' probabile che in varie circostanze sia opportuna una manipolazione automatica di due tipi di pdf:
- i pdf che costituiscono un semplice "raccoglitore di immagini", spesso prodotti direttamente dallo scanner come formato di output (es. pdf di Opal Libri Antichi);
- i pdf "ricercabili", in cui oltre all'immagine esiste uno "strato testo" mappato, che permette di ricercare e evidenziare il testo nelle immagini (es. pdf prodotti da FineReader e da Internet Archive). Questi pdf sono utilizzabili come file per il prooofread, il testo viene recuperato come "ocr", ma al momento non sono adatti al Match & Split, che funziona solo con i file djvu
+++