Wikisource:Siti autorevoli/Internet archive: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 34:
Vi sono due strade alternative fra cui scegliere. La correzione automatica dei piccoli scannos (errori caratteristici dell'interpretazione OCR) varia a seconda dell'alternativa scelta. Tale correzione è molto importante perchè accelera moltissimo la revisione e la rende molto meno tediosa (gran parte degli errori consiste in anormale spaziatura in relazione alla punteggiatura, e in "lapsus frequenti", come rendere con una '' r '' i caratteri '' l' '').
 
=== Strategia 1: utilizzare il tool di ThomasV ===
''(continua)''
L'utilizzo del tool di caricamento automatico del testo, quando il file djvu possiete un "text layer", è asolutamente semplice: basta creare una pagina, e compare automagicamente il testo "incorporato" nella pagina djvu.
 
La qualità del testo varia: talora è un guazzabuglio di caratteri (pagine con immagine sfuocata o difettosa, frontespizi con caratteri molto grandi e con font inusuale) da cancellare e riscrivere daccapo a mano; in genere la qualità è buona, talora molto buona, e tutto quello che serve è una serie di piccoli ritocchi e la correzione "umana" di alcune parole mal interpretate.
 
I ritocchi comprendono:
# correzione della spaziatura connessa alla punteggiatura;
# riunione delle parole spezzate a fine riga;
# eliminazione dei caratteri acapo conservando i doppi acapo;
# trasformazione degli apostrofi da dattilografici a tipografici;
# normalizzazione delle virgolette.
 
Nel caso delle poesie, occorre inoltre
# aggiungere il tag poem
# eliminare, spesso, i doppi a capo.
 
Molte di queste correzioni possono essere fatti con pochi click chiamando funzioni javascript. Chiedete a [[Utente:Alex brollo]]