Differenze tra le versioni di "Aiuto:Strumenti per la rilettura"

 
== postOCR ==
;Cosa fa:
La funzione postOCR esegue una serie di semplici correzioni del testo, eliminando molti dei piccoli difetti caratteristici dei testi che provengono da un OCR (denominati '''scannos'''). La funzione è in via di revisione e miglioramento; è opportuno utilizzarla solo nelle prime fasi della correzione e formattazione, usandola invece con cautela su testo già [[Aiuto:Formattazione|formattato]].
 
Mentre le prime versioni non riconoscevano le zone del testo dove è necessario conservare gli acapoa capo"perchè indispensabili alla corretta formattazione, la versione attuale riconosce, e risparmia, gli acapoa capo significativi per il codice wiki. E' quindi consigliabile NON lanciare la funzione suusull'OCR grezzo, ma applicare subito, su tale testo, alcuni codici di formattazione, in modo da permettere allo script di agire "a ragion veduta".
 
E' quindi opportuno aggiungere subito, prima di lanciare la correzione postOCR, i seguenti codici:
Bisogna evitare invece di lanciare la funzione quando il testo contiene già link oppure template; in questo caso, la conversione degli apostrofi da dattilografico a tipografico potrebbe "rompere il link" se i nomi delle pagine, delle funzioni o dei parametri richiamati contengono apostrofi (es: parametro "Nome dell'autore" all'interno del template Intestazione).
 
;Approfondimento
La funzione deriva da analoga funzione predisposta per i testi in inglese ed è stata parzialmente adattata agli ''scannos'' tipici dei testi italiani; può essere ulteriormente perfezionata e tutti gli utenti sono incoraggiati ad annotare e segnalare (nel [[Wikisource:Bar|bar generale]] o nel [[Wikisource:Domande tecniche|bar tecnico]]) errori ricorrenti che potrebbero essere integrati nella funzione.
 
33 373

contributi