Aiuto:Strumenti per la rilettura/trova e sostituisci

Lo strumento Trova e sostituisci presenta alcune analogie con l'omonimo strumento integrato negli strumenti di default e rintracciabile alla sezione Avanzate del toolbox, sulla destra. Nonostante il nome, questo strumento non possiede una funzione "trova", ed esegue solamente sostituzioni globali e dirette.

Quindi, se serve sostituire con cautela esaminando una a una le sostituzioni, è opportuno usare lo strumento standard, anziché lo script.

Tuttavia il nostro Trova e sostituisci, scritto da Candalua, ha il vantaggio di avere un codice aperto e quindi migliorabile; e nel tempo in effetti sono state aggiunte interessanti caratteristiche.

  1. Se si seleziona un testo, e poi si attiva Trova e sostituisci, la selezione viene automaticamente caricata sia nel campo Cerca che nel campo Sostituisci. Basta modificare (per quello che serve) il campo Sostituisci e dare OK.
  2. Eseguita la sostituzione, il tool non si chiude; possono essere predisposte altre sostituzioni e possono essere lanciate, una dopo l'altra, con notevole velocità.
  3. Possiede un'opzione Ricorda. Se si attiva questa opzione, la sostituzione viene memorizzata in una variabile permanente, e verrà lanciata automaticamente su qualsiasi pagina aperta successivamente, nel momento in cui si lancia postOCR.
  4. Può eseguire sostituzioni regex; l'argomento è molto complesso, ma chi conosce la sintassi regex di javascript o chi intende provare troverà questa opzione molto interessante. Il codice da inserire nel primo campo è quello che si inserirebbe nel delimitatore regex / / e non quello che si inserirebbe in una stringa da passare a RegExp. Il tool dà all'espressione regex un parametro g (sostituzioni multiple) di default.

Approfondimento: "Ricorda"

modifica

Le sostituzioni memorizzate vengono impaccate in un oggetto in formato JSON memorizzato in localStorage.memoRegex. L'opzione Ricorda memorizza la sostituzione aggiungendola a quelle già presenti nella variabile. Il gadget memoRegex aggiunge due pulsanti,salva regex e carica regex. Il primo permette di scaricare l'intera variabile in formato testo, in qualsiasi pagina; il secondo consente di caricare in memoria un set precedentemente memorizzato con salva regex, semplicemente selezionandolo e premendo il pulsante, aggiungendo tutte le sostituzioni a quelle precedentemente memorizzate.

Questo meccanismo è pensato per creare delle serie di sostituzioni specifiche per un'opera, o per un tipo di opere; salvando le sostituzioni in una pagina stabilita (di solito la pagina Discussioni indice: dell'opera) il set di sostituzioni può essere caricato e arricchito da più utenti, ed è inoltre disponibile per lo stesso utente nel momento in cui si lavora con un altro browser o con un altro pc (localStorage è, infatti, "privato", nel senso che è memorizzato in uno spazio specifico del pc, inaccessibile agli altri browser, e visibile solo dal sito da cui è stato memorizzato).

Un approfondimento ed esempi pratici qui: Aiuto:MemoRegex

Emulazione dello strumento é -> è

modifica

Per inglobare l'azione di converti é -> è in trova e sostituisci, è sufficiente inserire nel campo Cerca il carattere é, in Sostituisci il carattere è, attivare l'opzione Ricorda e premere Ok. Alle successive attivazioni di postOCR, la sostituzione verrà effettuata in automatico. È importante notare che in certi casi é va conservato e non sostituito!

Creazione di un dizionario per la sostituzione f -> s

modifica

Il carattere ſ, o s lunga, presente in alcuni testi non recenti, è prevalentemente interpretato dal software OCR come f. Essendo nell'italiano scritto più frequente la s rispetto alla f, una discreta strategia è quella di convertire tutti i caratteri f in s per poi correggere gli eventuali errori. Tuttavia, un metodo più accurato potrebbe essere il seguente: memorizzare le sostituzioni per le parole più comuni e meno ambigue, andando a costituire progressivamente un dizionario di sostituzioni.

Allineamento a destra delle celle contenenti numeri

modifica

Un interessante esempio di applicazione di trova e sostituisci congiuntamente alle espressioni regolari. Poniamo il caso in cui la riga della tabella in cui vogliamo allineare le cifre a destra sia la seguente:

|Milano||1924||Torino||1932

È possibile notare che le celle in cui va inserito il codice di allineamento align=right| sono riconoscibili per la presenza di un doppio carattere |, seguito da una cifra numerica. Impostando le espressioni regolari \|\|(\d) in Cerca e ||align=right|$1 in Sostituisci, il lavoro viene svolto agilmente, anche in presenza di molte righe e colonne. :-)