Progetto:Bot/Programmi in Python per i bot/regexLoad.py/doc
Questa è la sottopagina che contiene la documentazione di Progetto:Bot/Programmi in Python per i bot/regexLoad.py. Contiene le informazioni sull'uso, le categorie e gli altri elementi che non sono inseriti direttamente nella pagina di riferimento. Per visualizzare la pagina di riferimento, guarda Progetto:Bot/Programmi in Python per i bot/regexLoad.py. |
Descrizione
modificaLo script contiene un'unica funzione, che va integrata in uno script più esteso.
La funzione regexLoad() legge un file txt UTF-8 in cui sono memorizzate una serie di regex, una per riga, ciascuna delle quali contiene quattro elementi separati da tab:
- stringa regex,
- stringa subst,
- modificatori (in formato numerico),
- commento.
Le stringhe che iniziano con il carattere # sono ignorate. Quindi, per adattare la lista a un'opera, basta disattivare o attivare le regex opportune.
Esempio utilizzato per la pre-elaborazione python di OCR:
############### # schemi regex # elemento 1: espressione regex # elemento 2: espressione subs # elemento 3: codice parametri, da sommare (MULTILINE=8; IGNORECASE=2) é è 0 ([^{])({)([^{]) \1(\3 0 conversione graffe singole in tonde ([^}])(})([^}]) \1)\3 0 conversione graffe singole in tonde ([^'])(')([^']) \1’\3 0 conversione apostrofi singoli \( ( 0 normalizzazione spaziatura \) ) 0 ([\.,;:?!]) \1 0 normalizzazione spaziatura \r\n \n 0 \*$ - 8 conversione apostrofo a fine riga in trattino ........