Contenuto cancellato Contenuto aggiunto
Riga 368:
Pezzetto per pezzetto, sto rivedendo textAlign.py; la conversione a python3 è ostica, oltre al famoso print() ci sono problemi unicode e regex (dipendenti da unicode).
 
Al momento sto lavorando sull'estrazione dell'OCR dai file djvu (con qualche post-elaborazione), preliminare per tutto il resto. Goldoni mi ha un po' arrugginito, vediamo se cavo il ragno dal buco. Obiettivo concreto, ottenere un testo pronto per lo split "canonico" o ultrarapido. --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 10:08, 26 mag 2020 (CEST)