Contenuto cancellato Contenuto aggiunto
Riga 374:
:::: Un sistema lo troveremo. Intanto questo che è il primo frammento che sto testando per riempire di un testo "OCR migliorato" vari attualmente vuoti di [[Wikisource:Scrittori d'Italia]]: [[Utente:Alex brollo/extract_djvu_text.py]]. Ho cercato di aggiungere doc "esuberante" rispetto al mio standard no-doc ;-) --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 22:50, 26 mag 2020 (CEST)
:::::{{ping|Alex brollo}} OK, mi sono fatto una versione del "extract djvu text.py" che funziona in locale con python3. Se vuoi lo condivido (ma ho cambiato poco al tuo codice). Una cosa non capisco: perché la variabile <code>base</code> è impostata a "Nome pagina.djvu" e non al nome del file djvu. --<span style="font-family:Times; color:#219">'''[[Utente:Ruthven|Ruthven]]'''</span> <span style="color:#0070EE"><small>([[User talk:Ruthven|<span style="color:#101090">msg</span>]])</small></span> 15:39, 27 mag 2020 (CEST)
:::::: E' una nome dummy per testare. Comunque la cosa si sta evolvendo: sto raccogliendo "pezzi di codice" per utilizzare, come OCR, il file _djvu.xml di Internet Archive. Sempre che non lo blocchino pure lui.... :-( --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 20:31, 27 mag 2020 (CEST)