Progetto:Bot/Programmi in Python per i bot: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 61:
| Trova le chiamate al tl|Ritaglio nelle pagine di un Indice, estrae l'immagine della pagine e produce le immagini "ritagliate" pronte a essere caricate su Commons. Se sono molte il caricamento è molto facilitato dall'uso di commonist.
|-
|'''[[/OCRfixfixOCR.py|OCRfixfixOCR.py]]'''
| Nuova versione semplificata per la correzione massiva di imprecisioni dello strato testo di un file djvu, in un unico passaggio. Ad ogni parola dell'OCR viene applicata una lista di sostituzioni memorizzate in un file txt esterno, replace.txt (codice UTF-8), con un singolo comando che chiede solamente il nome del file djvu: <code>python fixOCR.py [nome file djvu]</code>
|Estrae la lista ordinata delle parole da un file djvu (step1), ne permette la correzione e infine esegue il ricaricamento sul file djvu (step2). "Normalizza" la struttura testo dei djvu prodotti da FineReader 11 (crea gli elementi <code>para</code> e <code>line</code> e sopprime gli elementi <code>char</code>; elimina gli acapo all'interno degli elementi <code>word</code>)
|-
|'''[[/ia.py|ia.py]]'''
|Interfaccia IA in fase di sviluppo per la gestione della collezione itwikisource (uploading di file; modifiche di metadata), basata su internetarchive.py.
Line 73 ⟶ 72:
|Script per la riparazione dei file djvu senza testo prodotti da IA Upload (utilizza il djvu senza testo di IA Upload e il file _djvu.xml di Internet Archive)
|}
<!--|'''[[/OCRfix.py|OCRfix.py]]'''
|Estrae la lista ordinata delle parole da un file djvu (step1), ne permette la correzione e infine esegue il ricaricamento sul file djvu (step2). "Normalizza" la struttura testo dei djvu prodotti da FineReader 11 (crea gli elementi <code>para</code> e <code>line</code> e sopprime gli elementi <code>char</code>; elimina gli acapo all'interno degli elementi <code>word</code>)
|-
-->
 
==Script obsoleti==