Discussioni utente:Alex brollo/varie/djvuXml2Txt.py: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 35:
::: {{ping|Ruthven}} Il problema è che l'articolo non riguarda, da quello che capisco, le coordinate dei frammenti di testo, ma i frammenti di testo (i caratteri). Ho la sensazione che il "mondo delle coordinate" sia una cosa del tutto diversa, e molto più ricca di dati. E anche più divertente come sfida.... ;-)
::: E' un po' come il mondo pywikibot. Penso di non aver mai usato uno degli script pronti. Siccome lo faccio per divertimento, faccio quello che mi diverte; lo so benissimo che chi entra nel mio personale "mondo degli script" si diverte, aimè, molto di meno. --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 11:24, 15 giu 2020 (CEST)
::::Infatti (sgrunt!) La questione è sempre di sapere se usare tutto questo tempo sulle coordinate serve a qualcosa. Ricordo che a como raccontasti delle meraviglie dello strato sotto al DJVU che permette di identificare lettere e parole nella scansione. Ma poi ho usato il Google OCR su un PDF senza strato testo soggiacente ed ha funzionato benissimo. È vero che poter selezionare una parola permette, in un ebook, di cercarne la definizione e altre amenità simili, ma penso che lo stesso si possa fare con un PDF con un OCR automatico. Detto ciò, come dice un mio caro amico: "Dove c'è gusto, non c'è perdenza", quindi non abbandonare mai i tuoi personali script, che sono una fonte di divertimento per te. Ma oltre a questo, dal lato mio vorrei trovare soluzioni efficienti. Ognuno si diverte come sa ;) <span style="font-family:Times; color:#219">'''[[Utente:Ruthven|Ruthven]]'''</span> <span style="color:#0070EE"><small>([[User talk:Ruthven|<span style="color:#101090">msg</span>]])</small></span> 22:15, 15 giu 2020 (CEST)
Ritorna alla pagina utente di "Alex brollo/varie/djvuXml2Txt.py".