Discussioni progetto:Qualità/Archivio/Testi scansionati

Ultimo commento: 16 anni fa, lasciato da Aubrey in merito all'argomento Arriva un carico di ...OCR!
Archivio del Bar del Coordinamento: Testi scansionati

Categoria: Discussioni del progetto qualitàPortale progetti   Progetto qualità   Bar del Coordinamento   Archivio   Testi scansionati 


Proofreadpage - Inzio l'introduzione su it.source

modifica

Vi comunico che sto predisponendo l'introduzione dell'estensione da noi. Inizio dai template e dalle pagine di sistema per poi sperimentare su un testo. Vi aggiorno quando siamo pronti per giudicare insieme i frutti di questa estensione. -- iPorkscrivimi 10:59, 6 lug 2007 (CEST)Rispondi

Aggiornamento: con ThomasV stiamo cercando di risolvere un problema tecnico. -- iPorkscrivimi 11:50, 7 lug 2007 (CEST)Rispondi
Aggiornamento: Il problema è stato risolto. Ora sto provando il sistema per semplificare al massimo l'aggiunta dei testi e per definire delle procedure per i testi a fronte. Ora stacco e proseguo dopo. -- iPorkscrivimi 19:08, 7 lug 2007 (CEST)Rispondi
Richiesta: c'è la possibilità di mettere la linguetta con la freccia verso l'altro (quella che punta all'indice) come prima linguetta a sx delle frecce sx/dx? Così le abbiamo tutte insieme. Ciao, --Accurimbono 08:01, 8 lug 2007 (CEST)Rispondi
Lo vediamo in seguito chiedendo agli sviluppatori. Il collocamento delle linguette di navigazione è integrato nell'estensione. -- iPorkscrivimi 13:12, 8 lug 2007 (CEST)Rispondi
OK! --Accurimbono 14:44, 8 lug 2007 (CEST)Rispondi
Aggiornamento: Ho iniziato a scrivere le procedure per caricare le immagini. L'abbozzo si trova qui e contiene le spiegazioni iniziali. Iniziate a darci una occhiata così da migliorare la pagina. I colori definiti, l'aspetto grafico etc etc sono cose sulle quali discuteremo insieme e sulle quali abbiamo massima libertà. Ciò che mi preme è intanto mettere le basi tecniche allo strumento cercando di semplificare al massimo le operazioni. -- iPorkscrivimi 13:12, 8 lug 2007 (CEST)Rispondi
Aggiornamento: Ho creato le basi per Indice:De' matematici italiani anteriori all'invenzione della stampa. Direi di lasciare a Aubrey il compito di completare l'inserimento dei testi e delle pagine, del resto è la sua tesi :o) Così facendo proverà il sistema. Nel frattempo io vorrei concentrarmi su Della congiura di Catilina per il quale creereò l'indice seguendo le procedure indicate qui. Chi vorrà seguirmi farà cosa grata. -- iPorkscrivimi 11:06, 9 lug 2007 (CEST)Rispondi
Ti seguo a ruota, compatibilmente con l'esame! of course :) --Accurimbono 11:08, 9 lug 2007 (CEST)Rispondi

Testi scansionati - illustrazioni

modifica

Finora abbiamo avuto nella gestione delle due categorie Testi scansionati e Illustrazioni un iter facilitato:

  • o abbiamo trovato testi già digitalizzati in cui dovevamo includere le illustrazioni (caso Il saggiatore)
  • O abbiamo scansionato testi senza troppo curarci delle illustrazioni che essi contenevano (caso Vita_di_Frate_Ginepro)

In ambo i casi abbiamo dato alle categorie il nome dell'opera. Il caso Veratti ci pone un problema: il testo prevede sia pagine scansionate che illustrazioni. Inseriamo tutto nell'unica categoria De' matematici italiani anteriori all'invenzione della stampa effettuando un mescolone, o teniamo distinti testi e illustrazioni? Nel secondo caso come chiamerò la categoria delle illustrazioni? - εΔω 23:22, 1 ott 2007 (CEST)Rispondi

La prima cosa che mi viene in mente è una categoria dedicata alle illustrazioni che viene inserita sia nella categoria del testo scansionato che dentro Illustrazioni. Potrebbe essere, per l'esempio indicato:
-- iPorkscrivimi 09:33, 2 ott 2007 (CEST)Rispondi
Ehm... questo significa dunque che tutte le categorie di illustrazioni dovranno esssere chiamate [[Categoria:{{NOMEOPERA}} - Illustrazioni]] con "spazio trattino spazio e i maiuscola"? Giusto per capire e aver conferma prima di muovermi (evidentemente le categorie di illustrazioni più affollate dovranno essere ricategorizzate via bot, spero). - εΔω 18:11, 3 ott 2007 (CEST)Rispondi
Io direi di si. Se mettiamo prima il nome dell'opera nelle categorie gli indici sono più leggibili e per lo spazio tra il - è solo per rendere meglio leggibile il nome. Che ti pare? -- iPorkscrivimi 01:19, 4 ott 2007 (CEST)Rispondi

Arriva un carico di ...OCR!

modifica

ThomasV, il buon developer che si scatena su source, ha attivato l'OCR anche per it.source! A breve maggiori spiegazioni dettagliate ed un progetto tematico finalmente dedicato a valorizzare/lavorare sui testi con immagini. Il sistema è ancora sotto test da ThomasV (come vedete ho attivato il flag di bot al suo bot proprio per questo), quindi non è ancora operativo pubblicamente. È solo questione di tempo (poco) e poi avremo uno strumento spettacolare! -- iPorkscrivimi 17:55, 14 dic 2007 (CET)Rispondi

Se è quello che spero, ne vedremo delle belle! :) --Accurimbono 18:03, 14 dic 2007 (CET)Rispondi

Ci sono novità a riguardo? --Accurimbono (disc) 10:35, 2 gen 2008 (CET)Rispondi

Si, che l'ocr non funziona :o/ restiamo in attesa di ThomasV per chiarimenti. -- iPorkscrivimi 23:05, 2 gen 2008 (CET)Rispondi
Sappiamo qualcosa di più? Io ho appena pingato Thomas su altro, non vorrei romperlo troppo sulla questione. Comunque ieri, per un fugace e irripetibile momento ho visto un tastino OCR di fianco al Salva nella pagina di modifica. Purtroppo avevo già cliccato salva e non sono più riuscito a rivederlo!! Mi piacerebbe capire se sta succedendo qualcosa oppure siamo fermi.
PS: ieri ho parlato con alcuni membri della rete civica di Modena, da sempre comune aperto sul fronte Open source e affini. Sono abbastanza competenti e molto interessati a collaborazioni con Wikimedia, e per quanto riguarda Source mi daranno contatti con le biblioteche modenesi. Erano molto interessati a questa idea dell'OCR integrato in MediaWiki: infatti come idea è geniale, bisogna solo vedere la perfomance che ha sul campo. Ad ogni modo, se la cosa andasse avanti sarebbe un bene per tutti: c'è qualcuno che possa pingare gentilmente ThomasV Per sapere qualcosa di più? Aubrey McFato 19:07, 25 gen 2008 (CET)Rispondi
Ritorna alla pagina "Qualità/Archivio/Testi scansionati".