Discussioni progetto:Qualità/Archivio/Testi scansionati
Proofreadpage - Inzio l'introduzione su it.source
modificaVi comunico che sto predisponendo l'introduzione dell'estensione da noi. Inizio dai template e dalle pagine di sistema per poi sperimentare su un testo. Vi aggiorno quando siamo pronti per giudicare insieme i frutti di questa estensione. -- iPork → scrivimi 10:59, 6 lug 2007 (CEST)
- Aggiornamento: con ThomasV stiamo cercando di risolvere un problema tecnico. -- iPork → scrivimi 11:50, 7 lug 2007 (CEST)
- Aggiornamento: Il problema è stato risolto. Ora sto provando il sistema per semplificare al massimo l'aggiunta dei testi e per definire delle procedure per i testi a fronte. Ora stacco e proseguo dopo. -- iPork → scrivimi 19:08, 7 lug 2007 (CEST)
- Richiesta: c'è la possibilità di mettere la linguetta con la freccia verso l'altro (quella che punta all'indice) come prima linguetta a sx delle frecce sx/dx? Così le abbiamo tutte insieme. Ciao, --Accurimbono 08:01, 8 lug 2007 (CEST)
- Lo vediamo in seguito chiedendo agli sviluppatori. Il collocamento delle linguette di navigazione è integrato nell'estensione. -- iPork → scrivimi 13:12, 8 lug 2007 (CEST)
- Richiesta: c'è la possibilità di mettere la linguetta con la freccia verso l'altro (quella che punta all'indice) come prima linguetta a sx delle frecce sx/dx? Così le abbiamo tutte insieme. Ciao, --Accurimbono 08:01, 8 lug 2007 (CEST)
- Aggiornamento: Ho iniziato a scrivere le procedure per caricare le immagini. L'abbozzo si trova qui e contiene le spiegazioni iniziali. Iniziate a darci una occhiata così da migliorare la pagina. I colori definiti, l'aspetto grafico etc etc sono cose sulle quali discuteremo insieme e sulle quali abbiamo massima libertà. Ciò che mi preme è intanto mettere le basi tecniche allo strumento cercando di semplificare al massimo le operazioni. -- iPork → scrivimi 13:12, 8 lug 2007 (CEST)
- Aggiornamento: Ho creato le basi per Indice:De' matematici italiani anteriori all'invenzione della stampa. Direi di lasciare a Aubrey il compito di completare l'inserimento dei testi e delle pagine, del resto è la sua tesi :o) Così facendo proverà il sistema. Nel frattempo io vorrei concentrarmi su Della congiura di Catilina per il quale creereò l'indice seguendo le procedure indicate qui. Chi vorrà seguirmi farà cosa grata. -- iPork → scrivimi 11:06, 9 lug 2007 (CEST)
- Ti seguo a ruota, compatibilmente con l'esame! of course :) --Accurimbono 11:08, 9 lug 2007 (CEST)
Testi scansionati - illustrazioni
modificaFinora abbiamo avuto nella gestione delle due categorie Testi scansionati e Illustrazioni un iter facilitato:
- o abbiamo trovato testi già digitalizzati in cui dovevamo includere le illustrazioni (caso Il saggiatore)
- O abbiamo scansionato testi senza troppo curarci delle illustrazioni che essi contenevano (caso Vita_di_Frate_Ginepro)
In ambo i casi abbiamo dato alle categorie il nome dell'opera. Il caso Veratti ci pone un problema: il testo prevede sia pagine scansionate che illustrazioni. Inseriamo tutto nell'unica categoria De' matematici italiani anteriori all'invenzione della stampa effettuando un mescolone, o teniamo distinti testi e illustrazioni? Nel secondo caso come chiamerò la categoria delle illustrazioni? - εΔω 23:22, 1 ott 2007 (CEST)
- La prima cosa che mi viene in mente è una categoria dedicata alle illustrazioni che viene inserita sia nella categoria del testo scansionato che dentro Illustrazioni. Potrebbe essere, per l'esempio indicato:
- Categoria:De' matematici italiani anteriori all'invenzione della stampa --> testi scansionati
- Categoria:De' matematici italiani anteriori all'invenzione della stampa - Illustrazioni --> spostiamo qui le illustrazioni e diviene una sotto-categoria della precedente
- La stessa categoria viene inclusa anche in Categoria:Illustrazioni, così andando in illustrazioni trovo le illustrazioni relative al testo.
- Categoria:De' matematici italiani anteriori all'invenzione della stampa --> testi scansionati
- -- iPork → scrivimi 09:33, 2 ott 2007 (CEST)
- Ehm... questo significa dunque che tutte le categorie di illustrazioni dovranno esssere chiamate [[Categoria:{{NOMEOPERA}} - Illustrazioni]] con "spazio trattino spazio e i maiuscola"? Giusto per capire e aver conferma prima di muovermi (evidentemente le categorie di illustrazioni più affollate dovranno essere ricategorizzate via bot, spero). - εΔω 18:11, 3 ott 2007 (CEST)
- Io direi di si. Se mettiamo prima il nome dell'opera nelle categorie gli indici sono più leggibili e per lo spazio tra il - è solo per rendere meglio leggibile il nome. Che ti pare? -- iPork → scrivimi 01:19, 4 ott 2007 (CEST)
Arriva un carico di ...OCR!
modificaThomasV, il buon developer che si scatena su source, ha attivato l'OCR anche per it.source! A breve maggiori spiegazioni dettagliate ed un progetto tematico finalmente dedicato a valorizzare/lavorare sui testi con immagini. Il sistema è ancora sotto test da ThomasV (come vedete ho attivato il flag di bot al suo bot proprio per questo), quindi non è ancora operativo pubblicamente. È solo questione di tempo (poco) e poi avremo uno strumento spettacolare! -- iPork → scrivimi 17:55, 14 dic 2007 (CET)
- Se è quello che spero, ne vedremo delle belle! :) --Accurimbono 18:03, 14 dic 2007 (CET)
Ci sono novità a riguardo? --Accurimbono (disc) 10:35, 2 gen 2008 (CET)
- Si, che l'ocr non funziona :o/ restiamo in attesa di ThomasV per chiarimenti. -- iPork → scrivimi 23:05, 2 gen 2008 (CET)
- Sappiamo qualcosa di più? Io ho appena pingato Thomas su altro, non vorrei romperlo troppo sulla questione. Comunque ieri, per un fugace e irripetibile momento ho visto un tastino OCR di fianco al Salva nella pagina di modifica. Purtroppo avevo già cliccato salva e non sono più riuscito a rivederlo!! Mi piacerebbe capire se sta succedendo qualcosa oppure siamo fermi.
- PS: ieri ho parlato con alcuni membri della rete civica di Modena, da sempre comune aperto sul fronte Open source e affini. Sono abbastanza competenti e molto interessati a collaborazioni con Wikimedia, e per quanto riguarda Source mi daranno contatti con le biblioteche modenesi. Erano molto interessati a questa idea dell'OCR integrato in MediaWiki: infatti come idea è geniale, bisogna solo vedere la perfomance che ha sul campo. Ad ogni modo, se la cosa andasse avanti sarebbe un bene per tutti: c'è qualcuno che possa pingare gentilmente ThomasV Per sapere qualcosa di più? Aubrey McFato 19:07, 25 gen 2008 (CET)