Discussioni Wikisource:Politiche e linee guida/Versioni scannerizzate
Proposta
modificaRiporto dal bar
Cari amici, vorrei proporre un piccolo progetto, che penso potrebbe apportare un miglioramento alla nostra già prestigiosa Wikisource, e potrebbe già usufruire della scoperta di books.google.it. Perchè non inseriamo, come pagina correlata ad un opera, una sezione che contenga il testo scannerizzato? Per testi brevi, la fatica sarebbe minima, giusto l'upload dell'immagine, e per i testi lunghi si valuterebbe di volta in volta se ne vale la pensa. Ciò permetterebbe due significativi miglioramenti:
- Rilettura: si avrebbe il testo cartaceo disponibile per una rilettura, quindi diretto passaggio a SAL 101%.
- Pro
- velocizza il passaggio da SAL 75% a SAL 101%, saltando l'ibrido 100%.
- Contro
- Pro
- Inserimento: se vi fosse un deposito comune in cui inserire scannerizzazioni e/o foto, si avrebbe perennemente materiale pronto per i formattatori più volenterosi.
- Pro
- Permette all'utente volenteroso di applicarsi su un testo, senza che esso perda tempo a cercare il testo da formattare. Non tutti conoscono i siti giusti nè magari hanno preferenze (non che ci siano capitati molti casi del genere, ma cerco di pensare al futuro). Inoltre non tutti possiedono adeguati programmi OCR (come il sottoscritto), o anche lo scanner. In questa maniera si verrebbe incontro a queste esigenze.
- Contro
- Si potrebbe avere un aumento sconsiderato di files, rubando memoria nei server.
- Pro
Queste le prime cose che mi vengono in mente, aggiungete, modificate e dite la vostra. La mia idea dovrebbe essere chiara, e spero anche i miglioramenti che potrebbe apportare. Se non ci sono problemi legali,ovviamente... Fatevi sentire. (firmo adesso :)) Aubrey McFato 12:12, 4 ott 2006 (UTC)
- Una ottima idea che già circolava nell'aria e che tu hai giustamente messo nero su bianco :o) Approfondiamo il discorso del copyright e per me possiamo iniziare con un testo così da definre insieme subito le regole per questa iniziativa. Ad esempio dovremmo dare degli standard tecnici (risoluzione, dimensioni, etc.) e formali (come presentare le immagini, ad esempio con il comando che crea una galleria o altro). -- iPork → scrivimi 10:03, 4 ott 2006 (UTC)
- Dal punto di vista legale nessun problema. Se il testo è di pubblico dominio potete scannerizzare quanto vi pare idem se è un documento non elegibile nel copyright (vedi testi di natura normativa). In entrambi i casi state attenti a non mantenere la stessa formattazione della fonte alla quale avete attinto, perchè il "come si propone un testo", può essere soggetto a copyright.--Senpaiottolo 10:19, 4 ott 2006 (UTC)
Ed ora via con le riflessioni e le proposte! -- iPork → scrivimi 06:35, 5 ott 2006 (UTC)
- Prima sperimentazione: mentre l'OCR da un'immagine volgare bene o male a seconda dei programmi riesce, con il ReadIRIS del mio scanner HP i documenti in pdf risultano indecifrabili: un punto a sfavore del pur fantastico formato pdf. Sto sbagliando qualcosa? --87.25.13.30 17:45, 25 ott 2006 (UTC) (il "grande assente" dall'ufficio del suocero :-D)