Wikisource:Bar/Archivio/2020.09: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 400:
::* '''chiedo l'OK della comunità''' per il caricamento (il pdf contiene un simpatico rilascio in CC-BY-SA proprio in pagina 1)
::* comincio a pensarci; a prima vista lo caricherei in monoblocco, come pdf, separandolo poi in pagine ns0 principali, una per volume. Ma considero seriamente anche l'alternativa: separare subito il pdf nei vari volumi, caricandoli in file pdf e in pagine Indice separate: il che permetterebbe di "mantenere il senso" della numerazione originale delle pagine (che re-iniziano per ogni volume). Naturalmente tutti i file avrebbero una fonte comune (l'item IA). --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 14:29, 29 set 2020 (CEST)
=== Ripensamento 1 ===
La fonte migliore non è il pdf ma l'html, contenuto nel file IA [https://archive.org/download/AppuntiDiInformaticaLibera/20060701.a2.htm.tar.gz in questo file IA] che, esploso, risulta sostituito da centinaia di pagine html e migliaia di immagini jpg. In teoria dovrebbe essere possibile la conversione in codice wiki, e templatestyles dovrebbe consentire l'importazione della formattazione dei testi con modifiche automatiche. Non sarà un lavoro semplicissimo.... ma di certo è stimolante, "challenging". L'idea è di caricare il pdf e di ottenere in automatico il codice dall'html. Alternativa: esportare l'html direttamente dal pdf con pdftohtml e vedere cosa ne viene fuori. C'è qualcuno che può dare una mano? L'importante è partire con il piede giusto. PS: stiamo parlando di un'opera con più di 17000 pagine. Impensabile da fare "a mano" con il solito approccio. Seguono aggiornamenti e ulteriori ripensamenti. --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 10:10, 1 ott 2020 (CEST)
 
== Proposta di collaborazione con Internet Archive ==