Wikisource:Bar/Archivio/2018.12: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 535:
::: {{ping|Ruthven|OrbiliusMagister}} Benissimo! Il lavoro è parecchio, comincio a dissodare il problema principale (conversione tl|Book -> tl|Information) e il problema della ricategorizzazione come suggerito su Commons, oltre a quello grafico di eliminazione dal background in capilettera e altre immagini "semplici" da convertire certamente in scala di grigi o in B/N. Lascerò invece in sospeso le modifiche sulle illustrazioni vere e proprie (incisioni, foto...) che meritano molta più cura e probabilmente il ricaricamento dalla fonte, piuttosto che la modifica di crop da djvu (spesso con grossolani artefatti da compressione). C'è poi il problema di creare qui una pagina di linee guida semplici sulle illustrazioni, dove ci siano poche indcazioni ma chiare; naturalmente non si può pretendere che vengano sempre consultate e seguite, ma ci vogliono ugualmente. Per le modifiche grafiche vedo che è estremamente utile creare delle gallerie delle immagini da modificare, tipo [[Utente:Alex brollo/gallery 1]] e seguenti, perchè mostrano, man mano che il lavoro procede, "l'effetto che fa". [[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 10:32, 28 dic 2018 (CET)
::::{{Ping|Alex brollo}} Controlla anche [[c:User:Fæ/Project_list/Internet_Archive]]: si tratta di uno dei più grossi progetti di caricamento su Commons, dove Fae ha estratto crop da numerose immagini presenti su IA automaticamente. Lì, descrive il suo metodo di lavoro e quant'altro. --<span style="font-family:Times; color:#219">'''[[Utente:Ruthven|Ruthven]]'''</span> <span style="color:#0070EE"><small>([[User talk:Ruthven|<span style="color:#101090">msg</span>]])</small></span> 10:46, 28 dic 2018 (CET)
::::: {{ping|Ruthven}} Non ne sapevo nulla, grazie! A Como non ho avuto il tempo di parlare a fondo del file IA _abbyy.gz; oltre a maree di altri dati, il file contiene,pagina per pagina, le coordinate de box a contenuto non testuale. Ci giurerei che IA ha sfruttato questi dati per l'autocrop... il file xml che contiene è spaventoso, indigesto per un buon parser python, ma una volta fatto a pezzi (per pagina) diventa pienamente digeribile. Lo conosci già? Ti interessa la struttura? --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 17:09, 28 dic 2018 (CET)