Discussioni progetto:Trascrizioni/Archivio/2
Link pagine->versione testuale
modificaAl momento, esiste il link versione testuale -> pagina sorgente (attraverso il tl|Pagina) ma non esiste un link pagina sorgente -> versione testuale.
Ho implementato sperimentalmente in Pagina:Narcissa.djvu/3 tale link con queste operazioni:
- creazione di un'ancora con il tl § sulla pagina (nel caso, essendo un poemetto, ancorandolo al primo verso, con il codice: {{§|numero pagina|verso}})
- aggiunta di un tl|AltraVersione nell'intestazione non transclusa (nel caso, ho aggiunto {{AltraVersione|http://it.wikisource.org/wiki/Narcissa#3|Versione testuale}} subito dopo al tag <div class="pagetext"> dell'intestazione).
Nei casi "semplici", come Narcissa, in cui la versione testuale è costituita da una pagina singola, questo completa la procedura. Nei casi, invece, in cui la versione testuale è divisa in capitoli, il link all'interno del tl AltraVersione deve puntare sul capitolo specifico; questo è fattibile via bot scorrendo il codice della versione testuale e estraendo i tl|Pagina compresi dal capitolo, ricavandone l'elenco delle pagine Pagina: a cui aggiungere il link corretto.
Prima di procedere alla preparazione di un ulteriore script interattivo di Alebot, che potrebbe svolgere completamente l'intera procedura in tutti i casi, chiedo la vostra opinione sullo sporco trucco. --Alex brollo (disc.) 11:59, 6 lug 2009 (CEST)
Raccolte di opere
modificaCon Indice:Opere di Giovan-Batista Gelli.djvu si pone ancora un vecchio problema: la "resa testuale" di un testo stampato che raccoglie opere distinte di un autore (e si porrà il caso di testi che raccolgono opere distinte di diversi autori). Io proporrei di creare comunque una versione testuale del testo come sta, costituito per ora dal solo indice, riservandoci di decidere in un secondo momento quali voci dell'indice devono puntare su sottopagine della pagina principale, e quali voci invece devono puntare su pagine principali costituite dalle singole opere. Proverei proprio con Opere di Giovan-Batista Gelli - non escludo qualche problema nei sistemi di indicizzazione, ma fin che non si prova... --Alex brollo (disc.) 11:15, 13 lug 2009 (CEST)
- Anzi: piuttosto che proporlo, lo faccio. Al massimo, si cancellerà o sposterà qualche pagina. --Alex brollo (disc.) 11:26, 13 lug 2009 (CEST)
Nuova assegnazione SAL per pagine: "Senza testo"
modificaMagari è passato sotto silenzio, ma se si apre in modifica una pagina proofread ci si accorgerà che i pulsanti per lo stato di avanzamento dei lavori sono diventati cinque!
il primo di tutti è senza alcuna icona e, è nuovo e serve a indicare le pagine senza testo: sarebbe l'evoluzione del template:pagina bianca. Il vantaggio di tale situazione è che questo contrassegno esclude la pagina dal proofreading, vale a dire che non rende necessario che almeno due utenti guardino tale pagina.
Questa innovazione ha due implicazioni operative:
- Con un bot occorrerebbe sostituire tutti i template pagina bianca contrassegnando le pagine che li contengono come pagine senza testo
- Occorrerebbe modificare il sistema di javascript che associano a un livello di SAL le varie iconette per associare l'icona a tale status.
Per il primo caso mi serve un botolatore, per il secondo dovrò studiarmi un po' di fogli di stile e di javascript.
Ovviamente chi è interessato può darmi una mano... - εΔω 09:05, 18 ago 2009 (CEST)
- Me ne ero accorto... e non escluderei di aver rollbackato o "corretto" :(
- Adesso rivedo criticamente. --Alex brollo (disc.) 21:07, 18 ago 2009 (CEST)
- OK ci sono. Il codice della pagina, come lo vede il bot, è:
<noinclude>{{PageQuality|0|Alex brollo}}<div class="pagetext"> </noinclude><noinclude> <references/></div></noinclude>
- e quindi la chiave è il codice {{PageQuality|0|Alex brollo}} conficcato nell'header. In teoria l'elenco delle pagene vuote dovrebbe stare nel "Puntano qui" di tl|pagina bianca, vediamo... sono 271 pagine, di cui ho la lista. Posso far partire Alebot quando vuoi. Allora, ho capito bene? Si tratta di sostituire il PageQiality esistente con {{PageQuality|0|Alebot}}, ed eventualmente, per pulizia, di eliminare anche tutto quello che c'è nella parte testo della pagina (inp particolare il template Pagina vuota). OK? --Alex brollo (disc.) 21:30, 18 ago 2009 (CEST)
Cenni sul caricamento via bot di testi nel nsPagina
modificaIl caricamento di testi sul nsPagina può essere fatto via bot, e quando riesce, dà una gran soddisfazione.
Prerequisito è che all'interno del testo ci sia un chiaro "segnale" del punto di inizio pagina, e che questo segnale sia esattamente allineato con il contenuto del file djvu che verrà presentato a fronte.
I testi da LiberLiber (versione txt) ce l'hanno "forte e chiaro", e questo, ad esempio, ha consentito di caricare Zibaldone. I testi da Internet Archive (versione txt) ce l'hanno invece incompleto e confuso, essendo semplicemente il risultato della scansione nel numero pagina, con moltissimi errori: una cosa da verificare attentamente a mano. Al contrario, su Internet Archive il segnale è chiarissimo all'interno della versione djvu.xml del testo; ma il file è di una complessità tremenda, se usato a mano, perchè "mappa" le singole parole con le coordinate in pixel all'interno delle singole pagine. Per uso "umano" questo file è totalmente inutilizzabile, occorre disporre di un "estrattore" che ripeschi le singole parole, estraendole dal maragma xml, e le ricucia in pagine. E io me ne sono costruito uno.
I testi in qualsiasi formato immagine, organizzato pagina per pagina, passati a un OCR dall'utente, penso che non diano problemi, in quanto il programma OCR li organizza, suppongo, in pagine (non dispongo di questi programmi, non ne so quasi nulla).
In tutti i casi in cui si dispone di un testo continuo, senza alcun segnale di inizio-fine pagina, il segnale tocca infilarlo a mano. E' quello che faticosamente sto facendo su Zibaldone, al momento lavoro al Volume V.
Infilato il segnale di inizio pagina, uno script python può "segmentare" il testo in pagine, e può eseguire le ulteriori elaborazioni preliminari al caricamento. Si tratta - in genere - della conversione di codifica, cosa assai esoterica che mi ha a lungo dato grattacapi. Occorre infatti trasformare la codifica del testo in input in Unicode, e la manovra giusta da fare dipende dalla codifica utilizzata nel testo che si è segmentato.
Io ho utilizzato script python "do it yourself" per "battere" tutte queste strade, ma uso script "personali", non nel senso che ne sia geloso, ma che sono poco generalizzati, poco documentati, e quindi inutilizzabili per utenti che non siano me stesso. Per generalizzare il loro uso, occorerebbe innanzitutto mettersi d'accordo sul "segnale di inizio pagina", e poi crere un gruppetto di utilizzatori che usi le versioni alfa (abbozzi di prova), e poi le versioni beta (script che potrebbero anche essere "definitivi") degli script, per evitare il famoso rischio "ogni scarafone".
Se c'è qualcuno interessato, sarei ben contento di condividere tutti gli script che ho, e di raffinarli... prerequisito: una conoscenza (anche ultra-elementare) di python. --Alex brollo (disc.) 09:37, 29 ago 2009 (CEST)
- Aggiungo... esiste pagefromfile.py (linkato in meta:Using_the_python_wikipediabot#Scripts), ma a un primo sguardo preferisco gli sctipt miei, che "masticano" tranquillamente testi di centinaia di pagine. --Alex brollo (disc.) 14:48, 31 ago 2009 (CEST)
- Novità: nella nuova estensione proofread, dovrebbe essere previsto il caricamento automatico dell'eventuale testo integrato nel file djvu. Tale testo dovrebbe essere presente e utilizzabile nei file djvu di Internet Archive. Non ho ancora avuto occasione di verificare: qualcuno ha provato? --Alex brollo (disc.) 14:23, 7 ott 2009 (CEST)
- Aggiungo... esiste pagefromfile.py (linkato in meta:Using_the_python_wikipediabot#Scripts), ma a un primo sguardo preferisco gli sctipt miei, che "masticano" tranquillamente testi di centinaia di pagine. --Alex brollo (disc.) 14:48, 31 ago 2009 (CEST)
Sillabo
modificaCari amici,
ho un dilemmuccio prima di fare un lavoraccio per nulla
Abbiamo Indice:Sillabo.djvu. Queste pagine sono transcluse in Sillabo mentre in Con quanta cura (enciclica) - Sillabo/Sillabo c'è ancora il testo e non la transclusione delle pagine. Dato che volevo trasformare il primo in rinvio al secondo si pone un problema, dato che il secondo è diviso in tante pagine quanti sono i capitoli del Sillabo. Qual è la strategia migliore? Io vedo due scenari, poi ditemi voi...
- Il più brutale: tengo il testo del Sillabo (come è ora Sillabo) unito in una sola pagina e cancello i vari capitoli in cui è stato inizialmente diviso.
Per amor di citazione dovrei trovare comunque la maniera di rendere ancorabili i vari capitoli.
- Inserisco nel testo da transcludere i tag section che richiamerò nei vari capitoli... lavoraccio!
La seconda soluzione è la più carina tecnicamente, ma prima di sottopormi a un tour de force vedete altre soluzioni? - εΔω 12:23, 8 set 2009 (CEST)
- Cancellare contenuto Sillabo e inserire redirect a Con quanta cura (enciclica) - Sillabo/Sillabo? --Xavier121 13:22, 8 set 2009 (CEST)
- Fatto - εΔω 16:33, 8 set 2009 (CEST)
Bug che ci riguarda
modificaC'è un bug (corretto nella versione del software più recente, ma non ancora implementata qui) dell'estensione ProofRead che mi ha fatto impazzire. In pratica, al momento del salvataggio della pagina viene inserito erroneamente un carattere di acapo fra la fine del testo della pagina Pagina e il "footer". Questo crea sottili problemi nella transclusione nel caso che le pagine finiscano a metà di un paragrafo.
Quindi: non impazzite se qualcosa non funziona nella transclusione e vi compare nel testo trascluso un acapo misterioso che resiste a ogni tentativo di correzione... magari mettete qui il link alla pagina incriminata, la correggerò via bot non appena il problema si sarà risolto. --Alex brollo (disc.) 14:18, 7 ott 2009 (CEST)
- Mezz'ora fa, dopo una chiacchierata con Edo, mi sono reso conto che il bug è stato corretto. Ho scatenato Alebot, che sta sistemando le pagine di Indice:Zibaldone di pensieri I.djvu. Nel frattempo controllo la situazione sul volume VII. Segnalatemi altri Indici che necessitano di una ripulita! --Alex brollo (disc.) 23:57, 14 ott 2009 (CEST)
Senofonte
modificaSto lavoricchiando a due opere di Senofonte abbandonando temporaneamente il mio ruolo di aiutante di Alebot. Ho incontrato vari problemi che pongono svariati interrogativi... il primo è la qualità della traduzione settecentesca: la costruzione dei periodi è così intricata che rende certi passaggi quasi incomprensibili. Il secondo, una serie di seri problemi della relazione "molti a molti" (il testo originale raccoglie opere di due autori diversi, e di uno, Senofonte, raccoglie più opere).Il terzo è che ho l'impressione che il traduttore sia caduto in qualche trabocchetto della lingua greca o abbia interpretato con una certa libertà... parla di staffili e staffe, ad esempio, quando mi risulta che avebbero dovuto trascorrere quasi 1000 anni prima della loro scoperta...
Comunque, ho trascrirtto fedelmente il testo; chiedo l'aiuto di chi conosce abbastanza greco da scovare nella wikisource greca, se ci sono, le due opere su cui sto lavorando per aggiungere l'interlink. Io ho interlinkato la versione francese, che pare più fedele (niente staffe....); sulla source inglese purtroppo le due opere non sono ancora trascritte.
Ledue opere da interlinkare con la versione greca sono Dell'arte di cavalcare e Del carico del generale della cavalleria. Grazie! --Alex brollo (disc.) 00:24, 25 nov 2009 (CET)
- Caro Alex,
Quanto all'interlink il testo greco di ambo le opere per ora è solo presso il Progetto Perseus 1 e 2. Lì tra l'altro c'è anche una traduzione inglese. Appena posso proverò a leggere degli scampoli della traduzione italiana per capire cosa abbia combinato il nostro traduttore, ma che i traduttori meno accorti tendano ad attualizzare anche a sproposito non è certo una fatto sporadico che riscontro spesso anche nelle correzioni di compiti in classe. Lungi da me e da chiunque correggere la traduzione d'autore. Semmai in pagina di discussione potrai profonderti in commenti e supposizioni. Sul secondo problema avrema da discustere con più calma. - εΔω 01:32, 25 nov 2009 (CET)
- Me ne guarderò bene dal "profondermi". Alla fine ho capito: wikisource è una fonte, e restituisce un testo maneggevole, facilmente utilizzabile, e molto fedele, per chiunque altrove voglia utilizzarlo secondo le sue possibilità e i suoi interessi. Nella rilettura, annoterò i passi in cui l'italiano è incomprensibile, ho visto che spesso, rileggendo più volte, in giorni diversi, il significato poi emerge... per i casi più disperati chiederò aiuto. Grazie! --Alex brollo (disc.) 18:07, 25 nov 2009 (CET)
- Su el.source un utente mi ha incoraggiato a inserire le due opere da Perseus... Vediamo se ne viene fuori un AM ("Sembrava impossibile, ma ce l'abbiamo fatta") ;-) --Alex brollo (disc.) 09:05, 26 nov 2009 (CET)
- Primi timidi tentativi su una sandbox: el:User:Alex brollo/1. Ma poi ho pensato che posso usare anche una sandbox "nostrana"... lo farò. --Alex brollo (disc.) 11:01, 26 nov 2009 (CET)
- Su el.source un utente mi ha incoraggiato a inserire le due opere da Perseus... Vediamo se ne viene fuori un AM ("Sembrava impossibile, ma ce l'abbiamo fatta") ;-) --Alex brollo (disc.) 09:05, 26 nov 2009 (CET)
- Me ne guarderò bene dal "profondermi". Alla fine ho capito: wikisource è una fonte, e restituisce un testo maneggevole, facilmente utilizzabile, e molto fedele, per chiunque altrove voglia utilizzarlo secondo le sue possibilità e i suoi interessi. Nella rilettura, annoterò i passi in cui l'italiano è incomprensibile, ho visto che spesso, rileggendo più volte, in giorni diversi, il significato poi emerge... per i casi più disperati chiederò aiuto. Grazie! --Alex brollo (disc.) 18:07, 25 nov 2009 (CET)
Senofonte II
modificaFinita la trascrizione delle due opere di Senofonte che mi interessavano, dopo una rapida incursione su el.source sono comparsi là i due originali in greco, tratti da Perseus. Mi domando se fosse accettabile una leggera integrazione di formattazione,rispetto all'originale (senza modificare il testo) anche qui su it.source, per renderlo più facilmente confrontabile con l'originale. Se mi date l'OK potrei ideare qualche trucco per rendere visibile tale formattazione aggiuntiva solo nella versione testuale mediante il solito bravo tl|Pt o analogo.
- divisione del testo in sezioni, come su Perseus
- numerazione delle sotto-sezioni, come su Perseus e quindi su el.source
Che ne dite? date un'occhiata a el:Ιππαρχικός e confrontatela con Del carico del generale della cavalleria (in questo caso la visualizzazione a fronte proprio non funziona) o a el:Περὶ Ἱππικῆς e Dell'arte di cavalcare (qui funziona, ma occorrerebbe la suddivisione in sezioni e sotto-sezioni).--Alex brollo (disc.) 00:38, 28 nov 2009 (CET)
- Di sto, ma precisiamo un paio di punti:
- su Perseus la frammentazione in microsezioni è sistematica e fissa, a volte anche indipendentemente dalle sezioni del testo stesso, dunque non ne seguirei l'esempio.
- Sulla seconda soluzione sono moderatamente favorevole ma dato che potremmo creare un precedente potenzialmente pericoloso desidero che un numero congruo di partecipanti dia il suo assenso per poter invocare il consenso a questa eccezione. - εΔω 10:46, 28 nov 2009 (CET)
- Attendo. Tenete conto che il riferimentonon è direttamente Perseus, ma l'originale el.source, che in questo caso ha importato l'idea Perseus. La formattazione quindi servirebbe, in questo come in altri casi, ad adeguare una versione secondaria source con la versione originale source, quando presente, rendendo molto più agevole ed efficace l'interlinking. --Alex brollo (disc.) 13:40, 28 nov 2009 (CET)
- Pensandoci bene: nulla impedisce (se gli amici di el.source sono d'accordo) di fare una "buona" suddivisione in microsezioni su el.source e di riprenderla qui. Tuttavia la suddivisione Perseus sarebbe più facile da seguire, per me, perchè la traduzione inglese farebbe da "stele di Rosetta". --Alex brollo (disc.) 18:01, 28 nov 2009 (CET)
Aiuto per pagina principale
modificaCari amici,
sto meditando su come porre in evidenza in pagina principale qualche opera che ricada in questo progetto. Ho pensato a questo: possiamo richiedere la rilettura di opere al 75% Siccome l'attuale SAL funziona per le singole pagine ma solo parzialmente per gli indici, che ne direste se tappassimo questo buco?
Il lavoro è già iniziato: in alcuni indici il template:Qualità è stato posto. Poniamolo in tutti secondo la tabella qui proposta e creiamo un elenco di opere al 75% —non saranno certo molte— Un elenco così, mantenuto in una pagina apposita (che so, una a caso come Wikisource:Aiuta Wikisource) sarebbe un bel richiamo. - εΔω 17:06, 5 dic 2009 (CET)
Proposta per trascrizioni inverse
modificaCari amici,
L'elenco dei testi per le trascrizioni inverse è ora in ordine alfabetico, ma la necessità di vedere le note per capire a che punto è un lavoro è operativamente controproducente: propongo una ristrutturazione dell'elenco ordinando i testi per stato di avanzamento dei lavori
- Edizioni Wikisource: quelli finiti e sistemati(ora in fondo)
- Testi al 75%: quelli solo da rileggere
- i veri testi "da trascrizione inversa" cioè quelli con versione testuale completa e pagina indice ma senza versione testuale
- i testi con versione testuale completa ma senza indice
- i testi con versione testuale, proofread o indice mancanti
Il vero elenco sarebbe quello delle ultime tre categorie. È troppo complicato? Si può semplificare? Se non ricevo feedback procedo domani. - εΔω 19:07, 14 dic 2009 (CET)
Tips & tricks
modificaUna furiosa galoppata nel magico mondo dei template Intestazione mi ha dato l'opportunità di innumerevoli "incastramenti" e per evitare ad altri cefalee vi elenco alcuni dei miei errori, così voi li schivate.
tag noinclude, includeonly, onlyinclude
modificaMi sono scervellato per trovare il trucco per transcludere una pagina in modo che conservi questi tag nel codice transcluso. Dopo innumerevoli tentativi mi sono deciso a entrare in #wikisource e ho interpellato l'oracolo ThomasV. La sua risposta: "You cannot". Breve e chiara. ;-)
tag onlyinclude
modificaNel corso della transclusione di una pagina ha un bellissimo effetto: "marca" l'unica parte della pagina che va transclusa, ma ne permette comunque la visualizzazione diretta (e quindi è diverso da includeonly, che marca un'area che va solo inclusa e non visualizzata!). Questo mi ha consentito, in Testo di prova, un trucco magico: esattamente come siamo abituati a fare nelle pagine discussione per l'infotesto, a ottenere un tl Intestazione per le pagine delle sezioni/capitoli semplicemente transcludento l'intera pagina principale, dove il tl Intestazione è marcato con tag onlyinclude. Problema: il tag viene valutato immediatamente... agisce comunque, anche se è messo dentro tag nowiki e addirittura dentro tag di commento html. Il che è inatteso e può causare cefalee da debugging.
tag section
modificaImmaginate che ci siano due section, una '''<section begin=autore ignoto />''' e una <section begin=autore />. Aimè, transcludendo la sezione chiamata autore il sistema trova anche la section '''<section begin=autore ignoto />. Il problema si risolve usando le virgolette: se ci sono spazi dentro il nome della section, scrivete '''<section begin="autore ignoto" /> e risparmierete una seconda cefalea.
Appello ai trascrittori esperti
modificaCari amici,
dopo il dotto post di Alex volo molto più basso, e porto un'esperienza assai terra terra:
Ieri Didimo69 mi chiese come sezionare una pagina in due parti perché andassero transcluse in due capitoli diversi.
Provai a spiegarglielo, rendendomi conto così che non c'è alcun aiuto per queste operazioni ormai consuete in fase di trascrizione.
Facciamo altri esempi? eccoli:
- Come fare con le note che proseguono nella pagina successiva?
- Come fare per le parole spezzate a cavallo di pagina?
- Come formattare un titolo con centrature e dimensioni enormi?
- Come usare i tag poem con le poesie che continuano per più pagine?
E mi fermo perché queste sono solo tre delle problematiche più ricorrenti.
Occorre una "guida per il trascrittore" for the rest of the world, non per noi. Siccome il futuro è nelle trascrizioni è meglio che ne poniamo le basi ora.
In secondo luogo, prima che passi troppo tempo, è bene porre in una sezione apposita del progetto l'elenco dei template usati nelle trascrizioni (da {{titolo}} a {{pt}}: qualcosa mi dice che essi sono più di quelli che si creda a un primo sguardo, e che sono destinati ad aumentare.
Io non sono l'utente più adatto, dato che il progetto mi riguarda più tangenzialmente di quanto appaia: mi piacerebbe se Xavier si occupasse di questo. - εΔω 10:39, 5 gen 2010 (CET)
- Agli ordini capitano, ormai è giunto il momento, :D Xavier121 11:21, 5 gen 2010 (CET)
- Giustissimo che dopo un post dotto ci fosse un post brontolo :-D
- Aggiunto un commento gongolo, ossia scherzoso: mi impegno formalmente a dare un contributo all'iniziativa, spargendo ulteriori template nuovi in ogni dove! --Alex brollo (disc.) 13:36, 8 gen 2010 (CET)
Cenni sulle novità da divulgare - testare
modificaLa nuova versione dell'estensione proofread, lanciata da ThomasV nel settembre 2009, contiene varie cosette interessanti, alcune delle quali attivate (mediante creazione dei tl dedicati) recentemente. Le novità sono tali da modificare profondamente il lavoro degli utenti (e di rendere inutili laboriosi passaggi prima indispensabili).
- i testi pdf sono gestiti tal quali i testi djvu. Nessuna esigenza, quindi, della conversione pdf->djvu: basta caricare i pdf su Commons e via. Ho utilizzato questo sistema in Indice:Dell'obbedienza del cavallo.pdf.
- se si carica un djvu fornito di "text layer", ossia: del testo integrato, pagina per pagina, come la quasi totalità dei djvu da Internet Archive, il testo integrato OCR nel djvu appare automagicamente al primo edit di una pagina vuota. Potete provare la cosa su una pagina vuota di Indice:Storia della letteratura italiana I.djvu oppure Indice:Storia della letteratura italiana II.djvu.
- oltre ai vari gadget di visualizzazione della qualità delle pagine, c'è da esplorare il nuovo tag <pages>, che transclude blocchi di pagine in un solo colpo. Tuttavia, quando l'ho sperimentato, non è gestito dal sistema di costruzione della versione pdf dell'opera, esattamente come la routine non gestiva bene i testi transclusi con il tl Pagina.
- adesso, da qualche parte nel server, giace un parametro pagequality che bisognerebbe riuscire a interrogare per visualizzare l'icona SAL associata alla pagina, nella nostra versione testuale; ma non ho idea di come si possa fare, nè, mi pare, en.siource aiuta, perchè è molto meno meticolosa di noi sulla questione Qualità.
- il tl OCR non funziona più. L'unico modo di attivare l'interpretazione OCR di una pagina djvu (senza layer di testo) o altro (pdf, jpg etc), è quella di premere il pulsantino OCR di edit ed attendere (pochi secondi) al primo edit di una pagina vuota. Questo preclude la possibilità di richiamare l'OCR con il vecchio template, ostacolando i pochi "abnormal" guidatori di bot ma agevolando in maniera incredibile gli utenti "normal". --Alex brollo (disc.) 11:05, 11 gen 2010 (CET)
- Hai provato a chiedere a ThomasV come fanno loro a richiedere al bot di passare su gruppi di pagine? Sicuramente hanno un modo. --Aubrey McFato 17:03, 11 gen 2010 (CET)
- No, il primo che lo sente glielo deve chiedere! --Alex brollo (disc.) 10:04, 14 gen 2010 (CET)
- Conferma da ThomasV: la "chiamata all'OCR" da bot è disabilitata per rischio di overload del server.
- Però ho indicazioni interessanti su procedure js di post-elaborazione dell'OCR: function typographie() in http://fr.wikisource.org/wiki/MediaWiki/Monobook.js. Esegue un minimo di post-elaborazione automatica sull'output di una pagina generata dall'OCR, solo se non è mai stata editata. Altre funzioni utili di post-elaborazione in http://en.wikisource.org/wiki/User:Billinghurst/monobook.js. --Alex brollo (disc.) 15:38, 21 gen 2010 (CET)
- No, il primo che lo sente glielo deve chiedere! --Alex brollo (disc.) 10:04, 14 gen 2010 (CET)
Poem
modificaFinalmente, dopo qualche try and learn (compreso un ngenuo tentativo di simularne l'azione con un template, e precipitosa ritirata... ;-) ), mi sono deciso a guardare per bene la documentazione del tag poem e ho capito cosa fa, esattamente, e cosa può fare. Visto l'uso intensivo che ne facciamo qui, io penso che una pagina dedicata che spieghi TUTTO di questo tag non sarebbe male, potrei tradurre la documentazione ufficiale ... ma c'è qualcuno che poi sistemi la cosa in conformità con la bella grafica che contraddistingue le pagine di aiuto? Sistemare graficamente è una cosa che mi frustra... se qualcuno ci sta, apro una sottopagina Utente:Alex brollo/Aiuto poem da correggere liberamente e poi integrare nelle pagine di aiuto ufficiali. --Alex brollo (disc.) 09:30, 27 gen 2010 (CET)
- Bene, bluifico il link. Penso che userò i cassetti per nascondere all'utente impressionabile le parti più exoteriche.... il titolo provvisorio di tali cassetti sarà "Riservato agli smanettoni" :-) --Alex brollo (disc.) 18:01, 27 gen 2010 (CET)
Cari amici, volevo segnalare come un paio di esperimenti compiuti a suo tempo siano giunti a maturazione: ho usato il template:Pt in un'altra maniera ceativa.
Guardate a pagina:Sotto il velame.djvu/529: i link ai capitoli sono stati passati attraverso il template Pt in modo che nel nsPagina puntino alle pagine di cui trattano, ma se la pagina viene transclusa come è auspicabile per le pagine di sommario... magicamente i link punteranno ai capitoli corrispondenti della versione testuale!
Il bello di questo trucco è che può essere usato dovunque ci sia un sommario in versione proofread: in tal maniera anche il sommario in versione testuale potrà rispecchiare quello cartaceo.
Il brutto è che questo trucco non sembra proprio funzionare volendo transcludere le pagine nel nsIndice. - εΔω 10:27, 6 feb 2010 (CET)
Indice:Grammatica filosofica della lingua italiana.djvu
modificaHo cominciato a lavorare con questo libro Indice:Grammatica filosofica della lingua italiana.djvu, qualcuno può aiutarmi in questo? Shooke (Discussioni) 15:27, 5 mar 2010 (CET)
- Benvenuto... Ottima scelta... stai tranquillo, ti seguiremo... Il tempo è dalla nostra :D Xavier121 19:39, 5 mar 2010 (CET)
- Grazie Shooke (Discussioni) 22:42, 5 mar 2010 (CET)
Un'altra passata alle pagine sommario: <pagelist /> esperto
modificaCari amici,
per fortuna arrivano i nuovi utenti a svegliarci: grazie all'intervento di Utente:Shooke ho preso atto che nei nostri sommari potrebbero indicare molto meglio la numerazione delle pagine, e non ne abbiamo ancora approfittato. Leggendo qui è spiegato come mostrare nel sommario automatico i numeri romani, e come sincronizzare la numerazione delle pagine non in base a quella del file djvu, ma in base a quella del libro. Per chi non vuole leggere in inglese trascrivo qui gli esempi:
mostra solo un determinato intervallo di pagine:
<pagelist from=10 to=100 /> Applica uno stile a un intervallo di pagine: l'intervallo si specifica con "AtoB" e gli stili accettati sono : "roman" (numeri romani minuscoli), "highroman" (numeri romani maiuscoli), "empty" (trattino): <pagelist 1to10="roman" /> Si può assegnare una etichetta specifica a una singola pagina: <pagelist 11="prefazione" /> è possibile definire intervalli sovrapposti o modificare una singola pagina entro un intervallo: <pagelist 1to5="empty" 3to10="roman" /> Counteggio: se si pone un parametro numerico a un numero di pagina, fa ripartire il conteggio delle pagine: <pagelist 1to10="roman" 11=1 /> |
Fintantoché i nostri sommari sono ancora in numero umanamente trattabile propongo che ripassiamo tutti gli indici per perfezionare la numerazione degli indici. Ci vorrebbe un lavoro di squadra per fare in modo di non ottimizzare i tempi: io comincio dall'inizio della categoria. Chi mi dà una mano?
Si può copiare il seguente tag "frankenstein" e incollarlo per poi scolpirlo secondo le esigenze:
<pagelist from=10 to=100 1to10="roman/highroman/empty" 11="testo" 11=1 />
- Ho inserito malamente le tue scoperte qui: Aiuto:Come creare una pagina indice. Dacci un'occhiata, che lavorando tutti insieme su una pagina alla volta secondo me riusciamo a migliorare la documentazione. --Aubrey McFato 14:22, 7 mar 2010 (CET)
Cogliendo l'occasione di un sonetto "perso" di Vittorelli, senza Infotesto, ho ripescato su Opal una raccolta di opere che comprende anche il sonetto e l'ho ficcata in File:Rime (Vittorelli).pdf, creando anche il relativo Indice:Rime (Vittorelli).pdf. Ho già un decente OCR dell'intero libretto. Se qualcuno ne ha bisogno, potrei caricarlo in una pagina provvisoria tipo Rime (Vittorelli)/Sandbox.
Ne approfitto per:
- sperimentare l'uso di pdf "a doppia facciata" come immagine proofread (niente male);
- sperimentare soluzioni al fastidioso problema delle opere singole (pagine principali su ns0) che hanno però come fonte una raccolta. Il "trucco" utilizzato a suo tempo via redirect non mi convince; ipotizzo due strade:
- opera-raccolta in ns0, che collega testi indipendenti, ognuna pagina principale in ns0; in questo caso ogni testo indipendente deve possedere la sua {{Intestazione}} completa;
- opera-raccolta in ns0, che collega sottopagine che contengono le opere singole, in cui {{IncludiIntestazione}} è "truccato" per comportarsi come se la sottopagina fosse una pagina principale (grafica del box, generazione delle categorie). Un parametro aggiuntivo a IncludiIntestazione dovrebbe essere sufficiente.
In ambedue i casi si eviterebbe il "trucco redirect". --Alex brollo (disc.) 15:55, 24 mar 2010 (CET)
Problema paleo-proofread
modificaLa mia attenzione è stata attirata da un malfunzionamento di Indice:Poesie inedite di Silvio Pellico, corposa opera proofread impostata con immagini singole jpg. Il problema è il superamento dei template ammessi per una pagina. Quest'opera pone il problema della "modernizzazione" (via file unico djvu o pdf) dei primi Indici caricati su it.source. Ho avviato lo scaricamento dei due volumi da Gallica, dove per scaricare ho dovuto accettare l'uso "non commerciale" del file... :-( . Il bot dovrebbe essere in grado di ricomporre i due indici e di correggere la transclusione. Procedo? --Alex brollo (disc.) 14:14, 6 apr 2010 (CEST)
- Procedi. Magari anche con gli altri indici... (Edo sloggato) 14:38, 6 apr 2010 (CEST)
- OK. Pronti al via File:Poesie inedite di Silvio Pellico I.pdf e File:Poesie inedite di Silvio Pellico II.pdf con lo speciale tag Commons PD-GallicaScan che mi risolve il problema di cui sopra --Alex brollo (disc.) 15:20, 6 apr 2010 (CEST)
- Lanciato il "mostro" FineReader, carico le pagine ex novo, poi recuperiamo il recuperabile dal vecchio Indice... e infine grande pulizia. :-)
- Verrà fuori un lavoro "alla Zibaldone": due indici diversi che puntano sulla stessa opera testuale. No problem.
- Per ora vale la pena di lavorare sui grossi indici con immagini singole: chi ne ha la lista in mente me le indichi, grazie! --Alex brollo (disc.) 17:31, 6 apr 2010 (CEST)
- OK. Pronti al via File:Poesie inedite di Silvio Pellico I.pdf e File:Poesie inedite di Silvio Pellico II.pdf con lo speciale tag Commons PD-GallicaScan che mi risolve il problema di cui sopra --Alex brollo (disc.) 15:20, 6 apr 2010 (CEST)
Se te la senti potresti gradualmente compiere un'opera radicale di adeguamento: prendiamo tutti gli indici a opere multiimmagine e li adeguiamo a versioni djvu o pdf create con tali immagini...
Elenco
modifica- Indice:Cartesio Fatto
- Indice:De' matematici italiani anteriori all'invenzione della stampa
- Indice:Dalla Terra alla Luna Fatto
- Indice:Della congiura di Catilina Fatto
- Indice:Dialoghetti MCL 1831 Fatto
- Indice:Della Santità di Nostro Signore Fatto
- Indice:Gli antichi statuti municipali di Montevarchi
- Indice:Istituzioni di diritto romano
- Indice:Il Volapük: Critici e Abolitori
- Indice:Istorie dello Stato di Urbino
- Indice:Il Politecnico
- Indice:Prefazione alle Chiacchiere
- Indice:Ricerche sopra l'aritmetica degli antichi
- Indice:L'imperatore Diocleziano e la legge economica del mercato
- Indice:Le poesie di Catullo Fatto
- Indice:L'economia politica
- Indice:L'insegnamento politico-amministrativo
- Indice:La statistica e i suoi metodi
- Indice:Leonardo da Vinci scienziato
- Indice:Per li giocatori di pallone in Firenze l'estate dell'anno 1619
Parliamone. - εΔω 19:52, 6 apr 2010 (CEST)
- Ho preso un po' di mano nella conversione jpg->djvu, gli inizi sono stati faticosi. L'attuale stile (ricaricate le immagini) è: spostare lasciando un redirect il file Indice; spostare invece le pagine Pagina senza lasciare redirect (spostamento via bot con parametro -noredirect). Che ne dici Edo? --Alex brollo (disc.) 08:34, 24 apr 2010 (CEST)
- Leggo solo ora: Sì su tutta la linea. - εΔω 19:00, 10 mag 2010 (CEST)
- Ho preso un po' di mano nella conversione jpg->djvu, gli inizi sono stati faticosi. L'attuale stile (ricaricate le immagini) è: spostare lasciando un redirect il file Indice; spostare invece le pagine Pagina senza lasciare redirect (spostamento via bot con parametro -noredirect). Che ne dici Edo? --Alex brollo (disc.) 08:34, 24 apr 2010 (CEST)
Nuova impresa...
modificaCari amici,
come premesso eccomi con un tentativo di testo proofread bilingue: L'Inno a Roma di Pascoli da lui composto prima in latino e poi tradotto in italiano. Qui ne curo la versione italiana, e dall'altra parte quella latina. Temo che avrò bisogno di una manina di là, ma qui la transclusione sta funzionando! Se non riuscirò ad arrangiarmi chiederò lumi. - εΔω 20:26, 10 apr 2010 (CEST)
E se facessimo una versione testuale con testo latino a fronte, tutta nostra, mediante "transclusione affiancatrice"? Per prova, almeno, la vorrei vedere. L'accoppiamento mediante interlink è meglio che un calcio negli incisivi, ma non è mai perfetto.... qualche test preliminare in Biblioteca l'ho fatto.Ho guardato il codice e sono allibito. La prima transclusione interwiki! Suoniamo le campane!- Quanto prima occorre stabilire una serie di contatti diplomatici per creare un set minimo di special iw-templates con lo stesso nome e lo stesso effetto qui e là, ben riconoscibili (prefissati Iw_? boh? ) e fare in modo che restino "allineati". Dopodichè.... :-) --Alex brollo (disc.) 16:38, 13 apr 2010 (CEST)
- Beh, se intanto volessi farmi felice (sto provando a capirci qualcosa da solo, ma sono sicuro che tu ci metteresti un decimo del mio tempo) vorrei capire come riprodurre in lingua italiana (e conseguentemente anche latina) la scritta "its text comes from xx.wikisource" come in questo esempio da en.source. Per il momento lascio un messaggio su oldwikisource ma se fosse necessario non esiterei a copiare qui il javascript e personalizzarlo con le dovute traduzioni. - εΔω 22:03, 13 apr 2010 (CEST)
- Il messaggio origina da qui: http://wikisource.org/wiki/MediaWiki:InterWikiTransclusion.js
- ed il js viene caricato qui: http://en.wikisource.org/wiki/MediaWiki:Common.js
- nella sezione:
/*scripts imported from wikisource.org*/ importScriptURI('http://wikisource.org/w/index.php?title=MediaWiki:Base.js&action=raw&ctype=text/javascript'); importScriptURI('http://wikisource.org/w/index.php?title=MediaWiki:OCR.js&action=raw&ctype=text/javascript'); importScriptURI('http://wikisource.org/w/index.php?title=MediaWiki:InterWikiTransclusion.js&action=raw&ctype=text/javascript'); importScriptURI('http://wikisource.org/w/index.php?title=MediaWiki:Corrections.js&action=raw&ctype=text/javascript'); importScriptURI('http://wikisource.org/w/index.php?title=MediaWiki:IndexForm.js&action=raw&ctype=text/javascript'); importScriptURI('http://wikisource.org/w/index.php?title=MediaWiki:Dictionary.js&action=raw&ctype=text/javascript');
- Non so se è subbiciente ma è una buona partenza. --Alex brollo (disc.) 09:13, 14 apr 2010 (CEST)
Incredibile velocità di creazione di nuove pagine "a mano"
modificaHo creato a velocità "quasi-bot" alcune nuove pagine testuali da proofread de Canti (Sole) più che aaltro per riportare il conteggio pagine a 45000 che come numero mi piace ;-).
La tecnica (avendo un buon OCR... quello che vedete in I Siciliani non è stato ancora toccato da umano) è:
- si crea l'indice sulla pagina principale;
- si va a una pagina già preparata e si copia il codice;
- si segue il link rosso della successiva, ci si incolla il codice, si modifica il titolo, e si imposta pages index con la pagina seguente in from=, abbondando nel numero pagina to=;
- dall'anteprima si adocchia il numero della pagina finale; si corregge il to=; si salva il codice e si salva la pagina.
- si torna alla pagina principale, click su link rosso successivo, daccapo.
Facendoci un po' mano, una nuova pagina testuale è pronta in.... boh? cercasi record documentato da UltimeModifiche: tempo da battere, al momento, 1 minuto per pagina (ma ero lento), visto che ne ho create 3 in 3 minuti. --Alex brollo (disc.) 16:32, 13 apr 2010 (CEST)
Manoscritti
modificaI manoscritti, temo, sono "al limite del pubblicabile", qui su source; mi rendo conto che sfumano nei "contributi originali" non pubblicati, ed è una china che potrebbe portare a vari problemi.
Tuttavia vi chiedo se è possibile fissare una grossolana "griglia" di manoscritti pubblicabili, tenuto conto di epoca e notorietà dell'autore; messi alcuni limiti proporrei comunque che gli eventuali manoscritti da pubblicare fossero sottoposti alla discussione della comunità.
L'occasione di parlarne è costituita dal fatto inatteso che dispongo di un interessante manoscritto scieentifico-divulgativo, Indice:Flora medico-economica.djvu, datato 1844, di Leonardo Brumati, abate, poeta e botanico della "bisiacheria", il territorio di Monfalcone, autore già presente nella wikisource multilingue con alcuni componimenti poetici in "bisiac"; e quel che è più inusuale, dispongo anche della trascrizione pressochè completa, fatta da Vanni Aizza, un amico appassionato e competente in campo botanico, che non vedevo da tempo e che si è imbarcato nell'impresa di trascrizione senza minimamente conoscere l'esistenza di Wikisource; adesso che conosce il progetto, ha accettato di pubblicarlo qui, e spero che presto sia fra i nostri utenti.
Quindi,mi rivolgo alla comunità, per ora informalmente, magari Edo poi approfondirà: che ne dite? --Alex brollo (disc.) 16:35, 19 apr 2010 (CEST)
- In questo caso, secondo me non abbiamo problemi. Ovviamente, più i metadati sono corretti e più l'autore è importante, meglio è. Io stesso avevo pubblicato qualcosa che non era a stampa: Lettera ad Alessandro Melani. A proposito, se ti va passala al 101% ;-) --Aubrey McFato 17:47, 20 apr 2010 (CEST)
Inno a Roma: problemi
modificaCari amici,
ho terminato da poco la prima parte dell'inserimento del testo bilingue Inno a Roma (Pascoli), cioè Indice:Hymnus in Romam.djvu. Ovviamente se qualche anima candida volesse dargli un'occhiata non farebbe che grande piacere, ma questo non è il punto principale del mio intervento: ho bisogno di un paio di mani:
- Mi piacerebbe se un wikigrafico (quale io non sono) estraesse le molte e belle immagini che adornano il libro in maniera da poterle inserire dove occorre: sono in effetti un complemento indispensabile del libro.
- MI piacerebbe avere un feedback sulla modificabilità intersource delle pagine: funziona tutto? Manca qualcosa? Discutiamone.
- Infine vorrei rendere il più possibile la versione testuale simile a quella proofread, magari trovando una soluzione ai pasticci del tag poem... ma sistemiamo una cosa alla volta: a voi la parola. - εΔω 18:24, 19 apr 2010 (CEST)
- Io ho avuto una durissima delusione.... speravo che una volta transcluso il testo latino nella pagina Pagina, questa si potesse a sua volta transcludere; evidentemente il tool è "malmaturo". Peccato.
- Non capisco... come è giusto che sia la parte latina si transclude su la.source, quella italiana su it.source... dove sta il problema? - εΔω 19:17, 19 apr 2010 (CEST)
- E' che io immaginavo (volendo) di poter allestire una versione testuale con testo latino a fronte, transclusa da un altro progetto.... niente da fare, a meno di non lavorare sulla wikisource multilingue, dopo averci esportato ambedue i testi. Ma non badarci, è una mia vecchia fissazione; prima o poi ci saranno i mezzi tecnici e ne riparleremo. --Alex brollo (disc.) 23:40, 19 apr 2010 (CEST)
- Non capisco... come è giusto che sia la parte latina si transclude su la.source, quella italiana su it.source... dove sta il problema? - εΔω 19:17, 19 apr 2010 (CEST)
- Per la grafica vi sono un paio di cose che si possono fare facilmente, altre meno. Cominciamo da queste ultime.
- La grafica originale è dominata dal colore di fondo, e dai riguadri in accordo con tale colore. Le immagini, ma soprattutto i fregi, ottenuti nel colore originale e piazzati su fondo bianco temo diano un pessimo effetto.... Sarebbe essenziale, per ricordare la grafica originale, suddividere il testo in "quadri colorati e incorniciati". Ma mi pare una cosa un po' audace.
- Guarda, per il momento mi accontenterei di una cruda estrazione di immagini e basta. Quanto a bordi e colore di sfondo ci si può pensare per la versione testuale ma non lo vedo come obiettivo fondamentale. --εΔω 19:16, 19 apr 2010 (CEST)
- Procedo, ho bisogno di impratichirmi un po' con la gestione immagini. Il metodo più spiccio, da IA, è scaricare le immagini singole (in questo caso jpg), ritagliarle e via. Ma.... che faccio del colore di fondo? le rendo in toni di grigio, o le lascio con fondo leggermente colorato? --Alex brollo (disc.) 23:50, 19 apr 2010 (CEST)
- Guarda, per il momento mi accontenterei di una cruda estrazione di immagini e basta. Quanto a bordi e colore di sfondo ci si può pensare per la versione testuale ma non lo vedo come obiettivo fondamentale. --εΔω 19:16, 19 apr 2010 (CEST)
- Poem è, volendo, domato, ma con un artifizio che non risolve il problema alla radice. Occorre armarsi di coraggio e sperimentare l'applicazione di tutte le righe del codice css che fr.source dedica a poem. La mia vecchia ricerca indica che questa modifica è assolutamente necessaria. Il "trucco" che si può adottare qui ("tirare in alto" la div) si rivolterà contro chi lo usa non appena le cose verranno sistemate.
- Il brutto effetto dei titoli "mal centrati" si risolve in due modi:
- o si tirano i titoli dentro poem, e poi li si colloca per bene a mano;
- oppure si usa il nuovo parametro che ho introdotto (senza documentarlo ;-) ) nel tl Centrato, proprio per risolvere questo problema. --Alex brollo (disc.) 18:56, 19 apr 2010 (CEST)
- La seconda ;) - εΔω 19:16, 19 apr 2010 (CEST)
Immagini
modificaLe immagini sono caricate. Ne ho aggiunte un paio per prova. Buon lavoro... --Alex brollo (disc.) 01:46, 20 apr 2010 (CEST)
Centrato
modificaQuesto è l'effetto con l=18em dalla pag. 61:
dirà l’Italia? Il nome arcano è tempo
che si riveli, poi eh’ è il tempo sacro.
Risuoni il nome che nessun profano
sapea qual fosse, e solo nei misteri
segretamente s’inalzò tra gl’inni:
mentre sull’ombra attonita una strana
alba appariva, un miro sole, e i cavi
TL Capolettera
modificaHo importato da en.source l'ottimo tl|Capolettera, che fa un ottimo lavoro e soprattutto, selezionando il testo e copiaincollandolo su un file txt, restituisce la lettera testuale senza fare scherzi. Hai dato un'occhiata? Potremmo provarlo con i bellissimi capolettera di Hymnus... ma tocca portarlo anche "la"...--Alex brollo (disc.) 01:57, 20 apr 2010 (CEST)
Prova su strada su la.source
modificaIl testo latino vi dà un'idea di ciò a cui sto puntando: non siamo certo alla fine, ma si sta procedendo alacremente. - εΔω 15:55, 20 apr 2010 (CEST)
- Bellissimo! Grande Edo, sono curioso di vedre gli sviluppi. --Aubrey McFato 17:43, 20 apr 2010 (CEST)
- Ho ritoccato un paio di punti (ho "chiuso" il div di default, e ho aggiunto una nuova width alla tua prima div; adesso la grafica complessiva è molto più vicina a quella della pagina originale). Vedo che anche su la.source occorre mettere mano al css per sistemare poem!--Alex brollo (disc.) 08:07, 24 apr 2010 (CEST)
Statistiche proofread
modificaSottopoendo ThomasV a spietato interrogatorio, ho ricostruito il percorso dei dati con cui sono generati i grafici riassuntivi dell'attività proofread delle varie source, disponibili qui: http://toolserver.org/~thomasv/stats.html, come segnaato da Aubrey.
I dati sono generati giornalmente da bot e si ricavano dalla cronologia di questa pagina: http://wikisource.org/wiki/Template:ProofreadPage_Statistics
Ho scaricato l'intera cronologia, vediamo se dando i 4 Mby di dati in pasto a uno script ne ricavo l'estratto dell'andamento temporale numerico del nostro lavoro. Ma devo farlo senza trascurare il lavoro "vero", che in questo momento ha la seguente priorità: portare regolarmente alcune pagine Pagina da SAL 25-50% a SAL 75% ("proofread") e alcune altre pagine da SAL 75% a SAL 100% ("validated"). Penso che andrebbe raccomandato alla miriade di rilettori di non essere "timidi" e di cercare di saltare il passaggio SAL 50% riservandolo al suo significato originale (nell'ambito proofread): pagine "difficili" o "controverse". Il resto, una buona riletta e via al 75% senza tentennamenti. Cercherò di ricordarmene io per primo. --Alex brollo (disc.) 09:34, 28 apr 2010 (CEST)
Tag poem e transclusione
modificaFinalmente, possiamo usare il poem in transclusione senza avere la tentazione di sbattere la testa contro il muro. :-)
Niente più "trucchi", il tag poem va semplicemente posto in testa al primo verso, e in coda all'ultimo, e non ci sono (quasi) problemi. Unico problema un caso particolare, che mi ha dato da pensare: quando una serie continua di versi è spezzata su due pagine e la strofa deve avere un certo margine a sinistra (n spazi bianchi). In questo caso, sena scomodare l'opzione compact di poem, il problema si risolve "forzando", nel primo verso, gli spazi bianchi utilizzando un numero n di tag html . Ho utilizzato questo trucco, ad esempio, in Canti (Sole)/Ad un illustre ecclesiastico, nella strofa spezzata fra la pagina 156 e la pagina 157, e come vedete funziona. Invece, il problema (che lascio là perchè lo possiate vedere) è presente in Canti (Sole)/Pensieri poetici sulla eloquenza del foro penale, ad esempio nella lunga strofa fra le pagine 123 e 124.--Alex brollo (disc.) 00:13, 2 mag 2010 (CEST)
Bug capolettera/immagini
modificaSono impazzito per risolvere un bug generato da Pagina:Dieci lettere di Publio Virgilio Marone.djvu/8. Nella corrispondente pagina testuale, inspiegabilmente la transclusione mostrava un a capo fra pagina 8 e 9. Dopo una serie di furiosi tentativi, ho scoperto che questo dipendeva da due immagini della pagina, una con il parametro center (il fregio), la seconda con il parametro left (il capolettera).
Dopo parecchi tentativi, non ho trovato altro rimedio che eliminare entrambi i parametri dalle immagini: il primo, includendo l'immagine all'interno di un div class center; il secondo, utilizzando il nuovo Template:Capolettera, da usare comunque sempre perchè consente di "estrarre" un testo completo, continuo e senza difetti (provate; nella pagina 8 il copiaincolla della prima parola risulta, correttamente, "TUtto"). --Alex brollo (disc.) 00:46, 16 mag 2010 (CEST)
ePub, questo sconosciuto
modificaGrazie alle note di http://www.guidaebook.com/guida-epub/, segnalate da Accurimbono, ho constatato che la struttura ed il codice di un ePub book sono semplici e aperti (si fa per dire ovvio). Tutto puro testo, o immagini con formato normalissimo tipo jpg per le figure; e il testo è tutto XML, "human readable", ossia: decentemente semplice.
Provate a scaricare un ePub, io sto lavorando su Through the Looking-Glass di Carrol, poi rinominatelo come zip, apritelo con il vostro dezippatore e estraete tutto. Vi apparirà una cartella contenente due cartelle e alcuni file. Aprite la cartella OPS. Troverete una serie di file xml denominati chapter-001.xml, ecc. Apritene uno con firefox. Perfettamente leggibile, con tanto di figure. :-)
Insomma: per leggere un ePub non serve un lettore di ePub. :-) --Alex brollo (disc.) 11:41, 20 mag 2010 (CEST)
- L'obiettivo in lontananza è quello di trasformare un nostro libro proofread in un ePub. Non è affatto impossibile, "a mano" (basta estrarre il testo, ritoccarlo, riformattarlo per bene, e poi inviarlo a servizi online che lo trasformano in codice ePub). Ma non è questo l'obiettivo: l'obiettivo è l'automazione totale proprio di quei tre passetti (estrarre il testo, ritoccarlo, riformattarlo) che richiedono tempo umano.
- Intravedo due possibili strategie.
- ottenere, in via automatica, i passi 1-2-3, e poi fare manualmente il passo 4.
- ottenere in via automatica anche il passo 4.
Per fare i passi 1-2-3 a sua volta ci sono due possibili strategie.
- lavorare sul html prodotto da mediaWiki (ossia, sulla pagina come appare nel nostro browser). Promettente: non c'è più traccia di "orpelli", template, markup wiki, codici di transclusione ecc.; tutto sta lì sulla pagina, in puro codice html, dentro un box ben definito;
- lavorare sul codice wiki tal quale. Sembra pazzesco... ma forse non è una strada da abbandonare, perchè - visto che il problema è potare, potare, potare - forse è più facile potare prima che potare dopo che i nostri orpelli sono stati esplosi in un codice html complesso. Da questo punto di vista, la transclusione non offre affatto grandi problemi.
- Thinking in progress.... --Alex brollo (disc.) 11:57, 20 mag 2010 (CEST)
- Ottimo! Segnalo questa pagina con le specifiche ufficiali http://www.idpf.org/specs.htm --Accurimbono (disc) 12:14, 20 mag 2010 (CEST)
- Agli utenti Firefox segnalo EPUBReader, un'estensione per leggere gli ePub nel browser. --Accurimbono (disc) 14:48, 20 mag 2010 (CEST)
- Raccogliamo qui ancora un po' di dati e di indirizzi, poi penso che sarà aopportuno riorganizzare il tutto per bene in una sottopagina dedicata del progetto Trascrizioni (oppure potremmo riciclare la pagina Stamperia....). Ottimo complemento un'estensione firefox per leggere l'ePub, a me interessa particolarmente la possibilità di accesso diretto via firefox ai singoli file, ma mi interessa altrettanto un tool semplice che mi permetta di visualizzare agilmente il risultato finale complessivo. --Alex brollo (disc.) 15:31, 20 mag 2010 (CEST)
- EPUBreader è ottimo per visualizzare il risultato finale degli ePub (zippati e cucinati), per visualizzare i singoli xml bisogna unzippare e cliccare come dicevi tu prima.
- Segnalo anche il sistema di catalogazione online OPDS (http://code.google.com/p/openpub/) che stanno standardizzando in questo periodo e credo si diffonderà in breve tempo, utile per cercare nei cataloghi delle varie biblioteche online e visualizzare al vole il libro. (credo che sia utilizzato da FeedBook in EPUBreader) Probabilmente a noi non interessa al momento (abbiamo le categorie e i feed RSS alle categorie), ma è bene sapere che esiste. ;) --Accurimbono (disc) 17:03, 20 mag 2010 (CEST)
- Alex: ricicla la stamperia. - εΔω 18:31, 20 mag 2010 (CEST)
- Ok! Comincio a pensare al riciclaggio. Fra l'altro, bisognerà riformattare la pagina progetto ("sezionandola"). Vi segnalo un nuovo tool web - su suggerimento di FiloSottile, quindi assai autorevole e sicuramente sicuro: Dropbox. Crea una cartella sul web (gratis fino a 2 Gby) che "mirrorizza" una vostra cartella sul pc. Qualsiasi cosa mettiate nella cartella locale, verrà rispecchiata in quella web. Qualsiasi modifica facciate a file locali, verrà memorizzata nella cartella web. Dovunque voi siate, potete accedere. Potete condividere le cartelle con chi volete - specificando, una per una, chi può accedere. Ve lo dico perchè tutti i miei file "di studio" li metterò lì dentro. Chi vuole sbirciare, mi avvisi che lo abilito alle cartelle riservate (i "prodotti finali" saranno invece nella cartella pubblica). --Alex brollo (disc.) 20:18, 20 mag 2010 (CEST)
- Raccogliamo qui ancora un po' di dati e di indirizzi, poi penso che sarà aopportuno riorganizzare il tutto per bene in una sottopagina dedicata del progetto Trascrizioni (oppure potremmo riciclare la pagina Stamperia....). Ottimo complemento un'estensione firefox per leggere l'ePub, a me interessa particolarmente la possibilità di accesso diretto via firefox ai singoli file, ma mi interessa altrettanto un tool semplice che mi permetta di visualizzare agilmente il risultato finale complessivo. --Alex brollo (disc.) 15:31, 20 mag 2010 (CEST)
- Agli utenti Firefox segnalo EPUBReader, un'estensione per leggere gli ePub nel browser. --Accurimbono (disc) 14:48, 20 mag 2010 (CEST)
- Ottimo! Segnalo questa pagina con le specifiche ufficiali http://www.idpf.org/specs.htm --Accurimbono (disc) 12:14, 20 mag 2010 (CEST)
Progetto builder(): il punto
modificaHo concluso il primo abbozzo "grezzo" del mio personale progetto builder(). L'idea era di seminare un "segnale" (il minimo possibile) nelle pagine Pagina:, in corrispondenza dell'inizio dei capitoli, e poi lasciare che uno script facesse il resto: distinguere le pagine dove c'è bisogno di section, creare ex novo i capitoli in ns0, sistemare i dati necessari per le barre di navigazione, compilare correttamente il tag pages index. Così è stato. Per creare tutte le sottopagine di Rime (Vittorelli) io non sono affatto intervenuto, tranne la "semina dei segnali".
I "segnali" che ho seminato nel nsPagina sono i {{Ns0}}. I due parametri sono nome della sottopagina/capitolo e titolo della sottopagina/capitolo. Guardiamo, ad esempio, Pagina:Rime (Vittorelli).pdf/10. Io ho aggiunto a mano, subito prima del titolo del primo sonetto, {{Ns0|Sonetto 2|Monacandosi la Figlia del Senatore Marco Zorzi, Oratore eloquentissimo, eletto Provveditore a Cattaro.}}. Quindi intendevo creare, a suo tempo, la pagina Rime (Vittorelli)/Sonetto 2, il cui titolo (passato a IncludiIntestazione nel parametro sottotitolo=, era Monacandosi la Figlia del Senatore Marco Zorzi, Oratore eloquentissimo, eletto Provveditore a Cattaro.. Non ho aggiunto le section.
Tutto il resto l'ha fatto lo script.
Al momento, esiste una limitazione: il sistema è stato testato su una struttura di libro semplice (un solo livello di sezioni/capitoli). Inoltre vanno verificate una serie di condizioni anomale in cui il comportamento potrebbe sgarrare.... chi vuol darmi "casi su cui provare" mi fa un piacere. --Alex brollo (disc.) 17:57, 23 mag 2010 (CEST)
- L'accrocchio è stato utilizzato anche in Poesie (De Amicis) con successo. Sono stati evidenzati un paio di tips insidiosi, ne parleremo. La cosa simpatica è che tutti, o quasi, i tl|Ns0 sono stati inseriti correttamente da un utente abile ma nuuovo di source, a dimostrazione che il loro uso non è poi tanto astruso. --Alex brollo (disc.) 16:33, 31 mag 2010 (CEST)
- La strada è promettente; ho notato che ha anche una ricaduta importante, che consiste nel fatto di riunire tutti i dati in una sola versione dell'opera, anche nelle opere proofread. Attualmente, invece, per ricavare i dati occorre percorrere entrambe le versioni, perchè i dati sono "sparpagliati" nei ns Indice, Pagina e principale. Disporre di tutti i dati in una sola versione dell'opera, a naso, può rendere la vita meno difficile a futuri programmatori che vogliano affrontare il problema di trasformarla in un eBook. Al momento, tutti i dati necessari a rappresentare la struttura di ogni capitolo testuale sono elencati in una lista di elementi, ognuno fatto di 6 campi: nome del capitolo, titolo del capitolo, from, to, fromsection, tosection. Manca un ulteriore campo, che spero di aggiungere: un flag per la presenza/assenza di una Sezione note.
- La lista per ora è locale (sul pc dove corre lo script) ma sarebbe facile "esportarla" anche all'interno di una pagina standard (un buon candidato è la pagina [[Discussioni indice:]]. --79.50.10.238 17:48, 3 giu 2010 (CEST)
Djvutext.py
modificaNella vita del bottolatore curioso, vi è un lungo periodo in cui gli script più "cattivi" di pywikipedia sono del tutto inaccessibili; la documentazione (quelle poche righe...) risulta totalmente incomprensibile. Poi di colpo cedono. Ha ceduto djvutext.py. Sembra che faccia quello che promette: estrae, pagina per pagina, il testo di un file djvu e lo carica nella pagina Pagina giusta. :-)
L'elenco di prerequisiti è lunghetto. Sono i prerequisiti mancanti che fanno impazzire, soprattutto se non sono documentati. :-(
- ovviamente dovete avere un bot registrato (questo è ovvio).
- dovete avere DjvuLibre (collezione di script a riga di comando) in una cartella raggiungibile attraversoil path di sistema.
- dovete avere un file djvu completo di layer di testo. Es: quelli di Internet Archive.
- (penso) dovete avere un file Indice preparato per il caricamento delle pagine.
Adesso viene il difficile. NON provate a far correre lo script djvutext.py!!!! Vi scriverebbe tante belle pagine Progetto: invece che pagine Pagina:, perchè su it.source Pagina: corrisponde al ns 108 e invece dyvutext.py si aspetta che sia al ns 104. Quindi: fate una copia di djvutext.py, cercateci dentro la riga:
page_namespace = site.family.namespaces[104][site.lang]
e modificatela in:
page_namespace = site.family.namespaces[108][site.lang]
Oppure, più semplicemente, scaricate il codice dello script modificato qui
A questo punto avrete fatto tutto quello che ho fatto io... non resta che lanciare il bot, fornendogli i parametri che chiede. Io ci provo su Indice:Poesie (De Amicis).djvu ... pagine da 10 a 20. Speriamo bene. --Alex brollo (disc.) 16:17, 29 mag 2010 (CEST)
- Yes. Via tutte le pagine.... oppps... meno quelle già inserite da Edo, quasi dimenticavo. :-P :-) --Alex brollo (disc.) 16:38, 29 mag 2010 (CEST)
Di concerto con Xavier, è in corso un ulteriore esperimento: la costruzione dell'intero "scheletro" di un'opera proofread prima ancora di iniziare a introdurre il testo.
L'idea è di far trovare "tutto pronto" al trascrittore/rilettore, lasciandolo in pace a fare il suo lavoro, che poi è contemporaneamente la cosa più "semplice" e anche la cosa più del nostro lavoro qui (template, suddivisione in capitoli, sommari, categorizzazioni.... tutto è secondario al contributo umano di trascrizione e rilettura).
L'opera su cui sono in corso gli esperimenti è Indice:Versi sciolti dell'abate Carlo Innocenzio Frugoni.pdf. Ho riempito tutte la pagine di "nulla", ossia: nulla di visibile, ossia: dei commenti html <|-- qui il testo --> (possono essere lasciati lì o eliminati dopo aver introdotto un po' di testo) e dei template {{Ns0}}, che invece vanno rispettati rigorosamente.
Poi lancerò il bot, che:
- aggiungerà le section là dove servono;
- creerà la lista dei capitoli e dei riferimenti alle pagine e alle sezioni di ogni capitolo, e la memorizzerà da qualche parte;
- creerà il sommario per la pagina Indice e lo memorizzerà da qualche parte
- creerà l'indice per la pagina Principale e lo memorizzerà da qualche parte.
Lo script builder(), che fa queste cose, NON scrive nulla, ma solo predispone i dati per scrivere; può essere lanciato di nuovo dopo eventuali correzioni, e ripete il suo lavoro daccapo. E' un secondo script, del tutto indipendente e che viene lanciato in seguito, che crea le pagine e le riempie; quindi c'è tutto il tempo di aggiustare, rifinire, correggere, in modo assolutamente indipendente dal lavoro dei trascrittori/rilettori (basta che non vengano cancellati, o "rovinati", i tl Ns0 che sono il cuore del sistema.
Vediamo come va. --Alex brollo (disc.) 12:26, 9 giu 2010 (CEST)
- Lanciato builder(), tutto bene. In Discussioni indice:Versi sciolti dell'abate Carlo Innocenzio Frugoni.pdf, nascosto in un commento html, c'è lo schema attuale dell'opera, una riga per capitolo, con 6 valori per riga che nell'ordine sono:
- nome della sottopagina
- titolo della sottopagina
- pagina inizio (parametro from di pages index)
- pagina fine (parametro to di pages index)
- sezione inizio (parametro fromsection di pages index)
- sezione fine (parametro tosection di pages index)
Il programma "scrittore" leggerà questi dati; finchè il mostro non passa, i dati possono essere modificati a mano, rispettando però i caratteri | e gli acapo. --Alex brollo (disc.) 14:46, 9 giu 2010 (CEST)
- Rileggerò con calma, ci sono cose che mi sfuggono (preferisco affrontare altre "varietà" di complessità); ma una cosa è certa: rileggendo, o contibuendo in generale, ci si sente un po' "soli", e in caso di dubbio non c'è un posto preciso per discuterne. La mia proposta, molto più banale delle vostre, è di trasformare progressivamente la pagina di discussione principale di ogni opera in un "punto privilegiato di discussione", e,come sapete, il tag onlyinclude attorno all'infotesto impedisce che queste discussioni si "propaghino" mediante transclusione. Quindi concentrerei in questa pagina le discussioni specifiche per l'opera, magari richiamando l'attenzione, ogni tanto, sulla discussione in corso mediante un messaggino in bar generale. Quindi: il bar generale come punto per le discussioni generali, e come "bacheca" per avvisare di discussioni qua e là; i bar più specialistici per argomenti specifici; e la pagina discussione principale per le discussioni specifiche di un'opera. Altrimenti, passando di bar in bar, temo l'alcoolismo. --Alex brollo (disc.) 13:35, 12 giu 2010 (CEST)
Pagina principale:rilettura del mese
modificaCari amici,
proviamo a ragionare sulla sezione rilettura della pagina principale.
Non c'è una particolare urgenza ma penso che siano ormai opportune due mosse.
- scrivere un indice dei lavori già svolti
- creare una pagina di coordinamento per chi svolge tale collaborazione
La prima mossa permette di tener traccia delle varie riletture e quindi di sottoporne anticipatamente delle altre secondo un criterio di variazione continua, anche per evitare scelte troppo unilaterali o non conidivisibili.
La seconda mossa permette di affrontare lavori anche di più lungo termine o di più impegnativa rilettura/formattazione ecc. tramite un luogo dove porre domande o scrivere delle note di correzione come "Alla pag. x ho riletto tutto ma una parola in devanagari non la so decifrare" o "tra ultimo verso e titolo dell'ode successiva lascio due o tre caporiga?"... insomma, quello che avviene in una normale pagina di discussione, ma incentrato sulla rilettura del mese.
Che dite? Discutiamone. - εΔω 07:59, 11 giu 2010 (CEST)
- Il sistema più democratico che mi viene in mente è quello di sfruttare i progetti già esistenti, creando degli indici tematici (Bibbia, CantaStoria, Cristianesimo, Diritto, Duecento, Economia, Letteratura, Matematica, Open source, Teatro, Tesi, Testi scientifici) di testi da rileggere. Sono anche dodici (anche se molti si possono considerare sottoprogetti, vedi Letteratura - Ducento - Teatro), uno switch penserà ad alternare la rilettura del progetto del mese. Vista la scarsità di lavoro, la lista tematica potrebbe accogliere anche testi al 50% accettabili, penso a quelli estremamente lunghi. In un mese possono essere riletti più testi, quindi si può fare in modo che appena raggiunto sal 100% scatta il titolo del progetto successivo, oppure si continua, nell'arco del mese, con la lista progressiva tematica. Può anche accadere che non si riesce a rileggere nel tempo stabilito un testo molto lungo; anche qui due ipotesi: o chi ha iniziato la lettura se lo tiene nei preferiti e lo finisce oppure si dedica al testo successivo e aspetta il prossimo giro in cui verrà riproposto (12 mesi). Questo è un punto debole per il rilettore occasionale, non per noi o chi conosce i progetti wiki! Come vedete io esagero sempre, Edo pensa ad una pagina e relativa discussione, io a dodici! Io vedo le riletture sal 100% come i trofei da mettere nelle rispettive bacheche tematiche, tutte richiamate in pagina principale ecc. :D --Xavier121 10:14, 12 giu 2010 (CEST)
- Beh, quanto al concetto di "mese"... abbiamo visto che il buon senso al momento impone di concepirlo in forma elastica: se un testo è breve e raccoglie una frotta di rilettori può essere riletto in pochi giorni, se un testo è lungo e poco attraente può rimanere a disposizione anche più di un mese. Poi questa situazione potrebbe cambiare con l'aumento delle utenze attive, ma vediamo di mantenerci realisti.
- Anche per questo il concetto di "scarsità di lavoro" forse non l'ho capito. Dato che stiamo passando uno alla volta tutte le pagine indice SAL 75% (ad oggi 26) penso che per qualche mese potremo ancora puntare su di esse; tra l'altro non sono del tutto convinto che tutte tutte le pagine indice siano state categorizzate e quindi potrebbero esserci sorprese: nel frattempo abbiamo pagine indice SAL 50% che dovremmo rivedere —poche a dire il vero—. Quanto agli argomenti penso che un'alternanza di testi afferenti ai vari progetti possa essere proposta facilmente. Semmai adotterei una politica "in crescendo" per cui man mano che il concetto di rilettura collaborativa si innerva nel progetto possiamo passare da testi brevi e non impegnativi a testi più lunghi o con formattazioni più complesse.
- Una idea collaterale, che rispecchia in parte il concetto a noi estraneo di featured text dei cugini anglosassoni potrebbe essere la rilettura dei testi già riletti, vale a dire l'aggiornamento in termini di formattazione e il ricontrollo di eventuali piccolezze sfuggite al primo rilettore, per poter così certificare che più di un rilettore ha passato i testi... è così bislacco? - εΔω 12:33, 12 giu 2010 (CEST)
Nuntio vobis...
modifica... che le routine DjvuLibre stanno cedendo. Uno script python, stando in una directory dove c'è una serie ordinata di immagini jpg, chiama quelle routine DjvuLibre che servono per confezionare un file djvu unico dalle immagini jpg. Siccome un altro script python produce da un file pdf una serie di immagini jpg ordinate, a richiesta, tagliando pure a metà e "croppando" le pagine pdf, la sequenza dei due script permette di passare da un file pdf a un file djvu eventuale croppaggio e taglio compresi.
Avevo abbandonato le conversioni pdf->djvu, visto che i pdf possono essere caricati tali e quali su Commons.... ma quelli a doppia facciata di Opal meritano, probabilmente, la conversione. --Alex brollo (disc.) 17:01, 13 giu 2010 (CEST)
- Complimenti per il tuo lavoro e per le continue scoperte e miglioramenti che porti al progetto! --Accurimbono (disc) 10:17, 9 nov 2011 (CET)
Mi sono imbattuto in Canti di Castelvecchio. Molto tempo è passato, adesso su IA ci sono ben due copie Zanichelli 1905: l'opera impostata, non proofread, sono solo è incompleta, nella nostra versione source, ma alcun e poesie sono "apparenti", in quanto sono costituite dalla sola Intestazione. Una cosa da rimediare, direi: mi ci dedico un pochetto....--Alex brollo (disc.) 21:52, 17 giu 2010 (CEST)
- Grave lacuna, procedi pure che ti seguo... --Xavier121 22:00, 17 giu 2010 (CEST)
- L'opera proofread adesso esiste: Indice:Canti di Castelvecchio.djvu, ho eseguito la trascrizione inversa e caricato il discreto OCR da IA per le poesie mancanti. Avanti coi lavori! --Alex brollo (disc.) 17:35, 22 giu 2010 (CEST)
- L'esperienza è stata un pochino dura: si trattava di completare un'opera, facendo un po' di "trascrizione inversa" e un po' di "procedura proofread dall'inizio". Mi sono incastrato e alla fine ho fatto quasi tutto a mano. Adesso ci riprovo con un'opera simile: Pensieri e discorsi (incompleta) -> Indice:Pensieri e discorsi.djvu. Ma stavolta mi organizzo meglio.... cerco di organizzare una specie di "Match and split" fatto in casa (Match and Split è un'applicazione di ThomasV, intricata, terrorizzante, che consente di trasportare in nsPagina un'opera presente come versione testuale). Auguratemi un bel "in bocca al lupo", sento che sarà duretta. --Alex brollo (disc.) 17:20, 2 lug 2010 (CEST)
- L'opera proofread adesso esiste: Indice:Canti di Castelvecchio.djvu, ho eseguito la trascrizione inversa e caricato il discreto OCR da IA per le poesie mancanti. Avanti coi lavori! --Alex brollo (disc.) 17:35, 22 giu 2010 (CEST)
Piccola modifica Ns0
modificaHo eliminato del tutto ogni output del template Ns0 nel testo della pagina, adesso la sua "presenza nascosta" emerge da una categoria (visibile nella sola pagina Pagina: e non nella versione transclusa) Categoria:Pagine che usano Ns0.
Devo verificare il funzionamento del sistema in caso di opere con sezioni multilivello, e inoltre mi sto orientando a fare il lavoro di elaborazione offline, lasciando online solo la funzione di sezionamento automatico (ossia: verifica e inserimento dei tag section). --Alex brollo (disc.) 17:33, 22 giu 2010 (CEST)
- Perdonate la boldness, ma ritengo che questa storia del tl|Ns0 stia diventando molto importante. Apro una sottopagina dedicata nell'ambito del progetto Trascrizioni: Progetto:Trascrizioni/Ns0. Intanto butto dentro un po' di cose senza badare alla formattazione "formale", anche per ricordarmele io stesso... poi, se il seme germoglierà, sistemerò (con l'aiuto indispensabile di chi "ci sa fare" in queste cose!)--Alex brollo (disc.) 23:06, 24 lug 2010 (CEST)
Pagine di aiuto su siti
modificaDa una discussione al Bar generale, mi sono convinto che è necessario scrivere pagine di aiuto specifiche per ciascun "sito autorevole", a partire da Internet Archive. Il rischio che un utente non espertissimo imbocchi una falsa strada e poi sia estremamente frustrato dalla scoperta che "bastava fare questo e quello, e la cosa si risolveva in cinque minuti" è molto elevato.... e un utente fortemente frustrato è, con molta probabilità, un contributore perduto (e avrebbe pure ragione).
Per evitare i tecnicismi esasperati, penso che la cosa migliore sia accennare alle varie possibilità ma indicare sempre, punto per punto, l'utente esperto a cui appoggiarsi sia per suggerimenti che per aiuto concreto.
Ci provo: la prima pagina sarà Wikisource:Siti autorevoli/Internet archive. --Alex brollo (disc.) 17:26, 2 lug 2010 (CEST)
- Purtroppo, come per LiberLiber, quella che serve veramente, è una pagina semplice ma esauriente sull'incrocio delle leggi sul copyright tra Italia e USA: praticamente un'utopia. In compenso ho una buona notizia: potrei cominciare traducendo e adattando questa paginetta. - εΔω 18:07, 2 lug 2010 (CEST)
- Ok, sono d'accordo: il primo punto di questa ipotetica pagina di aiuto sarà "Siete dentro IA: adesso scegliete innanzitutto l'opera giusta" dove "giusta" significa libera da copyright, completa, con tutti i file che ci devono essere, con una buona qualità dei file, e anche "significativa", ma qui la cosa si fa difficile perchè entriamo nelle preferenze e nei gusti... ;-) --Alex brollo (disc.) 23:32, 2 lug 2010 (CEST)
OCR: test
modificaHo caricato Indice:Poemi (Byron).djvu (vecchio testo che mi tenevo in pc, mi spiaceva buttarlo!) e Indice:Ardigo - Scritti vari.djvu (opera importante non per i contenuti, di cui non so valutare il pregio, ma perchè è la "via it.source" di partecipare all'iniziativa di collaborazione fra BNF e fr.source). Su entrambe ho fatto correre FineReader, e gli script Alebot per il caricamento del txt prodotto nelle pagine Pagina (serata del 17.7.10).
Per la seconda opera, ho "saltato" alcune pagine (dalla 27 alla 32) e ho caricato il testo prodotto dall'OCR di ThomasV, che agisce automaticamente al momento della creazione di una pagina; successivamente ho sostituito il testo con quello prodotto da FineReader per l'opportuna comparazione. Da notare che FineReader non ha lavorato sul file djvu di Commons, ma sul pdf scaricato direttamente da BNF; quindi, il miglioramento della qualità riassume sia le differenze da diverse immagini sorgente che l'eventuale superiorità di un OCR settato sulla lingua italiana rispetto a un OCR "generale", oltre che la differenza fra i due engine dei software.
Sulle stesse pagine test (dalla 26) farò anche agire i due script js di "post-elaborazione OCR generale" (postOCR e acapo) e memorizzerò il testo risultante senza alcuna correzione manuale, in modo che la cronologia memorizzi le varie differenze e modifiche. --Alex brollo (disc.) 08:02, 18 lug 2010 (CEST)
Casi strani di impaginazione
modificaCari amici,
volevo riportarvi alcuni spunti di riflessione a seguito di alcune riletture:
- Pagina:La lettera di G. Boccaccio al Priore di S. Apostolo.pdf/3: carina l'idea di condensare la rilettura di due pagine in una, ma poniamo che qualcuno debba citare tale opera da altrove puntando a noi: come indicherà la pagina di destra? Sembra una piccolezza, ma mi sono convinto dell'opportunità di mantenere le scansioni per singole pagine piuttosto che per coppie di pagine.
- Indice:Il cavallarizzo.djvu come Indice:Le cereali.djvu ha un problema non indifferente: i numeri di pagina sono effettivamente numeri di pagina e non di facciata, vale a dire che le pagine di sinistra non hanno mai un numero, e dunque gli indici hanno una numerazione che non corrisponde a quella dell'originale cartaceo. Come ovviare a questo errore? - εΔω 23:09, 23 lug 2010 (CEST)
- Per il primo concordo, meglio scansionare una pagina per volta.
- Per il secondo punto, al fine di distinguere le facciate utilizzerei il numero di pagina seguito da "r" e "v", ad esempio per la prima facciata della pagina 150 la chiamerei 150r (recto), la seconda 150v (verso).
- Macchinoso, ma in questa maniera identifichiamo univocamente le singole facciate. --Accurimbono (disc) 14:08, 24 lug 2010 (CEST)
- In pratica mi hai letto nel pensiero... anche sulla macchinosità :-( - εΔω 16:06, 24 lug 2010 (CEST)
- La prova "pdf a doppia facciata" è stata fatta sull'onda dell'entusiasmo di poter usare i pdf di Opal (a doppia facciata) tal quali, e soprattutto: originali, invece di sottoporli a una serie di passaggi faticosi alla fine dei quali si sarebbe potuto perdere in risoluzione, e forse anche commettere qualche errore più serio. Certo che se il trucco suggerito dagli amici francesi (cioè caricare il pdf in Internet Archive) funziona, allora probabilmente si risolve anche questo problema... non mi ricordo djvu di IA a doppia facciata. Comunque, anche se non si può fare attraverso IA, prometto solennemente che io non lo farò più: lubrificherò i miei script estrattori, tagliatori e croppatori. --Alex brollo (disc.) 17:06, 24 lug 2010 (CEST)
- In pratica mi hai letto nel pensiero... anche sulla macchinosità :-( - εΔω 16:06, 24 lug 2010 (CEST)
- Per quanto sia affascinato dall'idea di riprodurre la condizione reale della lettura, con la doppia facciata, mi sembra di capire che non sia una pratica accettata generalmente. A me e Alex, prima dei miei recenti sviluppi in materia di software, era sembrata lo soluzione ottimale per ovviare al criterio di scansione della OPAL (per il buon Ruggeri la scansione doppia facciata è una necessità, essendo l'unico folle bibliotecario d'Italia che, letteralmente da solo, mette in rete un patrimonio inestimabile... La sua biblioteca conta oltre 200.000 volumi, ne è riuscito a fare quasi 8000!) Ho preso una versione integrale di Adobe Acrobat che mi permettere di lavorare in modo completo sui PDF di OPAL: bastano poche operazioni e riesco ad ottenere PDF pagina singola con una compressione molto vicina alle dimensioni di un djvu, ma con una qualità di immagine altissima, vedere il recente Dialogo della salute. Proprio oggi vedevo il risultato del mio caricamento su IA per sperimentare la loro conversione djvu, su suggerimento di Alex (non so quanti di voi abbiano provato): sotto molti aspetti il risultato è eccellente e per testi particolarmente nitidi alla fonte forse anche consigliato, ma la compressione djvu in generale non è il massimo per un rilettore, spariscono i toni di grigio e aumentano gli errori di comprensione dei grafemi. Insomma a me piace trovarmi in fase di rilettura di fronte al testo più nitido possibile, 1)perché devo accingermi ad un lavoro che proverà la mia attenzione; 2) perché non posso essere distratto da problemi di qualità, quando ci sono scritti particolarmente impegnativi. Io sono a favore della qualità e penso che dovremmo salvaguardare l'immagine all'interno dei confini dei 100 MB stabiliti da Commons anche a costo dello spezzettamento... Dico la mia fesseria: ma perché non possiamo caricare il file sia su IA che Commons, tenendoci del primo l'OCR e i metadati e del secondo l'alta qualità dell'immagine? Pienamente d'accordo su recto e verso, l'alternativa sarebbe offrire un'impaginazione con numero progressivo wikisource molto POV (ma non rientrerebbe nei casi di libertà riconosciuta al trascrittore, più o meno come facciamo con i tituli?) --Xavier121 17:44, 24 lug 2010 (CEST)
- Xavier, dacci le coordinate per trovare il tuo upload su IA! Non lo trovo! Sono patologicamente impaziente (bella forza: sono un patologo, mi riesce facile). --Alex brollo (disc.) 19:01, 24 lug 2010 (CEST)
- La prova qui, basta scrivere anacarsi, confrontatelo con l'originale su Opal o col pdf di IA --Xavier121 19:04, 24 lug 2010 (CEST)
- Bello, ma particolarmente poco "tipico" per valutare la resa dell'OCR di IA. Hai provato a suggerire a Ruggeri il caricamento dei suoi pdf in IA per ottenerne, in cambio, i "file derivati"? Se io fossi in lui lo farei! Un problema odioso: fra i file derivati tempo fa c'era la collezione dei tiff, adesso al loro posto ci sono dei jp2 che sono difficilissimi da gestire. Soluzioni? Dopo un'intera serata persa, io mi sono ridotto a ripescare i miei script di conversione ottenendo la serie delle immagini jpg dal pdf... --Alex brollo (disc.) 16:31, 9 ago 2010 (CEST)
- Non saprebbe che farsene! :) --Xavier121 22:20, 12 ago 2010 (CEST)
Richiesta di feedback
modificaIn queste settimane ho fatto lunghe galoppate solitarie.... Indice:Ardigo - Scritti vari.djvu è stato il mio "test sul campo" per rifinire varie cosette, adesso però mi piacerebbe sentire il vostro parere. So che è faticoso! Ma...
- la questione generale del template Ns0. Come la vedete?
- Mi piace! - εΔω 18:27, 9 ago 2010 (CEST)
- le iconcine con il back-link generate dal Ns0. Vanno bene? le cambiamo? passiamo a un link del tutto diverso, tipo AltraVersione o magari qualcosa di simile al link creato dal tl|Pagina?
- Per il momento possono andare bene. Magari si può scegliere un'altra icona più "allusiva" ma questa in uso non è particolarmente estranea. Ci piaccia o meno è meglio qualcosa di "invadente" ma funzionante che qualcosa di perfetto ma irraggiungibile (come nel template "altraversione") - εΔω 18:27, 9 ago 2010 (CEST)
- Benissimo! D'altronde sarà facile, volendo, cambiare la visualizzazione del link... basta cambiare il codice del template: di un solo template. --Alex brollo (disc.) 22:04, 9 ago 2010 (CEST)
- Per il momento possono andare bene. Magari si può scegliere un'altra icona più "allusiva" ma questa in uso non è particolarmente estranea. Ci piaccia o meno è meglio qualcosa di "invadente" ma funzionante che qualcosa di perfetto ma irraggiungibile (come nel template "altraversione") - εΔω 18:27, 9 ago 2010 (CEST)
- la questione della generazione automatica dei tag section via js (tutta da dissodare). Vale la pena di faticarci un po'?
- In attesa di rilettori sì. - εΔω 18:27, 9 ago 2010 (CEST)
- la questione dei titoli dei capitoli. Mi sono accorto che c'è l'uso di NON includerli come parte del testo, ma di "passarli" solo ai template che generano il box di intestazione. Io vorrei parlarne, perchè al momento i template che generano il box rientrano fra quelli "Escludi dalla stampa".... c'è qualcosa che non va.
- Scusa ma non ho capito a cosa tu ti riferisca... - εΔω 18:27, 9 ago 2010 (CEST)
- Guarda una vecchia opera dei tempi d'oro: Poi che voi et io piú volte abbiam provato: vedi? Il titolo del sonetto NON fa parte del testo, c'è solo nel box intestazione... Guarda invece Intecta fronde quies: il titolo è ripetuto due volte, nel box intestazione e nel testo. Nel primo caso, la trasformazione in eBook, per esempio, sarebbe problematica.... nel secondo, corre via liscia. --Alex brollo (disc.) 22:04, 9 ago 2010 (CEST)
- Scusa ma non ho capito a cosa tu ti riferisca... - εΔω 18:27, 9 ago 2010 (CEST)
- la questione della generazione di "cose tipo tabella" mediante tag div. E' molto tecnica, ma da affrontare senza paura: tanto tutto viene seppellito nel codice dei template. Ma meglio parlarne comunque. Vedi Template:RigaIndice.
- Oops, ho già raggiunto il data overflow...cedo la palla - εΔω 18:27, 9 ago 2010 (CEST)
- Sei già stato eroico, grazie. Sentiamo qualche appassionato di html moderno... Intanto vado avanti nell'uso sperimentale di {{RigaIndice}} sull'indice a partire da Pagina:Ardigo - Scritti vari.djvu/305. --Alex brollo (disc.) 22:04, 9 ago 2010 (CEST)
- Oops, ho già raggiunto il data overflow...cedo la palla - εΔω 18:27, 9 ago 2010 (CEST)
- la questione della generazione di "file derivati (djvu, testo via OCR, ecc) mediante caricamento di PDF in Internet Archive. Eccellente! Grazie Nemo! Vedi lussuoso test in fr:Livre:Cavendish - L’Art de dresser les chevaux, 1737.djvu. Un "caricamento di contraccambio" che it.source ha fatto a fr.source per il regalo costituito da File:Ardigo - Scritti vari.djvu. E non è, e non sarà, il solo!
- La questione del template e del namespace Creator su Commons. --Alex brollo (disc.) 16:20, 9 ago 2010 (CEST)
Aggiustamento tag pagelist
modificaCari amici,
vi annuncio con gioia che ho terminato la revisione di tutti i <pagelist /> delle pagine indice presenti nel progetto. Partito il 7 marzo ne ho approfittato per saggiare la coerenza dei file djvu o pdf a cui le nostre trascrizioni si appoggiano, e ho riscontrato diverse sorprese e problematiche.
Nei prossimi giorni le elencherò qui sotto, in modo che forse si possa tentare di rimediarvi con scansioni migliori. Intanto però festeggiamo! - εΔω 18:40, 9 ago 2010 (CEST)
- Sarò sincero: all'inizio avevo giudicato questo lavoro una sottigliezza inutile, un "perfezionismo". Mi sbagliavo di grosso. Bravo Edo! D'ora in poi l'allineamento sarà una mia cura immediata.
- Ti dò una buona notizia: so come estrarre, via bot, l'accoppiamento fra pagina djvu e "nome della pagina" come generato da pagelist. In altri termini: in tutte le occasioni in cui nel testo c'è un riferimento alla pagina del libro, si potrà fare in modo di linkare automaticamente il numero pagina "sulla carta e nel testo" con il numero di pagina del file djvu. Ma.... solo se si allineato perfettamente l'indice, come hai fatto tu! Altrimenti, niente! --Alex brollo (disc.) 21:16, 9 ago 2010 (CEST)
Note dolenti
modificaCome promesso ecco l'elenco dei problemi riscontrati. Tralasciando i casi di pagine bianche mancanti e indici ancora legati a file non djvu/pdf, abbiamo le seguenti rogne:
- In Indice:Cinesi, scuola e matematica.pdf inspiegabilmente dopo p. 106 la numerazione riparte da 101.
- In Indice:Istituzioni di diritto romano.djvu il volume è incompleto.
- In Indice:Ricerche sopra l'aritmetica degli antichi.djvu mancano le pagine 10 e 11
- Mannaggia la pupazza... Appena torno a casa scansiono le scansiono, mi sarò dimenticato. Se te le mando, Alex, in jpeg, tu riesci a inserirle nel djvu? Aubrey McFato 14:26, 13 ago 2010 (CEST)
- Certo, no problem.... tranne un po' di lavoro per riallineare la transclusione. Certo, se ci fossero i template Ns0, il riallineamento sarebbe fattibile via bot. ;-) --Alex brollo (disc.) 15:52, 13 ago 2010 (CEST)
- Mannaggia la pupazza... Appena torno a casa scansiono le scansiono, mi sarò dimenticato. Se te le mando, Alex, in jpeg, tu riesci a inserirle nel djvu? Aubrey McFato 14:26, 13 ago 2010 (CEST)
È il caso di provare a contattare chi ha creato i file per vedere se si riesce a riparare tali guasti. - εΔω 18:27, 11 ago 2010 (CEST)
- Tante note dolenti formano insieme una ben triste canzone... :-(
- Proposta operativa: eccezionalmente propongo a chi si occuperà del restauro di usare immediatamente il {{WIP}}. --Alex brollo (disc.) 10:40, 12 ago 2010 (CEST)
Note che non dolgono più
modificaSposto qui sotto le cose fatte, altrimenti si perde il colpo d'occhio.
In Indice:L'acarne.djvu mancano due facciate (128 verso e 129 recto)FattoPagine mancanti anche nella scansione originale Opal: segnalato al curatore di Torino, Claudio Ruggeri.--Xavier 121 15:05, 14 ago 2010 (CEST)
Fatto Caricata nuova versione completa su OPAL
In Indice:Regola di S. Agostino per le monache di Santa Caterina della rosa.djvu mancano le pagine 7, 8, 9 e 10FattoPagine mancanti anche nella scansione originale Opal: segnalato al curatore di Torino, Claudio Ruggeri.--Xavier121 15:05, 14 ago 2010 (CEST)
Fatto Pagine mancanti anche nell'originale, da mantenere per la rarità dell'edizione
In Indice:Macbeth.djvu: mancano le pagine 28 e 29 FattoPagine mancanti anche nella scansione originale Opal: segnalato al curatore di Torino, Claudio Ruggeri.--Xavier121 15:05, 14 ago 2010 (CEST)
Fatto Caricata versione completa su OPAL
In Indice:Odi e inni.djvu: mancano le pagine 154 e 155- Le due pagine mancano dalla fonte (Internet Archive) --Alex brollo (disc.) 16:32, 15 ago 2010 (CEST)--Xavier121 15:14, 14 ago 2010 (CEST)
In Indice:Amleto (Rusconi).djvu mancano le pagine 53 e 54Fatto (aggiunte pagine vuote)Pagine mancanti anche nella scansione originale Opal: segnalato al curatore di Torino, Claudio Ruggeri.--Xavier121 15:05, 14 ago 2010 (CEST)
Fatto Caricata versione completa su OPAL --Xavier121 12:50, 24 ago 2010 (CEST)
In Indice:Medea.djvu: manca la facciata 188 verso (l'opera resta comunque SAL 100%?)- La facciata 188 verso è presente nella scansione originale Opal. Da rifare la trasformazione in djvu o pdf compresso alta qualità. --Xavier121 15:05, 14 ago 2010 (CEST)
Fatto, se qualcuno passa a SAL 100% la pagina 2 siamo a posto --Alex brollo (disc.) 23:09, 14 ago 2010 (CEST)Fatto
- La facciata 188 verso è presente nella scansione originale Opal. Da rifare la trasformazione in djvu o pdf compresso alta qualità. --Xavier121 15:05, 14 ago 2010 (CEST)
In Indice:Rime (Vittorelli).pdf le doppie facciate sono da croppareFattoIn Indice:Saggio di rime.djvu la scansione presenta in fondo al libro molti doppioni, l'ordine delle pagine si presenta infatti così: pp. 49-50-49-50-51-52-51-52-53-54-53-54-55-56-55-56. Il djvu andrebbe regolarizzato prima di procedere alla trascrizione inversa.Fatto- fatto Candalùa (disc.) 20:01, 12 ago 2010 (CEST)
Indice:Il cavalerizzo resta in attesa di passare a indice:Il cavalerizzo.djvu, dopodiché vedasi quanto scritto rispetto agli Elementi di Euclide.FattoIn Indice:Elementi.djvu 456 facciate sono da descrivere come pagine recto e verso': se per una sessantina di pagine impiegavo una mezzoretta questo tipo di lavoro richiede una mezza giornata. Per il momento resta tra le cose da fare.- aspetta... ma tu scrivevi i numeri a mano?? naaaah... io li ho generati in pochi minuti con un po' di bash scripting! ;-) c'è però un salto tra il 120 e il 125, non sapevo bene come indicarlo. Candalùa (disc.) 19:50, 12 ago 2010 (CEST)
- Sì, a mano... con un editor di testo, un po' di copiaincolla e un sacco di manualità: sono proprio toccato. Peraltro fino a qualche anno fa per me bash era solo un'onomatopea da fumetto... e quando mi parlano di linea di comando... lo è tuttora XD. - εΔω 11:35, 13 ago 2010 (CEST)
- Io in questi casi uso anche il vecchio Excel: es. il pagelist di Indice:Il cavalerizzo.djvu, abbastanza spinoso l'ho generato così (Edo, dai una controllata please!) . Ho guardato Elementi, il djvu secondo me va rifatto croppando le pagine (croppare=eliminare i margini bianchi; splittare= separare le facciate; OPAL richiede un "crop & split" ;-) ). --Alex brollo (disc.) 12:44, 13 ago 2010 (CEST)
- Riguardavo gli Elementi e, si, un bel crop ci starebbe tutto, non si reisce a leggere assolutamente nulla. Ma per me priorità bassa, ci sono altre cose da fare prima. Aubrey McFato 14:26, 13 ago 2010 (CEST)
- Io l'ho fatto lo stesso :-) --Alex brollo (disc.) 21:57, 14 ago 2010 (CEST)
- Riguardavo gli Elementi e, si, un bel crop ci starebbe tutto, non si reisce a leggere assolutamente nulla. Ma per me priorità bassa, ci sono altre cose da fare prima. Aubrey McFato 14:26, 13 ago 2010 (CEST)
- Io in questi casi uso anche il vecchio Excel: es. il pagelist di Indice:Il cavalerizzo.djvu, abbastanza spinoso l'ho generato così (Edo, dai una controllata please!) . Ho guardato Elementi, il djvu secondo me va rifatto croppando le pagine (croppare=eliminare i margini bianchi; splittare= separare le facciate; OPAL richiede un "crop & split" ;-) ). --Alex brollo (disc.) 12:44, 13 ago 2010 (CEST)
- Sì, a mano... con un editor di testo, un po' di copiaincolla e un sacco di manualità: sono proprio toccato. Peraltro fino a qualche anno fa per me bash era solo un'onomatopea da fumetto... e quando mi parlano di linea di comando... lo è tuttora XD. - εΔω 11:35, 13 ago 2010 (CEST)
- aspetta... ma tu scrivevi i numeri a mano?? naaaah... io li ho generati in pochi minuti con un po' di bash scripting! ;-) c'è però un salto tra il 120 e il 125, non sapevo bene come indicarlo. Candalùa (disc.) 19:50, 12 ago 2010 (CEST)
In Indice:Il Volapük - Critici e Abolitori.djvu da Pagina:Il Volapük - Critici e Abolitori.djvu/44 la qualità delle immagini diventa inaccettabilmente bassa.Fatto- le pagine "brutte" erano le 44-45, che si vedevano male perché le immagini originali erano di dimensioni più piccole rispetto alle altre pagine. Le ho ingrandite e sostituite nel djvu. Non è ancora un granché, ma mi pare che vada già un po' meglio. Candalùa (disc.) 20:25, 11 ago 2010 (CEST)
In Indice:Meditazioni storiche.djvu: Pagina:Meditazioni storiche.djvu/177 e 178 sono due "scansioni abortite" incuneatesi a turbare la numerazione, si potrebbero togliere.FattoIn Indice:Versi sciolti dell'abate Carlo Innocenzio Frugoni.pdf le doppie facciate sono da croppare.- Trasformazione in corso. --Xavier121 15:05, 14 ago 2010 (CEST) Fatto
In Indice:La lettera di G. Boccaccio al Priore di S. Apostolo.pdf le doppie facciate sono da croppare.- Trasformazione in corso. --Xavier121 15:05, 14 ago 2010 (CEST) Fatto
In Indice:Vita di Dante, Petrarca e Boccaccio.djvu mancano le pagine 124 e 125.- Mancano anche nell'originale Google. Segnalato il problema a Google (in un altro caso hanno risolto rapidamente) --Alex brollo (disc.) 07:44, 15 ago 2010 (CEST)
- Mancavano altre 2 pagine (110 e 111). Tamponato con l'aggiunta di "pagine mancanti". --Alex brollo (disc.) 12:44, 18 ago 2010 (CEST)
- Mancano anche nell'originale Google. Segnalato il problema a Google (in un altro caso hanno risolto rapidamente) --Alex brollo (disc.) 07:44, 15 ago 2010 (CEST)
In Indice:Poesie (Carducci).djvu: mancano le pagine 110 e 111- Le due pagine mancano dalla fonte (Internet Archive) --Alex brollo (disc.) 16:32, 15 ago 2010 (CEST)
- Fatto Ma è stata dura (ho approfittato per sistemare un altro paio di cosette) --Alex brollo (disc.) 19:32, 19 ago 2010 (CEST)
- Adesso è veramente fatto.... ma allineare i testi delle pagine già caricate è stato massacrante. Finito! --Alex brollo (disc.) 01:15, 20 ago 2010 (CEST)
- Le due pagine mancano dalla fonte (Internet Archive) --Alex brollo (disc.) 16:32, 15 ago 2010 (CEST)
Pagine mancanti
modificaIn parecchi casi, passati al "vaglio di Edo", file scansionati si sono rivelati incompleti. Che fare? Io proporrei di intercalare pagine "vuote" nel file djvu, contenenti un chiaro messaggio per specificare che quella determinata pagina manca. In tal modo ci sarebbe il posto per introdurre in futuro, se possibile, l'immagine mancante, senza devastare l'organizzazione del libro e dei file derivati. --Alex brollo (disc.) 16:41, 15 ago 2010 (CEST)
- Caso vuole che HelderGeovane, di pt.source, mi abbia chiesto di inserire una pagina dimenticata in un libro che aveva scannerizzato... un djvu "nuovo", di quelli che devono essere trattati con DjvuLibre. In breve, ho dovuto studiare e adesso sono in grado di fare qualcosina anche con djvuLibre oltre che con il vecchio DjvuSolo. Questo rende possibile modificare i file djvu di IA. Che facciamo, le aggiungiamo, queste "pagine mancanti", come dicevo sopra? --Alex brollo (disc.) 22:35, 15 ago 2010 (CEST)
Mi sembra un'ottima idea. Aggiungiamole! Candalùa (disc.) 22:43, 15 ago 2010 (CEST)
- Aspetto un altro paio di ok... e qualche suggerimento su cosa scrivere, esattamente, e se è il caso di aggiungere un simbolo grafico. Io userei una pagina/immagine standard, usando invece il testo della pagina (noinclude) per "personalizzare" il messaggio. --Alex brollo (disc.) 06:18, 16 ago 2010 (CEST)
- Qualcosa del tipo "Se possiedi una copia di questo testo considera l'idea di inviarci le scansioni di queste pagine" ;-) - εΔω 19:42, 16 ago 2010 (CEST)
- Ok, intanto che finite di sghignaAutore:Cristoforo Landinozzare per la figuraccia che ho rimediato, ;-) preparo un paio di "ipotesi di pagina di riempimento". Poi le faccio apparire qui, e voi mi dite....--Alex brollo (disc.) 20:17, 16 ago 2010 (CEST)
- Carino! Io toglierei il testo per rendere l'immagine più utilizzabile a livello internazionale (ovviamente il file andrà su commons): anche perché penso che l'immagine andrà inserita in un template, giusto? - εΔω 21:29, 16 ago 2010 (CEST)
- Ok, intanto che finite di sghignaAutore:Cristoforo Landinozzare per la figuraccia che ho rimediato, ;-) preparo un paio di "ipotesi di pagina di riempimento". Poi le faccio apparire qui, e voi mi dite....--Alex brollo (disc.) 20:17, 16 ago 2010 (CEST)
- Qualcosa del tipo "Se possiedi una copia di questo testo considera l'idea di inviarci le scansioni di queste pagine" ;-) - εΔω 19:42, 16 ago 2010 (CEST)
- Ovvio, nel file djvu l'immagine verrà caricata come una "pagina". Poi, nella nostra trascrizione proofread, possiamo usarla, o sostituirla da un testo... Ci penseremo poi. OK, via il testo. --Alex brollo (disc.) 21:38, 16 ago 2010 (CEST)
- Ho provato a "pasticciare" un po' su Indice:Vita di Dante, Petrarca e Boccaccio.djvu, dove mancano 4 pagine. Ho creato (ma già lo sapete) {{PaginaMancante}} da apporre come testo in queste pagine. Adesso la numerazione delle pagine "fila via liscia", e il giorno che queste pagine riemergeranno, basterà infilarle al loro posto e tutto funzionerà per vene senza spostamenti di pagina o cambiamenti nei link e nei tag vari di collegamento. Almeno spero. Attenzione che c'è il solito ritardo nell'aggiornamento delle pagine che vengono visualizzate; la pagina "vera" appaiata al testo, finchè la cache non si sistema, la si vede in modifica. --Alex brollo (disc.) 23:06, 16 ago 2010 (CEST)
Landino e la Commedia
modificaApprofitto del mese di agosto per parlarvi di un testo ambizioso e molto stimolante per il nostro progetto. Si tratta del Comento di Christophoro Landino fiorentino sopra la Comedia di Danthe Alighieri poeta fiorentino di Cristoforo Landino, di cui vedete riprodotta una pagina dell'edizione del 1490 circa (un incunabolo di prestigio!). L'edizione della OPAL mutila degli ultimi tre canti del Paradiso può essere integrata con quella della Biblioteca di Monaco BSB in perfetto stato di conservazione. Oltre i capilettera e i disegni, le difficoltà del testo sono rappresentate dalla sua impaginazione e dalle convenzioni tipografiche. Mi farebbe piacere un vostro commento ed eventuali suggerimenti su come procedere, dal suo caricamento su Commons fino allo scioglimento dell'ultimo titulus. --Xavier121 13:01, 19 ago 2010 (CEST)
- Onestamente? Sono ancora scottato dallo stato di abbandono in cui versano il dizionario della Crusca, gli Elementi di Euclide e altri giganti di questo genere. La mia idea è che, in attesa di una maggior proliferazione di utenze che possa dare a questi mastodonti una maggior speranza di termine, ci concentriamo sull'ottimizzazione del preesistente (trascrizioni inverse, riletture) e sulla revisione di pagine d'aiuto e introduzione ai niubbi. Ne approfitto per rilanciarti Le tesmoforiazuse, Gli uccelli, La pace, Gli acarnesi, Le nuvole, Il Pluto... - εΔω 19:32, 19 ago 2010 (CEST)
- Concordo con Edo ma pure discordo. ;-) Il mio modo di pensare è di straordinaria coerenza.
- Concordo nell'opportunità di soprassedere alla creazione della pagina Indice. Mi secca vedere Indici abbandonati. La politica di fr.source è diversa, ma loro sono centinaia di gatti, noi quattro.
- Discordo nell'opportunità di soprassedere del tutto: il il libro lo caricherei prontamente su Commons, e comincierei a ragionare sui tool e le convenzioni necessari per affrontare il mattone. A colpo d'occhio:
- Ancora rimpiango di non aver lavorato diversamente su Il cavallarizzo, adesso farei una versione proofread quasi completamente diplomatica (carattere per carattere, riservandomi solo di modificare il tipo di caratteri: es. sostituirei ancora i ſ con s, le u con v, gli eventuali ß con ss, e forse i & con et, ma nulla più) usando con pazienza {{pt}} per le conversioni diplomatiche più spinte (indubitabili errori tipografici, scioglimento dei tituli).
Dobbiamo preparare un template per le note "fuori pagina a destra".--Alex brollo (disc.) 19:48, 19 ago 2010 (CEST) Fatto Xavier121 00:43, 20 ago 2010 (CEST)
Si potrebbe rimodellare il template:cassetto?--Xavier121 21:07, 19 ago 2010 (CEST)
- Su fr.source esistono i template fr:Modèle:Note latérale droite e fr:Modèle:Note latérale gauche, argomento intricato ma affrontabile con un po' di pazienza.... Il template cassetto, con il suo js di accompagnamento, potendo lo lascerei dove sta, ma spiegati meglio! --Alex brollo (disc.) 22:52, 19 ago 2010 (CEST)
- Concordo con OM nel constatare che ci sono molte trascrizione "orfane", per colpa di tutti e di nessuno, nel senso che il progetto è di volontari e quindi quello che c'è è tutto di guadagnato. Però non credo che il problema si risolva bloccando il lavoro di predisposizione alla trascrizione (preparazione e caricamento su commons del djvu/pdf,inizializzazione della pagina Indice: e dell'indice solo testo) di ulteriori testi, in fondo un motto dei progetti wikimedia è "Be bold", quanto piuttosto incentivare il lavoro comunitario.
- Mi riferisco all'ottimo riquadro in prima pagina "Collabora con noi!", che propone a tutti di rileggere un testo in maniera comunitaria. In questa maniera sono stati riletti numerosi testi. Propongo di inserire, oltre che una proposta di rilettura comunitaria, anche una proposta di trascrizione comunitaria. Così ognuno può continuare a lavorare singolarmente sui testi che gradisce maggiormente, ma si viene anche a creare un filone di lavoro comunitaria, per quei testi "orfani" o particolarmente impegnativi che meritano di essere trascritti. Dividendo il lavoro su più spalle, si ottengono risultati in tempo minore.
- Che ne dite? E' vero che siamo pochi e personalmente contribuisco saltuariamente, ma questo potrebbe essere un modo per coinvolgere nuovi utenti e anche "far lavorare" vecchi utenti non particolarmente attivi.
- Ciao a tutti, --Accurimbono (disc) 14:50, 20 ago 2010 (CEST)
Concordo e discordo anche con Accurimbono. :-P
Concordo pienamente con lidea di incoraggiare i nuovi utenti direttamente al proofreading, ed anzi ripeto che il nostro SAL, 25% e 50%, si presta moltissimo a documentare il primo passo che andrebbe suggerito all'utente inesperto, ossia la semplice correzione del puro testo senza alcun tentativo di formattare. Il testo corretto ma non formattato è, esattamente, rapprestantato dal nostro SAL 50%. Se questa abitudine si generalizzasse, potremmo organizzarci in "livelli di attività": qualcuno rovisterebbe nelle pagine SAL 25% portandole al SAL 50%, i "correttori", mentra altri, i "formattatori", rovisterebbero nelle pagine SAL 50% per portarle al 75% che è già un risultato apprezzabile; l'ultimo passo, perchè sia fatto bene, spetterebbe ai "paranoidi". :-P.
Non concordo invece con l'idea di suggerire agli utenti inesperti di affrontare opere impegnative, tipo Landino... a meno di trovare l'utente "innamorato", e allora amor vincit omnia. --Alex brollo (disc.) 15:59, 20 ago 2010 (CEST)
- OK, quello che mi preme maggiormente è impostare la trascrizione collaborativa, cioè replicare quanto fatto per la rilettura collaborativa anche per la fase di trascrizione. Poi sarà cura nostra proporre opere non troppo ostiche. Per il discorso nuovi utenti: credo che la cosa importante sia mettere 2 link a 2 pagine di aiuto in cui si spieghi brevemente: 1) come si rilegge 2) come si trascrive. Poi con l'esperienza tutti i nuovi utenti diventano esperti.
- BTW: i template sulle note laterali mi servirebbero per un'opera di Muzio Oddi.
- Ciao, --Accurimbono (disc) 17:48, 20 ago 2010 (CEST)
- Sono felice che questa discussione sia approdata a qualcosa di concreto: io sfrutterei il box del Collabora con noi! ponendo al lettore la doppia scelta: rilettura o trascrizione. Per mantenere l'impaginazione della PP si potrebbe rivedere il box Oltre Wikisource, carino ma XXL. Ancora un po' di studio e i nuovi templates delle note a margine saranno pronti :) --Xavier121 18:34, 20 ago 2010 (CEST)
Cruscate
modificaContinuo ad approfittare del mese di agosto e del fatto che ne ha parlato Edo, per fare il punto su un progetto per me mai dimenticato ma solo congelato. Mi riferisco al Vocabolario della Crusca, opera monumentale il cui inserimento, ad opera di Kronin, si è fermato dopo la trascrizione di poche pagine iniziali (brillantemente assemblate con un rispetto quasi maniacale della grafica). L'iniziale rapido interesse è coinciso con un altrettanto rapido abbandono da parte del resto della comunità, senza chiarimento esaustivo sui i limiti dell'impresa; pare che la presenza di una trascrizione già pronta, corretta in modo impeccabile e con precisi rimandi bibliografici, non abbia sortito alcuna fortuna tra le nostre fila e il moncone di quel promettente inserimento resta lì a testimonianza della nostra incuria. Se andiamo a vedere si tratterebbe di sfruttare un lavoro già fatto e che dovremmo affrontare nel modo più automatico possibile: Alex che alternative esistono ad un estenuante copia-incolla? Personalmente mi sono occupato di acquisire il malloppone di gallica e lavorarlo in modo da procedere spediti su Commons (nello specifico: divisione in tre tronconi da 70-80 MB PDF alta qualità, dati in pasto anche a IA per vedere se ci restituisce dei djvu per una comoda rilettura). Come per Landino spero si possa procedere ad una discussione concreta per vedere se si può approdare ad un progetto di lavoro comunitario sui dizionari (in questi mesi diversi ne sono stati caricati su OPAL) e superare alcune incomprensioni passate sul valore di un vocabolario all'interno di un progetto come il nostro: il potenziale incontestabilmente originale dei link a tutti i testi della nostra biblioteca (quelli citati dalla Crusca, ovvio!)--Xavier121 23:31, 21 ago 2010 (CEST)
- Evocato, rispondo: boh? Non avevo la più pallida idea che quella trascrizione esistesse. Ma secondo la regola: "Se i dati ci sono, qualsiasi aspetto abbiano, ne è possibile l'elaborazione", quindi qualcosa DEVE venir fuori. Fammi dare una buona occhiata.... --Alex brollo (disc.) 13:34, 24 ago 2010 (CEST)
- La prova su IA mi ha restituito un djvu di 80 MB contro il mio pdf compatto caricato di 60MB... che facciamo, lanciamo il pdf? funziona lo stesso la magica comparsa del testo? --Xavier121 18:23, 26 ago 2010 (CEST)
- No, non funziona. E' il "layer di testo del file djvu" che viene caricato. Ma niente impedisce (spero che le pagine del djvu corrispondano esattamente a quelle del pdf) di far caricare il testo del djvu sul pdf da Alebot. Però... come dicevo, ci sono motivi "standard" per preferire il djvu... ma una piccola eccezione ogni tanto non guasta. Torno a vedere. --Alex brollo (disc.) 21:15, 31 ago 2010 (CEST)
- Aimè, l'OCR di IA è totalmente inutilizzabile. Torno a guardare un po' il sito con la trascrizione... --Alex brollo (disc.) 21:24, 31 ago 2010 (CEST)
- Francamente mi sembra inutilizzabile anche la trascrizione sul sito segnalato... c'è una chiara, esplicita frase che riserva i diritti. Nell'insieme sono perplesso. --Alex brollo (disc.) 21:33, 31 ago 2010 (CEST)
- No, non funziona. E' il "layer di testo del file djvu" che viene caricato. Ma niente impedisce (spero che le pagine del djvu corrispondano esattamente a quelle del pdf) di far caricare il testo del djvu sul pdf da Alebot. Però... come dicevo, ci sono motivi "standard" per preferire il djvu... ma una piccola eccezione ogni tanto non guasta. Torno a vedere. --Alex brollo (disc.) 21:15, 31 ago 2010 (CEST)
- La prova su IA mi ha restituito un djvu di 80 MB contro il mio pdf compatto caricato di 60MB... che facciamo, lanciamo il pdf? funziona lo stesso la magica comparsa del testo? --Xavier121 18:23, 26 ago 2010 (CEST)
Rilettura del mese: seconda puntata
modificaCari amici,
dopo la prima puntata eccomi con qualcosa di concreto: una bozza di pagina di rilettura comunitaria. Il nome della pagina dovrebbe essere Wikisource:Rilettura del mese e lo farei ricadere tra le emanazioni del progetto trascrizioni. Mi sono ispirato alla versione inglese, ma possiamo fare di meglio. Ho voluto valorizzare il box in pagina principale che vorrebbe divenire il richiamo principale. Sotto con le riflessioni. - εΔω 19:15, 20 ago 2010 (CEST)
P.S. Dopo la lunga fatica del Veratti direi che potremmo alleggerirci con qualcosa di più breve: propongo o lo Jefte, o qualcosa di economico come Sul bilancio delle consumazioni colle produzioni per variare, o se ci gira qualcosa di lunghetto... i dialoghetti di Leopardi Senior. Lascio a voi la scelta. - εΔω 19:30, 20 ago 2010 (CEST)
- Bene i primi due, sospenderei momentaneamente i dialoghetti perché il passaggio in djvu da jpg non è stato eccezionale e vorrei rifare l'acquisizione: pdf alta qualità - trasformazione in djvu massima risoluzione. --Xavier121 23:35, 20 ago 2010 (CEST)
- Il primo è stato nel frattempo riletto (bene!), il secondo è in corso di rilettura. La bozza di OM mi piace: aggiungerei una lista di proposte di rilettura in modo che ogni utente può aggiungere in fondo l'opera che propone alla comunità per la rilettura. Ovviamente la scelta dell'opera può avvenire per vari criteri sempre seguendo il criterio del consenso wiki. --Accurimbono (disc) 10:08, 23 ago 2010 (CEST)
- Ho inserito nella bozza l'elenco sulla falsariga della pagina inglese. Se non piace RBate pure. --Accurimbono (disc) 10:16, 23 ago 2010 (CEST)
- Come scritto nella pagina io dedicherei per le proposte la pagina di discussione più che la pagina stessa, dove il link alla categoria degli indici SAL 75% mi sembra sufficiente.
- Mentre proseguite con gli aggiustamenti, che mi fanno molto piacere, faccio presente che questa bozza andrà legata in qualche maniera a filo doppio con Wikisource:Aiuta Wikisource, in modo da definire cosa stia meglio in un pagina piuttosto che in un'altra, in modo da invogliare i niubbi a gettarsi sulle pagine, ecc. ecc. Non toccherò il PC per qualche ora, quindi infierite pure di gusto. - εΔω 12:10, 23 ago 2010 (CEST)
- Ho inserito nella bozza l'elenco sulla falsariga della pagina inglese. Se non piace RBate pure. --Accurimbono (disc) 10:16, 23 ago 2010 (CEST)
- OK, invertito l'ordine cronologico delle opere già eleborate in modo che le recenti siano in testa. Per i libri già riletti, ho inserito nel template infotesto, nell'apposito campo, l'attribuzione comunitaria della rilettura, con link alla pagina in costruzione, in modo da darle visibilità. --Accurimbono (disc) 14:14, 24 ago 2010 (CEST)
A meno che non ci siano altre proposte di miglioramento da discutere (che in ogni caso possono essere sempre fatte), io proporrei di inaugurare la pagina. --Accurimbono (disc) 16:27, 31 ago 2010 (CEST)
- OK. Miglioramenti ce ne sarebbero: il punto da definire ancora riguarda la to do list (dove metterla e cosa metterci), ma la pagina in sé può andare live! - εΔω 16:34, 31 ago 2010 (CEST)
- Mi pareva di aver capito che fosse la pagina di discussione il luogo adatto per decidere quali testi rileggere in futuro. Per me in discussione farei le proposte, la discussione e la scelta dell'opera successiva. Poi se vogliamo, possiamo mettere un elenco nella pagina principale con le opere la cui rilettura nelle settimane/mesi successivi è già stata concordata. --Accurimbono (disc) 21:00, 31 ago 2010 (CEST)
- Ops mi sono spiegato male: la pagina di discussione così com'è va bene (nel tempo potremmo pianificare qualche mese in anticipo ecc. ecc.; in pagina principale sta solo la proposta in vigore). Quel che intendevo io (la to do list) è un riquadro in cui inserire linee guida di trascrizione (come posto a mo' di prova in Discussioni indice:Dialoghetti MCL 1831.pdf) e operazioni da svolgere in fase di rilettura: se ne è discusso qui senza giungere a una conclusione. Spero di verti chiarito la mia espressione brachilogica in inglese. εΔω 23:57, 31 ago 2010 (CEST)
- Mi pareva di aver capito che fosse la pagina di discussione il luogo adatto per decidere quali testi rileggere in futuro. Per me in discussione farei le proposte, la discussione e la scelta dell'opera successiva. Poi se vogliamo, possiamo mettere un elenco nella pagina principale con le opere la cui rilettura nelle settimane/mesi successivi è già stata concordata. --Accurimbono (disc) 21:00, 31 ago 2010 (CEST)
- OK, quindi ti riferivi la "todolist" relativa al testo oggetto di rilettura (non alla todolist del progetto "rilettura del mese"). Credo che basti rimandare con un semplice link alla pagina di discussione del testo stesso, in cui sono/dovranno essere riportate tutte le convenzioni di trascrizioni particolari utilizzate per il testo specifico che divergono dalle convenzioni di trascrizioni generali. In questa maniera non appesantiamo il riquadro che sta in prima pagina e lasciamo le informazioni specifiche del testo nella pagina di discussione del testo stesso. --Accurimbono (disc) 09:11, 1 set 2010 (CEST)
- Ho provato ad inserire il riferimento così: http://it.wikisource.org/w/index.php?title=Pagina_principale/Sezioni&diff=next&oldid=627442
- Ho cercato di accorciare al massimo la frase nei limiti del possibile. Modifiche migliorative sono benvenute. --Accurimbono (disc) 09:17, 1 set 2010 (CEST)
Medaglia medaglia medaglia!
modificaCari amici,
sapete che posso vantarmi con tutti voi per la mia attività di rilettore... ... ... su en.wiki?
ok, potete smettere di ridere: quel che volevo comunicare è che risulta pur sempre una grande molla motivazionale percepire che qualcuno ha riconosciuto il tuo lavoro per piccolo che sia: a me è bastata una medaglietta in pagina utente per spingermi a fare periodicamente un giretto a rileggere pagine in inglese. Dunque ritengo sia assai utile e bello che
- io mi ispiri a en.source per creare un templatino-medaglietta per segnalare in pagina utente chi ha collaborato alla rilettura del mese. Qualcosa come...
- tutti ci impegniamo a fine rilettura ad accreditare tale medaglietta agli utenti (soprattutto agli utenti nuovi o esteri, quanto a noi stessi ciascuno si regoli autonomamente) che abbiano contribuito alle riletture.
Che dite? - εΔω 17:52, 4 set 2010 (CEST)
- Alex, non riusciresti con qualche trucco informatico a selezionare via API quali utenti hanno portato le pagine dei dialoghetti a SAL 100%? Sarebbe un classico esempio di query incrociata... - εΔω 19:13, 22 set 2010 (CEST)
Ghiotta occasione per rimpolpare la biblioteca
modificaserve un cenno di risposta qui. - εΔω 17:47, 16 set 2010 (CEST)
Appello per definire i lavori
modificaCari amici,
credo che occorra darsi una mossa organizzativa nel campo delle trascrizioni. Mi spiego:
Le riletture del mese procedono bene, non c'è dubbio. In questo momento stiamo viaggiando di gran carriera verso una situazione paradossale:
- Avremo diverse opere ben rilette, con un progressivo calo di opere solo da rileggere
- Gli upload di nuovi libri di grandi dimensioni (o anche di medie dimensioni ma lasciati allo sbando) aumenta il numero di indici SAL 25%
- Gli indici SAL 50% fortunatamente (dato che dovremo intenderci sul significato di SAL 50%) sono pochi
insomma: a breve avremo pochissimi o nessun indice SAL 75% e moltissimi indici SAL 25% dato che noi utenti tuttofare ci dedichiamo alle riletture del mese. Nulla da ridire sul piacere di poter apporre un sigillo di definitività su una pagina: lo riconosco e lo cerco io pure, ma di questo passo ci infiliamo in un vicolo cieco.
La mia proposta sarebbe la seguente:
- proviamo a lasciare per un mese in home page una rilettura senza che noi la completiamo per lasciare tale compito ad altri
- concentriamo i nostri impegni di rilettori nella preparazione e formattazione di testi di SAL inferiore (la trascrizione inversa da sola ci dà un bel po' di lavoro).
Io nel mio piccolo mi sto dando da fare con Carducci e penso di inserire un bel po' di indici dai pdf di Cinnamologus, ma non nego che solo con gli indici SAL 25% ci sono diverse opere che hanno bisogno di poche pagine da formattare per saltare direttamente a SAL 75%. Tutto sta a esplorare la categoria e a pubblicizzare la rilettura del mese su Pedia o altrove. Che dite? - εΔω 19:24, 22 set 2010 (CEST)
- Ok su tutta la linea... --Xavier121 20:47, 22 set 2010 (CEST)
- Ok anche per me. --Aubrey McFato 21:38, 22 set 2010 (CEST)
- OK! Ma io già lo faccio; e poi sono "negato" per il passaggio SAL 75%->SAL 100%. Intervallo Carducci con divagazioni bottolatorie (sembra che funzioni uno script per aggiungere sia {{Ri}} che {{R}} alle poesie che sto editando). In più, mi sono comprato un libruscolo sul js.... per impararlo "come dico io"; non prometto niente ma.... chissà. --Alex brollo (disc.) 22:20, 22 set 2010 (CEST)
- Mi sento chiamato direttamente in causa in quanto nell'ultimo periodo ho fatto molte riletture. Se devo astenermi dal rileggere per evitare che fra poco le opere da rileggere finiscano e per dare spazio ad eventuali nuovi rilettori da attrare al progetto, beh, non c'è problema (anche se la rilettura è la parte più gustosa del processo di trascrizione), sinceramente non ci credo molto... ma tentar non nuoce, in fondo anche un solo utente attratto a wikisource è prezioso. Facciamo questo esperimento e vediamo cosa ne viene fuori.
- A mia parziale "discolpa" posso dire che, dopo due anni di blocco, ho portato al 75% le Rime di Guittone d'Arezzo (edizione Laterza/Egidi) ed ora (visto che la fonte cartacea è presente, ma su un sito esterno) sono pronte per la rilettura. BTW la rilettura andrebbe fatta il prima possibile, magari dopo l'esperimento di Ottobre, visto che il sito esterno oggi c'è e domani chissà... :) --Accurimbono (disc) 10:03, 23 set 2010 (CEST)
Esperimenti su en.source
modificaAgli appassionati di linkaggi e ancore, propongo di dare un'occhiata a en.source, qui: en:Horses and roads/Index. Seguite uno dei link alle pagine della voce "Abelorna, experience of". Poi spostatevi sul namespace Page: e fate lo stesso sugli stessi link, da en:Page:Horses and roads.djvu/241. Che ne dite?
Da notare che ho "esportato" su en: sia {{§}} che {{Pt}}, anche se è stato necessario rinominarli come en:Template:Anchor2 e en:Template:ShowTransclude e adattarli un pochino. --Alex brollo (disc.) 08:45, 26 set 2010 (CEST)
- Da provare bene anche qui... :) --Xavier121 10:09, 26 set 2010 (CEST)
- Tsk, principianti! :D Andate su Pagina:De' matematici italiani anteriori all'invenzione della stampa.djvu/5 e cliccate alla voce "Abohaly", e provate lo stesso su De' matematici italiani anteriori all'invenzione della stampa/Tavola delle materie principali e delle persone accennate o citate in questo commentario in ns0. L'unico problema è che il "tagging" mi richiede un sacco di lavoro, ma è già sperimentato da tempo :D - εΔω 10:43, 26 set 2010 (CEST)
- Eccellente... :) anche se vedento testi enormi con indici enciclopedici, mi chiedo se non sia il caso di istituire la categoria dei Taggatori, utenti devoti al culto del link, che aprono una seconda fase della Formattazione! --Xavier121 11:36, 26 set 2010 (CEST)
- Tsk, principianti! :D Andate su Pagina:De' matematici italiani anteriori all'invenzione della stampa.djvu/5 e cliccate alla voce "Abohaly", e provate lo stesso su De' matematici italiani anteriori all'invenzione della stampa/Tavola delle materie principali e delle persone accennate o citate in questo commentario in ns0. L'unico problema è che il "tagging" mi richiede un sacco di lavoro, ma è già sperimentato da tempo :D - εΔω 10:43, 26 set 2010 (CEST)
- Ho inserito gli interwiki en: nei template in it.source. --Accurimbono (disc) 13:58, 26 set 2010 (CEST)
- Grazie Curi. Sì, spero di poter introdurre anche qui il template. Però, nella sua versione "ad alta automazione", è necessario che ogni opera abbia un template opera-specifico.... infatti, il template HAR, su en:, è specifico per Horses and roads. A meno che non mi venga un'idea del tutto nuova... --Alex brollo (disc.) 23:21, 26 set 2010 (CEST)
- Quanto all'esperimento su en:, forse non ci vorrà troppo tempo per aggiungere tutte le ancore. Adesso tutti i template di en:Page:Horses and roads.djvu/241 hanno l'ancora, l'idea è quella di aggiungere le ancore a tutti i template di tutte le pagine dell'indice, poi di scaricarli, di ordinarli per pagina, e di ripassare le pagine mettendoci tutti i template ancora che puntano alla stessa pagina (un lavoraccio, ma molto, molto meglio che aggiungere i link uno per uno, ritornando più volte sulla stessa pagina). Purtroppo temo che gli spazi per un'automazione (che pure esistono) siano abbastanza stretti. --Alex brollo (disc.) 23:49, 26 set 2010 (CEST)
- Grazie Curi. Sì, spero di poter introdurre anche qui il template. Però, nella sua versione "ad alta automazione", è necessario che ogni opera abbia un template opera-specifico.... infatti, il template HAR, su en:, è specifico per Horses and roads. A meno che non mi venga un'idea del tutto nuova... --Alex brollo (disc.) 23:21, 26 set 2010 (CEST)
Non ce l'ho fatta... nuova trascrizione del mese
modificaCari amici,
non ho resistito: visto che su Monaldo Leopardi non si faceva avanti nessun altro ho proceduto all'aggiornamento della rilettura del mese.
La novità è che intanto ho spammato un avviso qui. Dato che non ci corre dietro nessuno direi stavolta di tenerci pronti a tutorare e gratificare ogni nuovo arrivato dedicandoci nel frattempo ai nostri lavori sporchi in altre zone del progetto.
So di essere monotematico, ma ritengo prioritario che gli utenti attivi si dedichino a spingere avanti le pagine degli indici incompleti o abbandonati. grazie in anticipo di tutto il sostegno all'iniziativa. - εΔω 19:33, 29 set 2010 (CEST)
- Benissimo! --Accurimbono (disc) 21:07, 29 set 2010 (CEST)
Primi segni di riscontro
modificaquesto sarebbe un messaggio da bar generalista, ma non voglio che si noti troppo, perciò lo pongo qui.
Con questo URL si vedono le modifiche nel nsPagina dell'ultimo mese.
A fronte del solito lavoro sporco di noi maniaci si vedono affiorare da fuori *.Wikisource
- utenti di altri progetti che trascrivono libri di loro interesse (Anassagora / Carlo Morino)
- Utenti che si prendono una pausa da Pedia per trascrivere pagine di loro interesse
- utenti che spuntano dal nulla per trascrivere pagine così, per diletto
In particolare le ultime due tipologie sono estremamente interessanti, perché mi spingono a un delicato ottimismo: potrebbero costituire le prime gocce di uno stillicidio di utenze in arrivo.
Chi si aspetta fiumane di utenti disposti a macinare migliaia di edit con il lavoro sporco sogna l'impossibile: si è visto che la complessita del progetto costituisce una specie di barriera in ingresso. Però l'esca della trascrizione attraendo molti molti più utenti rispetto al passato, aumenterebbe le probabilità che su tale numero un utente ogni tanto salti la barriera della pura manovalanza amanuense e rimpolpi lo sparuto manipolo degli operatori di sistema (sì: ormai è chiaro che chi si diletta di qualcosina di più tecnico della trascrizione diventa quasi automaticamente amministratore).
Un ultimo particolare: supponendo che l'arrivo di trascrittori sia favorito dal riquadro Collabora con noi! in pagina principale mi sono chiesto come mai alcuni utenti si siano lanciati su testi diversi, inaspettati, quasi casuali. Ne ho dedotto che da una parte i nostri inviti a destra e a sinistra prima o poi faranno effetto, e che probabilmente i due link nel riquadro in pagina principale (Categoria:Pagine indice SAL 75%, Categoria:Pagine SAL 75%) sono più efficaci di quel che credevo (d'altronde io pure, su en.source sono passato da una trascrizione personale alle trascrizioni mensili a una trascrizione "di mio gusto"). - εΔω 10:35, 10 ott 2010 (CEST)
- Ottimo! Ottobre è il mese delle talee, cerchiamo di tirar su dei nuovi utenti aiutandoli quando ne hanno bisogno e correggendo i loro inevitabili errori con il giusto tatto (su quest'ultimo punto io non sempre sono il massimo :) ). --Accurimbono (disc) 17:30, 10 ott 2010 (CEST)
- Quanto mi piacerebbe raccontarvi delle analogie strepitose fra l'accoglienza e la formazione dei nuovi utenti qui (che è eccellente, se paragonata alle durezze pediane) e l'equitazione... ma solo un accenno: il sesto grado della difficoltà di addestrare un cavallo è farlo in libertà, ossia: interagire con il cavallo completamente libero in un ampio spazio. Tutte le regole che si utilizzano per addestrare un cavallo trattenuto da qualcosa (le redini, il cavaliere sulla schiena, una corda attaccata alla testiera) non valgono più per un banalissimo motivo: il cavallo, se lo desidera, è sempre libero di andarsene lasciando l'addestratore con le pive nel sacco... è qui che la "sensibilità equestre" e il "tatto equestre" (le sentiment et le tact) diventano non delle raffinatezze, ma la conditio sine qua non. Vi ricorda qualcosa? :-) --Alex brollo (disc.) 10:27, 8 nov 2010 (CET)
Carattere emergente del template:LinkPagineIndice
modificaVi segnalo che il {{LinkPagineIndice}} ha un'interessantissima "emergenza" inattesa. Infatti, all'interno del template, esiste una relazione diretta fra nome del capitolo e numero della pagina Pagina. I suoi parametri sono infatti:
{{LinkPagineIndice |testo da visualizzare come link |numero della pagina del file djvu o pdf |nome completo del capitolo in Ns0 }}
Questo significa che una volta compilato correttamente il template per ogni "ingresso" dell'indice di un testo, dall'insieme dei template nel nsPagina può essere ricavato, via bot, l'intero "impianto" dell'opera in Ns0: possono essere create tutte le sottopagine, complete del loro tl|IncludiIntestazione e anche di una ottima approssimazione del tag pages (da ritoccare unicamente aggiungendo, se servono, i parametri fronsection e tosection). Quasi come la questione Ns0, ma con un vantaggio: che i dati sono realmente utili là dove vengono messi, e dove hanno una funziona autonoma; insomma, non serve "aggiungere" qualcosa di nuovo (come invece avviene per il tl|Ns0), anzi. Ci penso nelle prossime serate. Spero di trovare ancora qualche opera senza sezioni Ns0... qui i nostri utenti sono fulminei, uno non fa in tempo a riflettere un attimo e ci si trova già in Ns0 l'opera finita. :-( :-)--Alex brollo (disc.) 13:31, 8 nov 2010 (CET)
Transcludere anche le pagine SAL 25%
modificaVi sono buoni motivi (informatici) per anticipare più possibile la creazione delle pagine Ns0 proofread, con il tag pages. Il motivo principale è che nel momento in cui una pagina è menzionata in un tag pages, esiste un legame fra pagina Pagina: e sezione/capitolo che la contiene, leggibile sia a mano che via bot (attraverso Puntano qui). Vi sono anche ottimi motivi per non farlo: è molto "brutto" vedere in Ns0 l'output di un OCR di cattiva qualità, per esempio.
Ma in questo momento abbiamo un buon controllo di cosa viene visualizzato, e cosa no, nelle pagine Ns0; ad esempio, le pagine SAL 00% sono totalmente invisibili; non producono nemmeno il link. E allora stamattina mi son chiesto: perchè non estendere la cosa anche agli altri livelli di SAL? Modificando il template che genera le pagine transcluse, potremmo benissimo stabilire un "livello minimo di SAL" al di sotto del quale la pagina resta invisibile. Che ne dite? e se lo facessimo, il SAL minimo che attiva la visualizzazione, secondo voi, dovrebbe essere il SAL 50% o il SAL 75%? --Alex brollo (disc.) 11:54, 18 nov 2010 (CET)
- Il SAL 50% dovrebbe garantire almeno un testo privo di errori da OCR. Chi fosse interessato solo a leggere non si preoccuperebbe della formattazione. Un po' diverso il caso dei testi teatrali. --Xavier121 12:45, 18 nov 2010 (CET)
- Occorre stabilire una regola generale. Io proporrei (tenuto conto dei casi in cui la formattazione è importante, come ricorda Xavier121) di porre il limite minimo al 75%. Ma incoreggerei i rilettori a passare al 75% anche le pagine che non sono perfette dal punto di vista della formattazione "difficile", con quella non è mai finita. Bello sarebbe prendere l'abitudine di annotare i problemi residui in pagina discussione della pagina. --Alex brollo (disc.) 12:57, 18 nov 2010 (CET)
- Unendo l'utile al dilettevole, invece del testo al 25% o del nulla.... non si potrebbe transcludere un bel template di invito alla trascrittura,che dica ad esempio: "caro lettore, questa pagina non è stata ancora trascritta, per trascriverla premi su questo link, per sapere come fare premi su qust'altro link d'aiuto". che dite si può fare? --Accurimbono (disc) 14:55, 18 nov 2010 (CET)
- Occorre stabilire una regola generale. Io proporrei (tenuto conto dei casi in cui la formattazione è importante, come ricorda Xavier121) di porre il limite minimo al 75%. Ma incoreggerei i rilettori a passare al 75% anche le pagine che non sono perfette dal punto di vista della formattazione "difficile", con quella non è mai finita. Bello sarebbe prendere l'abitudine di annotare i problemi residui in pagina discussione della pagina. --Alex brollo (disc.) 12:57, 18 nov 2010 (CET)
- per Accurimbono, mi sembra un'ottimissima idea (se si può fare in automatico, ovvio). Tutto quello che è chiaro, semplice e invita le persone a contribuire dev'essere fatto, nei limiti del possibile. --Aubrey McFato 16:07, 18 nov 2010 (CET)
- Geniale Curi. Tuttavia riflettendo devo frenare un po' gli entusiasmi. La visualizzazione dipende non dal SAL in atto, ma dal SAL "semantizzato" che ci mette un po' per essere aggiornato. Avverrebbe quindi il paradosso che pagine portate al 75%, o anche al 100%, sia no visualizzabili in ns0 solo il giorno dopo. Il che sarebbe un abuso della pazienza di tutti, ma un insulto ai nuovi arrivati, che vogliono (giustamente) vedere SUBITO il risultato del loro lavoro. A dire il vero è uno dei pochi dati "semantizzati" lasciati accesibili: è quello contenuto nella section pagequality in pagina di discussione della Pagina, è gestito da bot ma può essere "forzato" a mano. Cercherò di accelerare l'implementazione su toolserver, se riesco ad abbassare l'intervallo a 5-10 minuti siamo ok. --Alex brollo (disc.) 16:21, 18 nov 2010 (CET)
- Brillante Curi eh, eh, eh :)
Avviso ai contributori.
Caro lettore, questa pagina non è stata ancora trascritta, per trascriverla premi su questo link
Importante. Se vuoi approfondire questioni legate alle convenzioni di trascrizione consulta il nostro manuale |
--Xavier121 16:47, 18 nov 2010 (CET)
- Grazie! Ma.... un'ideuccia... visto che finchè non è ben trascritta e discretamente formattata, l'immagine della pagine è migliore di una cattiva trascrizione... io ci faccio comparire, per il SAL 25% e SAL 50%, l'immagine della pagina. Sotto l'immagine, il bel box, magari un po' rimpicciolito (ma alle rifiniture penseremo poi! :-) --Alex brollo (disc.) 18:10, 18 nov 2010 (CET)
- AIMÈ! Vi ho trascinati in un sogno.
- La nuova versione della proofread extension non demanda affatto - come la precedente - al template MediaWiki:Proofreadpage pagenum template la visualizzazione del testo della pagina, ma solo la visualizzazione del link. :-( Mi spiace di avervi illuso.
Vedo se da questo equivoco si può comunque tirare fuori qualcosa di buono...
- Guardate qua: Specchio_di_vera_penitenza/Prolago. Il box mostra il messaggio adeguato alle pagine SAL 50; ma è un po' ingombrante. Ci vuole un "ridisegno" grafico, tempo che occorra rinunciare all'ambox...--Alex brollo (disc.) 14:52, 20 nov 2010 (CET)
Prova così:
Avviso ai contributori. Questa pagina non è stata ancora trascritta, per farlo premi su questo link
Importante. Per approfondimenti sulla trascrizione consulta il nostro manuale |
Ordine, per favore
modificaCari amici,
sto facendo fatica a capire dove scrivere le cose in questo progetto. Mi spiego:
- Ho una certa urgenza di rilanciare le trascrizioni inverse, che servono moltissimo per aumentare la certificaizone di qualità.
- Cerco e qualche volta trovo libri digitalizzati. Qualche volta vorrei proporre delle acquisizioni. Ci sono tre azioni 'che però sono tre aspetti dello stesso processo.
Per ragioni storiche però abbiamo tre pagine differenti per un lavoro che ne richiederebbe una sola. Esse sono
- Progetto:Trascrizioni/Tabella acquisizioni,
- Progetto:Trascrizioni/Lavori in corso,
- Progetto:Trascrizioni/Match and split
La prima è nata come una specie di chiamata alle armi, la seconda è nata per coordinare il lavoro di trascrizione inversa, il match & split ha reso la seconda fortemente legata alla terza, e la prima a mezzavia tra le altre due: oggi, alla luce della prassi attualmente in vigore, come si potrebbe riorganizzare il loro contenuto in maniera pratica se non operativa? - εΔω 19:31, 9 dic 2010 (CET)
- Hai ragione. Non vedo alternative a una pagina complessiva ed ordinata. Disgraziatamente io sono molto più adatto a eseguire i lavori elencati (la "manovalanza") che a organizzare le cose (la "direzione lavori"). IL problema è che non solo aumentano le opere, ma aumentano le cose che ci si possono fare (es. ha circa tre ciorni di vita una procedura "split semiautomatico").
- Funzionalmente, mi piacerebbe una serie di liste:
- di opere di cui va ricercata la versione immagini;
- di opere in cui si è trovata la versione immagine, ma va preparata e caricata su Commons;
- di opere in cui c'è ilfile su Commons, ma va creato un Indice e allimeato pagelist;
- di opere in cui c'è il testo Ns0 e c'è l'immagine, ma non un djvu con layer di testo (niente match and split di ThomasV).
- Fatto lo split, in un modoo nell'altro, i testi dovrebbero sparire dalla pagina e comparire in un'altra pagina, dedicata alla fase rilettura. --Alex brollo (disc.) 20:40, 9 dic 2010 (CET)
- di opere in cui c'è il testo Ns0 e c'è l'immagine, fornita di layer di testo (si può attivare il match and split).
Il caso di Hypnerotomachia Poliphili
modificaCaso molto interessante per vari motivi.
- sesto grado della difficoltà di trascrizione, ricchissimo di abbreviazioni e antiche consuetudini ortografiche.
- curiosa ricchezza di fonti, oggi è stata trovata anche la trascrizione di LiberLiber, eccellente e eccellentemente documentata. Facile da elaborare con "split senza match", infatti ho caricato 100 pagine in due orette. Pochi giorni e il caricamento sarà finito. Ma... mi sono sentito obbligato ad aggiungere LiberLiber alla fonte delle immagini; e francamante mi sento un po' a disagio nel "saccheggiare" un lavoro così impegnativo.
- Due fonti, magnifiche, di immagini sono una inutilizzabile per questioni tecniche (è stato utilizzato un sistema "tipo foto aerea" per rendere le pagine, che sono un collage di piccole immagini GIF quadrate 200 x 200px), l'altra protetta da un robusto copyright che pare collidere con il principio del PD-scan, con tanto di norma di legge specifica...
- ho "ritrovato il mio vecchio amore", NoteTab Light, fantastico per "predigerire" file txt. Non conosco bene gli altri editor txt avanzati, ma con questo si va veramente bene (possono essere programmati testi ricorrenti, tipo Edittool).
- ho definito una procedura molto efficiente per la preparazione e il caricamento di massa di immagini su Commons, con XnView come programma per ritaglio-raddrizzamento ecc e Commonist per il caricamento. Alex brollo (disc.)
- Riguardo al "saccheggiare" da Liber Liber, non credo che loro ne sarebbero dispiaciuti, anzi. Per me è peccato ripetere del lavoro già fatto, se mettiamo in bella vista il loro contributo pernso ne saranno solo contenti. --Aubrey McFato 21:38, 9 gen 2011 (CET)
Ordine su Commons
modificaAttenzione: questa discussione è transclusa da Discussioni progetto:Trascrizioni#Ordine_su_Commons
Ho cercato di mettere un po' d'ordine tra i file su commons anche guardando come si sono organizzate le altre source, ma devo dire che il risultato è alquanto disarmante. Perciò vi propongo di realizzare uno schema di come organizzare i file.
Situazione attuale i file sono sparsi per le categorie (di Commons):
- It Wikisource books
- DjVu files in Italian
- It Wikisource book pdf
- PDF files in Italian
- Books from Italy
- Scanned Italian texts
e sicuramente in altre categorie che non ho individuato.
Non so se tutti conoscono le regole di categorizzazione su commons, ma l'uso di categorie incrociate è deprecato, cioè un file non può essere in It Wikisource books e anche in DjVu files in Italian visto che la seconda (ora) è sottocategoria della prima. Ritengo che cercare un testo per formato (pdf o DjVu) sia sbagliato, visto che formati diversi vengono comunque utilizzati allo stesso modo, perciò propongo questo schema:
ogni file djvu o pdf avrà:
- descrizione:
- template book (e possibilmente namespace creator per l'autore)
- categorie:
- It Wikisource books oppure categoria specifica del libro se viene creata per raccogliere le immagine (vedi oltre)
- DjVu files in Italian oppure It Wikisource book pdf ma non saranno più sottocategorie della precedente
- Book by nome autore
- YYYY books' dove YYYY sta ovviamente per l'anno di pubblicazione
A titolo di esempio ho sistemato Il Principe di Machiavelli.
Se dal file si estraggono delle immagini, queste andranno raccolte in una categoria specifica (avente il nome del libro) che sarà solo sottocategoria di It Wikisource books. È auspicabile che le immagini abbiano poi descrizione e categorie aggiuntive che riguardino il soggetto dell'immagine.
Ci sono altri suggerimenti? --Luigi62 (disc.) 14:09, 13 gen 2011 (CET)
- Mi cospargo di cenere la capa per il ritardo con cui leggo. Ottimi suggerimenti, mi ci atterrò. In realtà, mi pare dura la descrizione e categorizzazione delle illustrazioni; quando carico illustrazioni, ne carico decine o centinaia al colpo, e tutto quello che posso fare è aggiungere "Illustations of" alla descrizione del libro. Poi, sbagliando ma non posso farci niente o quasi, assegno all'autore del libro le illustrazioni (cosa falsa) e via. Siccome questo contributo è importantissimo, e va ancora sviluppato, lo trasporto in Bar generale. Poi la cosa andrebbe ancora sviluppata: il template Book e il namespace Creator sono oggetti misteriosi. --Alex brollo (disc.) 18:27, 11 mar 2011 (CET)
- Vengo da it-source. Suggerimento: Non se sia possibile automatizzare tutto ciò ma sarebbe la cosa più bella. Se chi inserisce le "immagini-testo" e le "immagini-immagini" lo può fare inserendo una sola volta titolo ecc. e la categorizzazione viene aggiunta dalla macchina tutto si delinea a si dipana come un orologio svizzero cui manchi solo il cucù. :) È un template possibile? (Perdono per uno che in Commons non viene mani)--Silvio Gallio (disc.) 09:19, 12 mar 2011 (CET) Ah, dimenticavo: it Wikisource books non mi sembra tanto preciso; ci sono molti testi ben più corti e ben più lunghi di un libro. Poi, per il nome a me poco cale. ma si possono ingenerare confusioni (vedi Indice e Indice! ecc.)--Silvio Gallio (disc.) 09:23, 12 mar 2011 (CET)
γρεψο... ops, greco
modificacari amici,
comincio a pensare che sia ora di importare anche da noi un templatino che segnali la presenza di testo greco da trascrivere: almeno finché ci sono io che mi diverto a trascrivere è meglio che mi sfruttiate. Prendo ad esempio ca:Template:Grec, ma seguendo gli interwiki ci sono varianti da scegliere per la modalità con cui segnalare il problema. Prima di importare chiedo alla comunità di segnalarmi quale versione valga la pena trapiantare... - εΔω 18:36, 31 mag 2011 (CEST)
Sarebbe anche carino se le lettere con accenti e spiriti fossero leggibili più facilmente ma non si può avere tutto. Rguardo alla domanda mi sembra più comodo quello catalano che è praticamente lo istesso del francioso. Anche {{arabo}}, {{cirillico}} e {{ebraico}} farebbero comodo. Il cirillico russo è il mio piatto preferito. --Carlo Morino (disc.) 19:23, 31 mag 2011 (CEST)
Partecipazione progetto!
modificaCiao a tutti!! Mi piacerebbe partecipare attivamente al progetto trascrizioni. Cosa devo fare per essere inserita nella lista? In questo momento sto lavorando sui "versi sciolti dell'abate Carlo Innocenzio Frugoni" (se qualcuno potesse darmici un occhio e dirmi se come sto procedendo va bene oppure no, e darmi eventuali consigli...) Grazie!! --RobyBlue (disc.) 13:02, 16 giu 2011 (CEST)
- Vai tranquilla, ti seguo io, stai facendo un ottimo lavoro, continua così, :) --Xavier121 13:06, 16 giu 2011 (CEST)
RigaIndice mi fa le bizze
modificaQualcuno sa perchè con il template {{RigaIndice}} vengono questi puntini? Nelle pagine precedenti non ci sono. --Aubrey McFato 00:27, 5 lug 2011 (CEST)
Indice truffaldino: croce o delizia?
modificacari amici,
un innocente utente ha scoperto una pentola a lungo chiusa: la Vita di Dante del Tiraboschi non era che la punta di un iceberg: il volume contiene infatti sia le Rime che l'Inferno... come si può notare da qui
Il trucchetto di manipolare il <pagelist /> per mostrare solo una parte del libro ha giustamente causato il disagio di un rilettore. Si fa presto a rimediare, ma a parte la necessità di rispondere con chiarezza a Raoli su altri punti da lui sollevati, volevo concentrarmi sulla possibilità di usare il trucchetto del pagelist parziale come spunto positivo.
In particolare, prendiamo testi enormi che raccolgono molte opere (due esempi non a caso Carducci e Manzoni)... perché in occasione delle riletture collaborative invece di far rileggere interamente tali libri non si "selezionano" da essi singole opere per la rilettura? Non si tratterebbe di misure permanenti ma mirate a un periodo circoscritto. Che ne pensate? - εΔω 11:13, 19 lug 2011 (CEST)
- Sono contrario a questi trucchi. Che si mostri tutto il libro. Se poi se ne trascrive solo una parte l'indice rimane al 25% e la parte trascritta e magari riletta, in NS0 al 100%. L'importante che manteniamo la trasparenza. Il progetto è già abbastanza complesso. --Accurimbono (disc)
Oh. My. God. Assolutamente contrario a questi subdoli trucchetti. Mettere in rilettura solo una parte di un indice, contenente una singola opera di una raccolta più vasta, può anche essere una buona idea. Ma la pagina indice deve mostrare tutti i contenuti del libro. Altrimenti quando la portiamo al 100% stiamo barando. Candalùa (disc.) 13:17, 19 lug 2011 (CEST)
Occhio: discussione importante su commons
modificaSarò breve: su commons vogliono rinominare una categoria che ci preme molto: pregasi intervenire su commons:Category talk:It Wikisource books. Importante! - εΔω 17:08, 15 set 2011 (CEST)
- (strano) Niente problemi di nazionalismo stavolta, vogliono cambiare anche le altre lingue. Ho scritto due righette, per quello che vale. La cosa, comunque, sempre più mi mi conforta nella mia ferrea convinzione che stare il più possibile alla larga da quel sito fa bene alla salute. Buone bracia sottratte... :)--Silvio Gallio (disc.) 17:42, 15 set 2011 (CEST)
- Potrei farlo io ma subito subito non è bello. Se altri interverranno suggerisco di appoggiarsi (anche) a quanto scritto in Commons:Category_talk:De_Wikisource_book e soprattutto quanto (imho intelligentemente) dice Joergens già nel 2007...
Progressi in vista nell'automazione
modificaSono entusiasta di essermi associato a Progetto:Bibbia, in quanto la trascrizione della poderosa opera offre numerosi stimoli a riflettere su problemi generali. Vi avviso di un altro fronte dell'automazione, a cui pensavo da parecchio tempo ma che stavolta affronterò di petto: l'uso dei dati interni del layer testo djvu. In breve, nello strato testo dei file djvu di IA (e non solo) non c'è solo il testo, ma anche la struttura del testo, suddivisa gerarchicamente in "box annidati" ciascuno dei quali è identificato dalle proprie coordinate nella pagina. I livelli di dettaglio sono parecchi: page, column, region, row, word e talora perfino character. A parte page e character, quelli intermedi hanno un enorme interesse per "capire" la struttura della pagina e forse per "indovinare" la formattazione wiki. I dati con le coordinate possono essere ottenuti sia con una struttura tipo LISP ("Lots of Irritating Single Parentheses" ;-) ) o in xml. Python può agevolmente eseguire il parsing dell'uno e dell'altro standard. Thinking in progess .... --Alex brollo (disc.) 11:03, 14 ott 2011 (CEST)
- Dalla teoria, alla pratica: la cosa funziona. Non sto a spiegarvi come, perchè spiegazione non richiesta, noia manifesta, ma sono riuscito a estrarre dal djvu di Bibbia circa il 70% dei template RigaIntestazione completi (da correggere, ovvio..).
- siccome sono "leggermente entusiasta" ve ne metto qui un saggio, precisamente quelli da pag 100 a pag 109 (a caso, vediamo cosa esce..), e per sfizio ci metto pure il comando python che estrae i dati dalla lista che conservo nel mio pc ma che riverserò nei "paginoni" usando come àncora il tag pagina creato da match:
>>> for i in range(100,110): print i, listaIntestazioni[i][1] 100 {{RigaIntestazione|''e della donna.''|'''LEVITICO, 16.'''|''Fesia delle espiazioni.''}} 101 {{RigaIntestazione|''II becco Azazel.''|'''LEVITICO, 16,'''|'''Fuor del campo^''''}} 102 {{RigaIntestazione|''II Santuario unico.''|'''LEVITICO, 17, 18.'''|''Unioni illecite.''}} 103 {{RigaIntestazione|''Pcccati contro'natura.''|'''LEVITICO, 19.'''|''La santita comandata.''}} 104 {{RigaIntestazione|''Varii precetti.''|'''LEVITICO, 20.'''|''Sacrificii umani vietati.''}} 105 {{RigaIntestazione|''X' incesto proihito.''|'''LEVITICO, 21.'''|''Puritcb dei sacerdoti.''}} 106 {{RigaIntestazione|''Sacefdoti senza difetti.''|'''LEVITCO, 22.'''|''Uso delle cose sacre.''}} 107 {{RigaIntestazione|''Vittime senza difetti.''|'''LEVITICO, 23.'''|''Lefeste solenni.''}} 108 {{RigaIntestazione|''#1''|'''#2'''|''#3''}} 109 {{RigaIntestazione|''II hestemmiatore punito.''|'''LEVITICO, 25.'''|''Z' anno del Giuhhileo,''}}
E adesso, a nanna! Domani grande estrazione delle note, che è la stessa cosa.... :-) --Alex brollo (disc.) 01:28, 15 ott 2011 (CEST)
Il caso di Dizionario triestino
modificaL'ultima avventura (Indice:Dizionario triestino (1890).djvu) è stata veramente interessante. Rispondendo a una domanda di Aubrey, vi spiego i passi che hanno consentito una "preformattazione" per certi versi sorprendente.
- disponibilità di un'eccellente serie di tiff b/n
- estrema "pulizia" e semplicità dell'impaginazione del libro (particolarmente utile, l'indentatura molto vistosa dei lemmi)
- alta qualità dell'OCR da FineReader, con l'unico intoppo della errata interpretazione di frammenti della linea di separazione centrale delle colonne (tradotte variamente in |, I, 1, l...)
Partendo dal semplice txt con l'unica formattazione costituita dalla quasi impeccabile suddivisione in paragrafi, è stato possibile, con script python piuttosto semplici, elaborando i file txt a pagina singola prodotti da FineReader:
- identificare i lemmi e includerli nel template lemma;
- identificare le sigle e includerle nel template DtAbbr;
- aggiungere i template Colonna, AltraColonna (su per giù a metà testo), FineColonna;
- eseguire le usuali pulizie postOcr e sistemare le virgolette „“ (la seconda in genere interpretata come ")
- identificare gli elementi dell'intestazione e predisporre quasi per tutte le pagine il tl RigaIntestazione
- caricare il tutto nelle pagine Pagina.
Questa proceduta non ha minimamente sfruttato le potenzialità dell'"analisi delle aree" dello strato testo djvu, anche perchè, in questo caso, il djvu non ha uno strato testo OCR. Questo campo, molto promettente, è in "stand by" e spero di dedicarmici quanto prima. --Alex brollo (disc.) 12:53, 28 ott 2011 (CEST)
- Ho provato a rileggere un paio di pagine. L'accuratezza nel riconoscimento dei lemmi e delle sigle è molto buona. Invece sulle pulizie postOCR credo si possa migliorare, in particolare andrebbero tolti gli spazi prima dei segni di punteggiatura , ; . : ! ? e tra le virgolette aperte/chiuse e il testo contenuto. Ottimo lavoro, comunque! Un dubbio: alcuni lemmi sono "doppi", vedi "Abelida, abelimento": in quel caso come conviene usare il template Lemma? Candalùa (disc.) 14:09, 28 ott 2011 (CEST)
- Quasi deliberatamente trascuro dalle "pulizie offline" le cose che vengono corrette da postOCR, anche per incoraggiarne un uso estensivo da parte degli utenti. Caso del doppio lemma: senza dubbio, ciascuno nel suo template. Se metteremo delle section intorno alle definizioni dei due lemmi, saranno due coppie di section "annidate" o anche "intrecciate", la cosa non crea nessun disturbo.
- Ho contato i lemmi e li ho estratti, sono circa 13000. Poco più di venti pagine switch, e posso implementare, lemma per lemma, il dato del numero pagina che lo contiene per ottenere un "effetto bibbia" anche in assenza di ancore numeriche.
- Un bel lavoro da bot, vedo, è includere nella section giusta l'eventuale seconda parte della definizione del lemma che compare nella pagina seguente. --Alex brollo (disc.) 14:47, 28 ott 2011 (CEST)
Nuntio vobis...
modificaChi ha visto la breve vita di File:test.djvu e di Indice:Test.djvu, creati e cancelati nel giro di una manciata di minuti, forse ha sospettato che stessi macchinando qualcosa...
Mi è riuscito il "tiro" di far caricare da python un nuovo strato testo, ottenuto con FineReader, utilizzando tal quali i file txt prodotti da FineReader e lanciando un singolo programmino; il resto l'ha fatto tutto il detto programmino. Il file è File:Regolamento Circolazione Treni 1936.djvu collegato a Indice:Regolamento Circolazione Treni 1936.djvu. L'OCR vi sembrerà no buono, ma l'OCR di Internet Archive di partenza, Silvio penso che ve lo confermerà, era MOLTO peggiore. Grazie a Silvio per la proposta; la sua spintarella è stata quello che mancava per concludere un vecchio progetto. Domani sera, il primo DjvuSource: suppongo di riprendere il vecchio e glorioso Georgiche. --Alex brollo (disc.) 23:43, 8 nov 2011 (CET)
- Tre hurrà x Alex! l'OCR che avevo tratto da I.A. era effettivamente moooolto peggiore. A latere, anche il file-immagine tratto da I.A. nella inutile speranza di ottenere un layer (il mio office ha problemi proprio con MODI) è peggiore di quello tratto dal pdf con DjVuToy. E, a essere cattivi, il pdf è il file di migliore qualità, pur nella "terribilezza" della stampa. Così mi chiedo se non sia il caso di cambiare anche il file immagine. Non è che succede il solito pasticcio, vero? In tal caso potrei provare ad alzare la qualità dei file tif e vedere l'effetto che fa. Grazie --Silvio Gallio (disc.) 08:03, 9 nov 2011 (CET)
- Avviso tecnico: se il tiff è destinato all'OCR, esagerare sempre nella qualità! FineReader l'ho fatto correre sul pdf, ma da quello che ho capito il MODI chiamato da DjvuToy "riceve" da DjvuToy la conversione tiff delle pagine djvu, e se il tiff contenuto è di bassa risoluzione, l'OCR risultante ne risente. Può essere impressionante maneggiare tiff che hanno alcuni mega per pagina, ma (soprattutto se sono in bianco e nero) il software comprime questi grossi tiff con estrema efficenza. --Alex brollo (disc.) 09:07, 9 nov 2011 (CET)
- Acc. Mi è scappato il dito e devo riscrivere tutto il post. Allora. Sono partito da pdf a 96 dpi e mi sono ripulito, raddrizzato e a volte riscritto (copia incolla di lettere da un punto all'altro - ma vi sfido a capire dove :P) pagina per pagina. Ne ho tratto file tif a 200 dpi. Da questi tif ho tratto il secondo pdf, quello che hai usato. Potevo anche esagerare ma la NASA non mi ha mandato il loro computer che mi avevano promesso :PP. Proverò a esagerare nei prossimi giorni. Non lavorare "fuori di qui" e pian piano arrivo... comunque i tif stanno -pian piano- andando nel dropbox; se ti servono copiali e cancellali, se non servono cancellali e basta. se no li cancellerò fra qualche giorno sono 64 Mb! e non riuscivo nemmeno a ottenere il djvu da any2djvu. Bye!Silvio Gallio (disc.) 09:45, 9 nov 2011 (CET)
- DEVI assolutamente imparare a usare il mio scriptino pdf2tif.py. Cercherò di sistemarlo per renderlo più user-friendly possibile. Se parti dai tiff 96 dpi, è perfettamente inutile cercare di aumentare, in un secondo momento, la risoluzione... aimè.
- Acc. Mi è scappato il dito e devo riscrivere tutto il post. Allora. Sono partito da pdf a 96 dpi e mi sono ripulito, raddrizzato e a volte riscritto (copia incolla di lettere da un punto all'altro - ma vi sfido a capire dove :P) pagina per pagina. Ne ho tratto file tif a 200 dpi. Da questi tif ho tratto il secondo pdf, quello che hai usato. Potevo anche esagerare ma la NASA non mi ha mandato il loro computer che mi avevano promesso :PP. Proverò a esagerare nei prossimi giorni. Non lavorare "fuori di qui" e pian piano arrivo... comunque i tif stanno -pian piano- andando nel dropbox; se ti servono copiali e cancellali, se non servono cancellali e basta. se no li cancellerò fra qualche giorno sono 64 Mb! e non riuscivo nemmeno a ottenere il djvu da any2djvu. Bye!Silvio Gallio (disc.) 09:45, 9 nov 2011 (CET)
Quindi i passaggi corretti sono:
- fai tu stesso le scansioni? imposta lo scanner a 300dpi e produci direttamente dei tiff a 300dpi; e conservali! Resisti alla tentazione di comprimerli, e guardati bene dal salvare le immagini come jpg.
- hai un pdf Google o IA copiato da Google? usa pdf2tif.py (appena potrai) a 300 dpi, produrrà delle "bestie" di tiff da quattro o cinque mega per pagina, conservali gelosamente: sono quelli da dare in pasto a DjvuToy (che peraltro su Piola ha fatto un bel casino), oppure anche, perchè no? al vecchio DjvuSolo, che non fa mica un cattivo lavoro, se parte da ottime immagini non compresse. --Alex brollo (disc.) 12:02, 9 nov 2011 (CET)
- OK io ho messo in source quello che mi hanno passato. (ahimé) Però da 96 a 200 dpi ho visto una discreta differenza. Anch'io ritengo pressoché inutile portarle più su (pressoché) ma un tentativo lo posso sempre fare. Quanto al tuo "scriptino" tremo solo all'idea. :) È una roba che devo scrivere le righe di comando ancoradinuovo? gesummaria! O_O Te lo ricordi, vero, che io sono pigro? Il limite minimo/massimo dei 300 dpi mi è storia abbastanza nota Ma se mi arriva un file a 96 non c'è molto da fare. quick-bye! Silvio Gallio (disc.) 22:06, 9 nov 2011 (CET)
- PS, non per fare il difensore d'ufficio ma credo che il Toy non abbia nulla a che fare col casino di Piola. come ti ho detto -e purtroppo l'ho scoperto solo molto più tardi- i problemi erano già presenti nel pdf di Google. RiBye! Silvio Gallio (disc.) 22:09, 9 nov 2011 (CET)
I DjvuSource
modificaAl momento ne abbiamo due.
- File:Sulla reciproca influenza della libertà politica e dell'industria mecanica dei popoli.djvu (il primo assoluto in onore si Silvio che inconsapevolmente mi ha spinto a imboccare questa avventura)
- File:Georgiche.djvu
I DjvuSource presentano, al momento della creazione di una pagina, il loro strato testo; normalmente, ciò che presenta un file djvu "normale" è l'OCR incorporato nello strato testo; i DjvuSource presentano invece il testo wiki, completo e formattato. L'intero contenuto delle pagine Pagina è incorporato nei loro strati testo.
La cosa non è che serva a molto, in un'opera già inserita; ma questa cosa apre la strada a varie possibilità, dirette o indirette.
- se lo stesso file viene aperto in un altro progetto wikisource (test in corso su vec.source con Georgiche) il testo formattato wiki viene importato tal quale (problema: discordanza nei template fra progetto e progetto...);
- ciò che è stato acquisito, nel corso di queste manipolazioni, potrà essere utilizzato per realizzare un agevole "editor di layer testo djvu" appoggiandosi a un qualsiasi text editor;
- si apre la strada a elaborazioni postOCR direttamente sul text layer, compresa l'introduzione di codice wiki ricorrente, che saranno disponibili alla prima apertura della pagina;
- inserendo il codice html delle pagine, invece che il codice wiki, è ipotizzabile un "visualizzatore" che, anche in assenza del software wiki, visualizzi sia le immagini delle pagine, che il loro contenuto formattato e "ipertestualizzato" (sono necessarie solo le routine djvuLibre e uno script locale in grado di interrogarle e di restituire una pagina html.
- altro?--Alex brollo (disc.) 08:47, 10 nov 2011 (CET)
appello per pattugliamento dei pagelist
modificaCari amici,
ebbene sì, intendo tornare sulla manutenzione delle pagine indice. Il controllo dei tag <pagelist /> nelle pagine indice è necessario: mi spiego.
Dal pagelist il Mediawiki:Proofreadpage pagenum template che inserisce i "segnaposto" come [p. 13 ] nel ns0 si basa su quel tag per la numerazione!
Nessun utente è tenuto per contratto a conoscere l'uso del tag pagelist, né si può per questo impedire a utenti volonterosi ma inesperti di creare pagine indice, ma gli utenti esperti che ne conoscono il funzionamento dovrebbero essere coscienti che il controllo degli ultimi indici creati è un altro tassello dell'opera di pattugliamento che mantiene in forma il progetto.
Inizialmente me ne sono occupato io, ma se è vero che la prima volta passarmi tutte le pagine indice è stata una sfacchinata non indifferente, non solo oggi gli indici sono molti molti di più, ma dato che di fatto sarebbero da controllare solo gli indici che non sono stati già controllati, occorrerebbe semplicemente avere uno strumento che elenchi gli indici creati recentemente.
Ad esempio: Speciale:PaginePiùRecenti può essere usato per mostrare gli indici nuovi, ma il suo limite cronologico (metà ottobre) è piuttosto ridotto. Cercasi suggerimento e soprattutto aiutanti. - εΔω 17:57, 10 nov 2011 (CET)
- Confermo: un tempo il pagelist mi sembrava un orpello paranoide... mi sono ricreduto. Io sono un aggiustatore di pagelist occasionale, lo faccio quando mi capitano a tiro; cercherò di farlo in modo un po' più sistematico. Forse una paginetta di "convenzioni" non ci starebbe male. --Alex brollo (disc.) 13:05, 17 nov 2011 (CET)
Note nella coltivazione degli olivi
modificaCari amici,
ho un problema:
abbiamo in La coltivazione degli olivi due sistemi di rappresentazione delle note. Occorre uniformare. Dato che comunque il lavoro è da svolgere e dato che io non sono sereno su questo vorrei condividere con voi la decisione sul da farsi.
- Premessa
- nel testo le note sono poste a fine di ogni libro e richiamate da rimandi numerici
- conseguenza
- ci sono nel primo libro note richiamate con Template:Nota separata; negli altri il template:Nota (peraltro da sistemare)
- Considerazioni
-
- Il template nota separata non mi piace perché introduce section nel testo delle note e aggiunge nota a piè di pagina dove non appaiono nella pagina. Se si possono evitare delle section non sarebbe male e il Template:Nota fa giusto questo, inoltre la presenza delle nota a piè di pagina dove non sono presenti nel testo è a mio parere causa di confusione, infine il template si appoggia al template:Pagina che credevo destinato all'eliminazione per obsolescenza. L'indubbio vantaggio è che in ns0 i rimandi a lato delle singole note permettono una correzione al loro testo che il template:Nota non concede
- Il template:nota ha un uso piuttosto esoterico, che alla prova dei fatti non permette una combinazione "arbitraria" dei parametri; inoltre ai fautori del "Wikisource non è di carta" impone un clic in più e la lettura di note poste in pagine diverse proprio come sulla pagina cartacea. L'indubbio vantaggio è che la struttura delle note è mantenuta come nella versione cartacea (tra l'altro in questo libro le note seguirebbero il testo di ciascun libro nel medesimo tag pages), e non introducono oltre al template Nota altri elementi estranei al testo.
In che direzione dirigereste il lavoro? E perché? - εΔω 12:11, 17 nov 2011 (CET)
- Forse le novità introdotte con Dizionario Triestino, Zibalcone e Bibbia consentiranno di semplificare la parametrizzazione del Template:Nota (a prezzo della costruzione, una tantum, di una esotericissima pagina-dati). Proverò a riflettere un po' sulla questione. In fondo, i dati veramente necessari sono pochi: in nsPagina, numero di pagina dove sta la nota e numero della nota; in pagina note, il numero della pagina e lo stesso numero della nota. Il difficile viene nel momento della trasclusione, ma qui una pagina-dati che trasformi il numero della pagina Pagina in nome di una pagina ns0 è pensabile. Alla fine, il tl|Nota dovrebbe avere questa forma: {{Nota|numero della pagina|numero della nota}}. Nel caso ideale in cui le note hanno un ordine progressivo in tutto il libro, basterebbe perfino il solo dato numero della nota. --Alex brollo (disc.) 12:54, 17 nov 2011 (CET)
Ho eliminato il secondo punto a sfavore di Nota separata: ora in nsPagina non si vede più la nota a pié di pagina ma solo il rimando ad essa. Inoltre non fa più uso del template:Pagina, anche se non capisco cosa tu abbia contro di lui, poverino, che ha sempre fatto il suo dovere :-). Rimane la storia delle section: e anche qui sinceramente non ho ben capito il motivo dell'opposizione... perché sono elementi estranei al testo? ma anche un template lo sarebbe... Candalùa (disc.) 16:46, 17 nov 2011 (CET)
- (Aggiungo un accorato appello ad Alex: ti supplico, la pagina dati no! :-) se uno deve pure compilare la pagina-dati, altro che semplificare! questo genere di soluzioni ha dimostrato di andare benone per le maxi-opere, dove c'è un utente esperto che compila tutto per benino e automatizza parte del lavoro, ma non generalizzerei la cosa se non è proprio indispensabile). Candalùa (disc.) 16:54, 17 nov 2011 (CET)
- Accolgo volentieri l'accorato appello (e spengo il cervello che stava immaginando una soluzione via bot :-) ). Per complicarmi la vita mi basta l'attuale trilemma: studio i parser xml per tirar fuori qualcosa dall'export xml dei djvu? Continuo a sviluppare la mia routine di parsing diretto dei file .dsed? Mi dedico alla sola rilettura per almeno un mese? ;-) --Alex brollo (disc.) 17:00, 17 nov 2011 (CET)
Mi è sembrato di capire, riguardo alla presenza di due modalità di inserimento note, che non si sia arrivati a una decisione definitiva. Riusciamo a trovarne una che ci soddisfi? Propenderei per nota separata per un semplice motivo: l'apice porta alla nota relativa al corrispettivo verso mentre per il template nota è necessario partire dalla nota per risalire al testo; l'avvertimento "Vedi note dell'autore" è un surplus, a mio avviso inutile, che si potrebbe evitare col template nota separata.--Barbaforcuta (disc.) 01:51, 1 feb 2012 (CET)
- Sono favorevole all'uso di Nota separata, sopratutto perchè non richiede un riferimento "assoluto" in Ns0 per la transclusione, permettendo di creare testi composti diversamente. L'unico limite sono le due pagine, ma visto i rari casi in cui sono più di due (esempio) col template pagina e <noinclude><includeonly> </includeonly></noinclude> si risolve bene. --Luigi62 (disc.) 09:12, 1 feb 2012 (CET)
- Anche se non a furor di popolo, mi sembra ci sia una preponderanza di favori nell'uso del template Nota separata. Se non ci sono obiezioni, m'accingerei quanto prima a modificare le note uniformandole secondo l'esempio del Libro I della stessa opera.--Barbaforcuta (disc.) 19:06, 23 feb 2012 (CET)
Testi SAL 100% da proofreadizzare
modificaInizio a buttare giù una lista di pagine al 100% da rendere proofread come da discussione qui. Modificate liberamente la lista e scrivete sotto di ognuna le vostre annotazioni, l'edizione che si può usare, lo stato di completamento ecc. Candalùa (disc.) 19:55, 13 dic 2011 (CET)
Pagine singolemodifica
|
Opere su più paginemodifica
|
Testi da (ri)rileggere
modificaLista dei testi, nominalmente al 100% o a Edizioni Wikisource, che sono stati dotati di scansioni a fronte e che andrebbero quindi (ri)riletti per confermarne la qualità. Quelli a 100% si possono portare a Edizioni Wikisource una volta riletti.
Amalfi di Henry Wadsworth Longfellow (XIX secolo), traduzione dall'inglese di Giulio Minervini (1883)Fatto - εΔω 19:54, 24 dic 2011 (CET)AnnaliFatto - εΔω 09:09, 25 dic 2011 (CET)A Carlo Alberto di Savoia un Italiano di Giuseppe Mazzini (1831)Fatto da Utente:RedqueenA Vincenzo Bellini di Mario Rapisardi (1867)Fatto εΔω 11:23, 1 gen 2012 (CET)Epistola ad Ortalo di Gaio Valerio Catullo (I secolo a.C.), traduzione dal latino di Ugo Foscolo (XIX secolo)FattoOrlandinoFatto - εΔω 18:11, 20 feb 2012 (CET)Sempre così di Francesco Dall'Ongaro (1859)Fatto - εΔω 09:17, 25 dic 2011 (CET)Sulla maniera e la utilità delle Traduzioni di Anne Louise Germaine de Staël (XIX secolo), traduzione dal francese di Pietro Giordani (1816)Fatto - εΔω 18:11, 20 feb 2012 (CET)Elegia di Tommaso Gray poeta inglese per esso scritta in un cimitero campestre tradotta in versi italiani di Thomas Gray, traduzione di Giuseppe Torelli (Verona, 1776)FattoL'ultima ora di Venezia di Arnaldo Fusinato (1849)FattoLa spigolatrice di Sapri di Luigi Mercantini (1857)Fatto - Federicor (disc.) 15:16, 7 mar 2012 (CET)Proclama Torino 27 marzo 1849 di Vittorio Emanuele II di Savoia (1849)Fatto - Federicor (disc.) 15:11, 8 mar 2012 (CET)Inno di Garibaldi di Luigi Mercantini (1858)Fatto - εΔω 16:22, 8 mar 2012 (CET)Ordine del giorno Vigevano 7 agosto 1848 di Carlo Alberto di Savoia (1848)Fatto --Luigi62 (disc.) 21:25, 8 mar 2012 (CET)Proclama Bozzolo 28 luglio 1848 di Carlo Alberto di Savoia (1848)Fatto da Utente:ModafixCapitolo in biasimo della togaFatto - εΔω 15:10, 10 mar 2012 (CET)L'enimmaFattoPer la festa dell'unità italiana nel 1863 di Maria Alinda Bonacci Brunamonti (1863)FattoOde su le nozze di Giulia e di Manlio di Gaio Valerio Catullo (I secolo a.C.), traduzione dal latino di Luigi Lanzi (1807)FattoRegno di Sardegna - Regie Patenti 17 marzo 1831 di Regno di Sardegna (1831)FattoLettera di Giosuè Carducci a Mario Rapisardi di Giosuè Carducci (1877)FattoRegno di Sardegna - Regio Editto 30 settembre 1821 di Regno di Sardegna (1821)Regno di Sardegna - Regio Editto 9 maggio 1794 di Regno di Sardegna (1794)Regno di Sardegna - Proclama 13 ottobre 1821 di Carlo Felice di Savoia (1821)Regno di Sardegna - Regie Patenti 18 luglio 1844 di Regno di Sardegna (1844)
Finito?
Chi vedeva lontano in tempi non sospetti
modificacari amici,
mi è tornato sotto gli occhi il caso di un utente che, proveniente da LiberLiber, nel luglio del 2007 anticipò il concetto di libro come unione di opere di più autori assai prima che noi sviluppassimo la possibilità di rendere nel progetto tale concetto: ecco la pagina.
A suo tempo intervenni spostando i vari componimenti (posti in sottopagine) in giro per il progetto, e infatti rimasi nell'imbarazzo quando venne ora di dare un luogo alla Prefazione del libro.
Oggi tutto questo è stato risolto! Pensate che grande risultato sarebbe poter chiudere il cerchio inserendo il libro che ha originato questa intuizione. C'è qualcuno che si presterebbe a importare la raccolta che di fatto è già trascritta su Wikisource ed effettuare la trascrizione inversa? - εΔω 11:56, 21 feb 2012 (CET)
- Hai detto un prospero! Altro che "di fatto già trascritto"! Io di trascritte ne vedo pochine. Possibile che mi sbagli ma sono oltre 500 pagine! Vedi qua [1] ed è pure scansionato maluccio specialmente le ultime pagine (indice - si vede che l'addetto ne aveva piene le tasche...) e qua e là con "foto" e non scansioni. Resa grafica tremenda, da croppare eccetera. A mano che non si decida che è fondamentale averlo nello scaffale, (imho) pollicino versino. :( Silvio Gallio (disc.) 11:05, 15 apr 2012 (CEST)
Indici multipli: come fare?
modificaCari amici,
è opportuno trovare una convenzione grafica in nsIndice per il caso (non più così isolato) di indici multipli, vale a dire opere la cui digitalizzazione si spande in più volumi ciascuno con il suo indice. Il caso più eclatante è Pensieri di varia filosofia e di bella letteratura divisi in sette pagine indice, ma nulla ci impedisce di citare Storia della letteratura italiana (De Sanctis) in due indici, o l'ancora da pubblicare Indice:I promessi sposi (1825) I.djvu.
Questi esempi riportano le tre soluzioni oggi presenti:
- Link a tutti i volumi sulla destra
- Link al volume precedente prima del pagelist e al volume successivo dopo il pagelist
- Link agli altri volumi dopo il pagelist.
Mi piacerebbe raccogliere qui sotto tutti i casi che richiedono tali link di raccordo, e leggere qualche commento che dia una preferenza per un metodo piuttosto che per un altro. Io ammiro il metodo "De Sanctis, ma avendolo impostato io mi rendo conto di non essere spassionato. Decidiamo e applichiamo in tutti i casi raccolti lo schema che paia più appropriato. - εΔω 23:22, 26 feb 2012 (CET)
C'è anche la soluzione vec, cioè un apposito campo "Volumi" che appare nel riquadro di intestazione. Candalùa (disc.) 23:31, 26 feb 2012 (CET)
- Altra soluzione quella della Divina Commedia in cassetti. La soluzione deve anche valutare l'esportazione in epub e pdf, ad esempio ho fatto un rapido test della divina commedia ed è stato esportato solo l'inferno, non so se per problemi di numero di pagine oppure dipende proprio dai cassetti. Tra i testi multi-indice c'è anche Storia della letteratura italiana (Tiraboschi) anche se per i momento è incompleto. --Luigi62 (disc.) 00:04, 27 feb 2012 (CET)
- Che dici, Luigi? Ho provato l'epub or ora e la Comedìa me la esporta tutta, da Nel mezzo del cammin di nostra vita fino a L'amor che move il sole e l'altre stelle. Candalùa (disc.) 00:10, 27 feb 2012 (CET)
- Hai proprio ragione, colpa dell'ora troppo tarda e del solito comportamento diverso (questa volta nei link) tra il plug-in di firefox e di Adobe Digital Edition. Comunque sopratutto la prima. --Luigi62 (disc.) 00:25, 27 feb 2012 (CET)
- Proporrei una commistione di elementi: utilizzare il metodo "De Sanctis" (Promessi sposi ha pressappoco lo stesso sistema) ma sulla destra nel box Sommario, così da non dover scorrere tutte le Pagine dell'edizione per passare al successivo volume: in pratica il campo volumi anziché nell'intestazione, nel Sommario; nella Storia della letteratura italiana, cliccando sul Volume I saranno visibili i corrispettivi capitoli (un po' come in Zibaldone, per capirci, ma senza cassetti). Chiaramente mi riferisco all'Indice; la Divina commedia non ha scansione a fronte, quindi o ho capito male o vi state riferendo ad ambo le situazioni. In tal caso in transclusione prediligo la struttura della Storia della letteratura..., mi sembra più completa ed esaustiva. Anche Iliade e Odissea, essendo opere in due volumi, potrebbero richiedere l'applicazione di uno dei sistemi sopra elencati.--Barbaforcuta (disc.) 20:03, 27 feb 2012 (CET)
- Barbaforcuta, ci stiamo riferendo agli Indici del NsIndice e basta. Iliade e Odissea presentano il problema opposto, cioè quello della agglomerazione di più volumi in un solo file djvu, e questo lo si è risolto facilmente con colori differenti per due pagelist successivi.
- Quando invece un'opera in più tomi è spezzata in più file djvu bisogna tener conto di un fattore importante: nel riquadro di destra, quello del sommario, andrebbe preferibilmente transcluso l'indice vero e proprio del volume (es. Indice:Storia degli antichi popoli italiani - Vol. II.djvu), e quanto premesso finora funziona fintantoché non confligga con indici preesistenti (i quali in alcuni casi come Indice:Poesie (Carducci).djvu sono molto molto più lunghi del pagelist).
- Da quel che sto capendo Barbaforcuta prevede una generalizzazione dellla soluzione "Zibaldone".
- A me continua a piacere la soluzione "De Sanctis" perché dà un senso di "sequenzialità" alla catena di volumi, ma se il problema fosse quello di non dover scrollare troppo sotto che ne direste di porre l'elenco dei volumi subito prima del pagelist, cioè un rovesciamento della soluzione di Indice:I promessi sposi (1825) I.djvu? - εΔω 20:25, 27 feb 2012 (CET)
- Proporrei una commistione di elementi: utilizzare il metodo "De Sanctis" (Promessi sposi ha pressappoco lo stesso sistema) ma sulla destra nel box Sommario, così da non dover scorrere tutte le Pagine dell'edizione per passare al successivo volume: in pratica il campo volumi anziché nell'intestazione, nel Sommario; nella Storia della letteratura italiana, cliccando sul Volume I saranno visibili i corrispettivi capitoli (un po' come in Zibaldone, per capirci, ma senza cassetti). Chiaramente mi riferisco all'Indice; la Divina commedia non ha scansione a fronte, quindi o ho capito male o vi state riferendo ad ambo le situazioni. In tal caso in transclusione prediligo la struttura della Storia della letteratura..., mi sembra più completa ed esaustiva. Anche Iliade e Odissea, essendo opere in due volumi, potrebbero richiedere l'applicazione di uno dei sistemi sopra elencati.--Barbaforcuta (disc.) 20:03, 27 feb 2012 (CET)
- Hai proprio ragione, colpa dell'ora troppo tarda e del solito comportamento diverso (questa volta nei link) tra il plug-in di firefox e di Adobe Digital Edition. Comunque sopratutto la prima. --Luigi62 (disc.) 00:25, 27 feb 2012 (CET)
- Che dici, Luigi? Ho provato l'epub or ora e la Comedìa me la esporta tutta, da Nel mezzo del cammin di nostra vita fino a L'amor che move il sole e l'altre stelle. Candalùa (disc.) 00:10, 27 feb 2012 (CET)
- Beh si è presa in considerazione la divina commedia che non ha nsIndice (è sempre meglio un'osservazione in più, non fa mai male) e inoltre la soluzione non credo abbia niente a che fare con l'esportazione in epub e pertanto la si possa valutare liberamente; smentitemi altrettanto liberamente se non è così, mi esprimo nella mia ignoranza. O forse si è considerata la soluzione in cassetti; in tal caso mi spiego meglio: NO, non prevedo una generalizzazione della soluzione Zibaldone (sebbene non la escluda), ma l'uso del metodo "De Sanctis" nel Sommario ove, certamente, verrà visualizzato l'indice vero e proprio del volume, ma darebbe la possibilità di cambiare volume e quindi l'indice visualizzato. Anche la soluzione di porre la sequenza di volumi subito prima del pagelist non mi dispiace del tutto, ma continuo a preferire la soluzione precedente.--Barbaforcuta (disc.) 21:01, 27 feb 2012 (CET)
Ad ogni modo: io comincerei intanto ad aggiungere il nuovo campo "Volumi". Poi si può decidere di mostrarlo dove si vuole. Candalùa (disc.) 20:57, 27 feb 2012 (CET)
- Ho provato ad aggiungere "Volumi" a Indice:Storia della letteratura italiana I.djvu, che ve ne pare? Già che c'ero ho colto l'occasione per un restyling del layout, in modo da dare all'immagine solo lo spazio che realmente le serve e lasciare tutto il resto a pagine e sommario. Candalùa (disc.) 11:50, 28 feb 2012 (CET)
- Mi piace molto.
- Approfitto del restyling.... abbiamo introdotto, parecchio tempo fa, l'uso di transcludere le pagine Indice nel campo Sommario. L'idea, ispirata da en.source, ha molti vantaggi ma un grande svantaggio: il tradizionale {{Indice sommario}} aveva una grafica più spartana, ma conteneva campi standard, facili da leggere e da analizzare via script per l'estrazione dei dati; i template RigaIndice hanno strutture variabili, e campi dati variabili. Impossibile farne un parsing decente. Che facciamo? Scegliamo la via della standardizzazione/grafica meno carina o la transclusione/maggiore difficoltà di usare i dati? Ci sarebbe una terza via: modificare il template {{Indice sommario}} in modo di migliorare la grafica (ottenendo, ad esempio, l'allineamento a dx dei numeri pagina e i puntini) e contemporaneamente avere i dati ben strutturati. --Alex brollo (disc.) 14:47, 28 feb 2012 (CET)
- E' quasi come l'avevo pensato, anzi meglio; per me se po' fa'! Alex, io opterei per la terza ipotesi, ma mi affido a voi che sapete quale sia la via più facilmente realizzabile.--Barbaforcuta (disc.) 21:16, 28 feb 2012 (CET)
- Piccolo appunto sul restyling: indice e sommario, in alcuni casi (al momento l'ho riscontrato su La Bibbia), si sovrappongono così come trascrizione e pagina scansionata in paginaPagina (sempre stessa opera); credo sia dovuto alla bassa risoluzione del mio pc.--Barbaforcuta (disc.) 23:50, 28 feb 2012 (CET)
- Dici questa bibbia? credo che metterò una nuova regola, "non si risponde a chi non fornisce il link alla pagina esatta in cui c'è l'errore" :-) Per forza, ci sono dentro dei bei width:300px, a basse risoluzioni la colonna si rimpicciolisce e i 300px non ci stanno più. Basta toglierli e va a posto. Candalùa (disc.) 00:15, 29 feb 2012 (CET)
- Pardon, pensavo non ci fossero possibilità di fraintendimenti dato che al momento è l'unica in fase di trascrizione. Sì, mi riferivo a quell'indice, ma anche alle singole paginePagina. Il punto è: come fare? Non sarebbe più comodo che la pagina si adattasse automaticamente allo schermo?--Barbaforcuta (disc.) 00:28, 29 feb 2012 (CET)
- Dici questa bibbia? credo che metterò una nuova regola, "non si risponde a chi non fornisce il link alla pagina esatta in cui c'è l'errore" :-) Per forza, ci sono dentro dei bei width:300px, a basse risoluzioni la colonna si rimpicciolisce e i 300px non ci stanno più. Basta toglierli e va a posto. Candalùa (disc.) 00:15, 29 feb 2012 (CET)
- Piccolo appunto sul restyling: indice e sommario, in alcuni casi (al momento l'ho riscontrato su La Bibbia), si sovrappongono così come trascrizione e pagina scansionata in paginaPagina (sempre stessa opera); credo sia dovuto alla bassa risoluzione del mio pc.--Barbaforcuta (disc.) 23:50, 28 feb 2012 (CET)
- E' quasi come l'avevo pensato, anzi meglio; per me se po' fa'! Alex, io opterei per la terza ipotesi, ma mi affido a voi che sapete quale sia la via più facilmente realizzabile.--Barbaforcuta (disc.) 21:16, 28 feb 2012 (CET)
- bene l'idea di Edo, ma lo spazio volumi si può spostare sulle Pagine dell'edizione, invece che sul sommario? --Xavier121 13:22, 12 apr 2012 (CEST)
- certo che si può, se non ci sono obiezioni procedo a farlo. Candalùa (disc.) 19:11, 13 apr 2012 (CEST)
Un'altra relazione uno a molti
modificaSiamo incappati ancora in una relazione uno a molti: un'opera ns0, più indici. No problem: il caso è identico a quello un'opera, più autori, e la soluzione è altrettanto percorribile, appesantendo ancora un po' il tl Intestazione (tanto, poco più o poco meno...) e ritoccando/riscrivendo gli script creatori di linguelle "Fonte". Mi parrebbe bello che nella pagina principale ci fossero più linguelle Fonte, una per ciascun indice, mentre nelle sottopagine ci fosse solo la linguella/max 2 linguelle che puntano all'indice/max due indici da cui la sottopagina proviene. Io mi occuperei del template, se Candalua avesse un briciolo di tempo per gli script, sarebbe una gran bella cosa: occorre operare su Common.js, e la cosa mi mette in agitazione. --Alex brollo (disc.) 15:09, 12 apr 2012 (CEST)
Ma che problema c'è se l'opera punta solo al volume I e non a tutti i volumi? Mi sembra una complicazione non realmente necessaria... Tanto dall'indice puoi anche navigare tra i volumi, solo con un clic in più. E poi, ovviamente non possiamo mettere 20 linguelle "Fonte" per i 20 volumi di Galileo. Quindi in quel caso che facciamo? Mettiamo solo i primi 2? e perché proprio 2...? Candalùa (disc.) 19:08, 12 apr 2012 (CEST)
- Il caso 2 linguelle (per le sottopagine) copre il rarissimo caso (succede in OPAL) che un capitolo caschi alla fine di un djvu e all'inizio del successivo e quindi abbia la sua fonte in due distinte pagine Indice.
- Ma mica sono convinto! Per risolvere la cosa, e assegnare a ogni opera il suo giusto link fonte, basta creare una pagina generale ns0 di "indice", non proofread e quindi senza link a pagine Indice, che contenga i link a tante pagine principali ns0 quante sono le pagine Indice; queste avranno, per definizione, un rapporto 1/1 con la loro fonte. I due sistemi possono convivere, se {{Intestazione}} è truccato in modo di "reggere" un numero ragionevole (max 5) di link a diverse pagine indice. Per il caso Galileo chiederemo a Paolini. :-) --Alex brollo (disc.) 19:20, 12 apr 2012 (CEST)
Boh, continua a sembrarmi uno sforzo sproporzionato ai vantaggi che se ne possano avere. I testi di OPAL sono smezzati solo per avere file più piccoli, per quello non sempre rispettano la divisione in volumi... andrebbero piuttosto riuniti. Candalùa (disc.) 22:29, 12 apr 2012 (CEST)
- La penso come Candalua: soprattutto riguardo all'unione dei volumi spezzati "artificialmente". - εΔω 07:21, 13 apr 2012 (CEST)
- Concordo, ma aggiungo: come ci comportiamo in transclusione? Una pagina che riunisca tutti i volumi come De Sanctis (per indici lunghi si potrebbero usare i cassetti, come nel caso Galileo) o basta averne una per singolo volume? Mi sembrerebbe ovvia la prima, ma non vorrei che in indici lunghi, questa sia appesantita da troppi link a indici diversi e che i cassetti possano dare problemi per l'esportazione in epub.--Barbaforcuta (disc.) 17:00, 17 apr 2012 (CEST)
- Ok. Ho cominciato a usare il campo Volumi (era ora). Piccolo accorgimento tecnico usato nel nuovo Canzoniere, in cui Xavier ha fatto un magnifico lavoro di "ricostruzione" di quattro indici separati in modo logico riorganizzando le pagine originalmente suddivise in 4 pdf in modo illogico: invece di ripetere il codice indice per indice, nel campo Volumi degli indici II-IV ho transcluso la section Volumi del primo indice; con il vantaggio che basta modificare il campo "sorgente", sul I indice, e tutti gli altri si adeguano. In teoria, il contenuto dello stesso campo potrebbe essere richiamato, per transclusione, anche sulle pagine in ns0; dovunque si voglia. --Alex brollo (disc.) 08:11, 13 apr 2012 (CEST)
- Ricordo che anche i nostri testi sono smezzati per ragioni di spazio (100MB Commons): io non rinuncio alla qualità delle immagini per il malloppone. --Xavier121 15:12, 13 apr 2012 (CEST)
- Certo, anche questo è giusto; però a patto che vengano smezzati seguendo per quanto possibile le divisioni logiche del testo, senza cioè interrompere a metà un capitolo (era quello il caso in cui Alex voleva avere la doppia linguetta). Candalùa (disc.) 14:53, 14 apr 2012 (CEST)
- Ricordo che anche i nostri testi sono smezzati per ragioni di spazio (100MB Commons): io non rinuncio alla qualità delle immagini per il malloppone. --Xavier121 15:12, 13 apr 2012 (CEST)
Sommari in pagina indice: sotto con il lavoro sporco
modificaCari amici, dato che il consenso si è solidificato intorno alla soluzione "De Sanctis", finalmente liberatomi delle Frascherie di Antonio Abati (ci sono voluti quasi cinque anni!) procedo a una passata di adeguamento a tutti gli indici multipli, che non sono poi tanti.
Quello che in effetti è un lavoro assai più importante e che richiede pazienza e tempo è la costruzione dei sommari nel pannello di destra degli indici: io lo trovo un lavoro importantissimo in quanto permette al lettore di orientarsi e andare a colpo sicuro a partire dalla pagina indice. Prima di partire però mi piacerebbe sapere
- Sarò solo o qualcuno vuole spalleggiarmi?
- Finora abbiamo due modalità:
- La transclusione di indici già presenti in pagine del libro
- La creazione di indici a mano tramite i template:Indice sommario
- A questo punto dato che non tutti i libri conengono dei sommari le continuiamo ad usare entrambe o vogliamo generalizzare la prima?
- A che punto è il lavoro di standardizzazione del template sopracitato e qual è il suo uso corretto? Prima di modificarne manualmente migliaia di ricorrenze vorrei un chiarimento qui. - εΔω 19:37, 13 apr 2012 (CEST)
- Chiedo io un chiarimento preliminare.
- Siamo tutti d'accordo che Indice sommario debba avere un comportamente alla en.source, ossia puntare su Ns0 (titolo) e su nsPagina (numero pagina)?--Alex brollo (disc.) 08:37, 14 apr 2012 (CEST)
- per il doppio puntamento alle en.source e generalizzerei l'uso del template:Indice sommario (anche per i testi privi di un indice) --Xavier121 13:28, 14 apr 2012 (CEST)
- per il doppio puntamento - εΔω 15:36, 14 apr 2012 (CEST)
- per il doppio puntamento e per generalizzare l'uso del template Indice sommario.--Barbaforcuta (disc.) 00:15, 15 apr 2012 (CEST)
Non sarebbe possibile fare entrambe le cose? Cioè, usare sempre il template, ma se il libro è dotato di sommario, porre il template direttamente nelle pagine del libro, e trascluderle nella pagina indice. Se invece il libro non ha sommario, crearlo a mano nella pagina indice sempre con lo stesso template. Candalùa (disc.) 13:41, 14 apr 2012 (CEST)
- :
Volevo uniformare, macapisco la praticità della tua proposta... --Xavier121 13:46, 14 apr 2012 (CEST) - Sto effettivamente cercando di capire i pro e i contro di una radicalizzazione.
- Imporre i soli indici con template aumenta l'uniformità e l'eventuale raccolta di dati via bot
- Chiaramente imporre i soli indici con template, soprattutto quando si ha a che fare con sommari mastodontici o con sommari dal contenuto informativo pregevole (ad esempio quelli di Sotto il velame) richiede un lavoro aggiuntivo non indifferente.
- D'altronde se l'impellenza di uniformità non è cruciale (ma su questo attendo appunto feedback da chi ha lavorato sul template) la soluzione "et et" invece che "aut aut" è sempre la più comoda. Chiedo lumi ad Alex. - εΔω 15:34, 14 apr 2012 (CEST)
- I template RigaIndice (che sono il fondamento degli indici originali nelle pagine) sono delle entità malefiche, a volerli adattare per bene, con il nostro stile, alle millanta varianti tipografiche originali. A occhio, il tentativo di renderli abbastanza stantardizzati nel contenuto dei dati per permettere un data retrival completo analogo a quello che consente il nuovo Indice sommario è un'impresa terribile.
- L'unico compromesso che vedrei praticabile (anche se non facile) è di associare agli indici originali transclusi una "sezione dati" che regga la transclusione (e quindi, non basata su section), analizzando poi, come "base dati", non il codice wiki (in cui si trova il misero codice di transclusione delle pagine e vonde) , ma il codice html della pagina indice. Farlo, senza complicare enormemente le cose, è una bella sfida; ma non è detto che sia impossibile. La sfida non sta nel fatto di aggiungere i dati, ma nel fare in modo che lo stesso dato non debba mai essere aggiunto da un utente due volte. Proverò a pensarci; ma sono leggermente pessimista sulla semplicità. Vorrei inoltre schivare accuratamente un lavoro via bot; per questo tipo di cose, non mi fido. --Alex brollo (disc.) 17:38, 14 apr 2012 (CEST)
- Alex, mi sa che stiamo cercando di inserire un elefante entro una bottiglia facendocelo passare per il collo (della bottiglia XD) - εΔω 17:55, 14 apr 2012 (CEST)
Uhm, mi rendo conto che non è facile. Allora direi che è meglio rinunciare alle pagine e standardizzare tutto col template. Candalùa (disc.) 18:25, 14 apr 2012 (CEST)
- Attenzione: i nuovi modelli che sto studiando NON sono fatti per essere letti da un bot, ma direttamente da javascript guidato da un utente. Ho scoperto che quasi ogni cosa che si basi su letture di pagine e uso dei dati contenuti in tali pagine può essere fatto via "giocattolo". Scoperta dell'acqua calda per geek veri come Candalua e Samuele; per me, un mondo fatato che si dischiude.
Non ho rinunciato del tutto all'ipotesi di lavorare ancora su RigaIndice per renderlo più adattabile, e niente impedisce di aggiungergli ancora qualcosa per fargli generare, se transcluso in pagina Indice, i due link vs. ns0 e nsPagina. Finora mi aveva bloccato l'incertezza sul fatto che questo doppio link fosse gradito. Ma adesso che ho il via libera, ci lavorerò. Indice per le prove: Indice:Beccaria - Opere, Milano, 1821.djvu, con un bell'indice originale complesso ma abbastanza semplice come formattazione, infatti è bastato un piccolo adattamento del RigaIndice "originale". --Alex brollo (disc.) 16:32, 16 apr 2012 (CEST)
Definiamo bene il template indice sommario
modificaCari amici,
ieri ho concluso la prima parte dell'intervento: ho creato i link ai volumi negli indici multipli (e ho cancellato due "template sommario" creati da alex per Zibaldone e Promessi Sposi). Ho scoperto due indici di pdf he erano duplicati di indici di djvu e Ho volutamente lasciato da parte le riviste (Scientia e Rivista di Numismatica) che presentano un indice dei volumi in evoluzione e che probabilmente richiederanno pagine apposite in ns0.
Questa però era la parte semplice: ora resta il pesce grosso, o il lavoro sozzo se così si vuol chiamarlo: il ripasso di tutti i sommari per mettere i sommari veri e propri dove non ci sono e aggiornare quelli già presenti.
Ribadisco due punti prima di aver chiarito i quali non mi è il caso che mi muova:
- C'è qualcuno che vuole darmi una mano?
- La sintassi che compare in Template:Indice sommario/doc è da ridefinire molto attentamente. Mi spiego
- Il problema "indici del libro transclusi da pagine del libro vs. uso sistematico del template" può continuare ad essere discusso: nel frattempo possiamo occuparci della gran massa degli indici senza alcun sommario.
- A mio parere i parametri devono essere funzionali all'uso: riflettendoci un attimo noto che
- a suo tempo iPork aveva creato i parametri per i colori allo scopo di creare una corrispondenza tra l'elenco delle pagine e il sommario... il tag pagelist ha vanificato tale bell'espediente
- recentemente Alex ha aggiunto dei parametri finalizzati ad permettere la transclusione in ns0 di intervalli di pagine tramite bot... ma di fatto questo prevede una organizzazione "a priori" del testo (ad esempio alcuni nomi di section ma non solo) che non sono nella logica "multicontributore a lungo termine" del progetto e che caricano il template di funzioni non totalmente pertinenti al nome del template.
Termino la lunga premessa: di fatto i parametri possono anche rimanere come sono: se non compilati non disturbano nessuno. Quello che mi preme è capire cosa vogliamo che contenga il template e a che scopo....
...No, a me quel che preme è che prima di partire con migliaia di template chiunque possa contare su uno schema affidabile come ad esempio
{{IndiceSommario|primadeltitolo=|titolocapitolo=|Numpagina=|delta=|ecc=}}
o
{{IndiceSommario||||<...aggiungi sbarrette che mancano...>}}
Ad Aubrey chiedo di indicarci se i parametri di questo template sono utili per estrarre dati o puntatori precisi (in un... che so, "sommario generale di tutti i libri") bibliograficamente utili, e quale nome dare ad essi: non dimentichiamo il versante "biblioteconomico" del nostro progetto. - εΔω 09:19, 15 apr 2012 (CEST)
- Edo, io adoro i lavori lunghi e noiosi, se qualcuno mi spiega dettagliatamente cosa devo fare. Se posso essere utile contami pure. Lagrande (disc.) 07:38, 16 apr 2012 (CEST)
- Su Indice:Gerusalemme liberata I.djvu e Indice:Gerusalemme liberata II.djvu ho applicato i "nuovi ritrovati" (campo Volumi, nuova versione di {{Indice sommario}}) con la maggiore semplicità possibile. Non mi pare male. Date un'occhiata: ho rinunciato a tutti i campi per ora inutili salvando il "doppio link" (utilizzando solo nome, titolo, from e delta). Anzi, anche il campo to= può essere trascurato senza imballare il template. I dati sono puliti, intuitivi, facili da parsare, e sono sufficienti a ricavare gli indici delle pagine in ns0 (i template {{testo}}) e gli {{IncludiIntestazione}} con eventuale automazione; non sono sufficienti a compilare in automatico il tag pages, ma pazienza. --Alex brollo (disc.) 08:43, 17 apr 2012 (CEST)
- Segnalo un'eccellente idea di Silvio, nella mia pagina di discussione, per ridurre drasticamente la difficoltà di riempire un campo Sommario come si deve. L'idea è quella di preparare uno schema di tabella Excel, con una bella serie di campi forniti di nome chiaro; e mettere nelle celle i valori. Dopodichè, un copiaincolla da excel (o analoghi: OO-Calc va benissimo), seleziona, click con un tool che sarebbe una specie di tableMaker() modificato, fatto. Niente impedisce di sistemare i valori anche a mano, separandoli con un tab, dopodichè la stessa cosa con lo stesso tool; ma con excel si avrebbe una visualizzazione e una possibilità di edit molto più comodi. Che ne dite? La tabella excel vuota potrebbe essere benissimo caricata su un sito esterno pubblico (es. penso che sappiate che ogni file messo nella cartella pubblica di un qualsiasi DropBox è raggiungibile e scaricabile via semplice URL: è esattamente come se stesse su un server).
- Una cosa da venti secondi: ecco il file excel vuoto (minimalista) sul mio dropbox: http://dl.dropbox.com/u/7247684/schema_sommario.xls --Alex brollo (disc.) 16:40, 17 apr 2012 (CEST)
- Edo, io adoro i lavori lunghi e noiosi, se qualcuno mi spiega dettagliatamente cosa devo fare. Se posso essere utile contami pure. Lagrande (disc.) 07:38, 16 apr 2012 (CEST)
(rientro a sx) Spinto da Edo, dico un paio di cose sul sommario, interropendo il mio wikisinghiozzo. Quelli del sommario possono essere definiti metadati strutturali. In sè, sono importanti, come tutti i dati, per avere un'idea di come è formato un libro, e quindi anche ai fini della conservazione ecc. Ovviamente, servono ai lettori e nel nostro caso ai rilettori.
Come al solito, su wiki non ci sono standard di sorta quindi il data retrieval che sarebbe bello e importante viene fatto artigianalmente, e finchè non ci sarà Wikidata (che per me è come il Sacro Graal) credo non ci sarà niente da fare. Ovviamente, manterrei il template in maniera tale che a posteriori uno script possa effettivamente passare e recuperare dati, ma ci penseremo a tempo debito. Fin qui, ho detto solo cosine banali
L'ultima cosa è la più difficile ma è anche la più interessante: questi dati potrebbero servire a formare il TOC dell'ebook corrispondente. Io so che Calibre o Sigil hanno semplici funzioni per creare il TOC, che poi non è altro che una pagina XML con dei link. Però, ecco, lo script epub potrebbe interfacciarsi con il template e fare il toc, volendo. Ricordiamocelo, quando magari quelli di Garamond tornano all'attacco... Aubrey McFato 23:38, 22 apr 2012 (CEST)
Ci siamo quasi
modificaQuest'ultima soluzione (tabella + script) mi sembra aver portato la discussione a un buon punto: provo a sintetizzare e a passare agli aspetti organizzativi-operativi.
In pratica, lo schema tipico dei template Indice sommario sarà
{{Indice sommario| nome = | titolo = | from = | delta = }}
In cui
- nome = nome completo della pagina in ns0 dove compare il testo (es: "testo/sottopagina/sottosottopagina")
- titolo = titolo della pagina in ns0 (quello che si inserisce di norma nel template:IncludiIntestazione")
- from = numero pagina del file djvu dove inizia il testo a cui punta la voce di sommario
- delta = scostamento della pagina indicata nel sommario rispetto a quella del file djvu indicata nel parametro precedente
Se l'ho capito io non dovrebbe essere così difficile.
Ora la parte macchinosa: gli aspetti operativi.
- Intanto direi di lasciar da parte per successivo ripasso
- i sommari dove sono transclusi già quelli della parte cartacea (es:Indice:Le Vicinie di Bergamo.djvu)
- i sommari di testi non ancora transcluse
Togliendo anche i testi da una-dieci pagine senza un vero sommario ci restano circa cinquecento indici. Di essi
- o i sommari sono già compilati e bisogna operare sul predisposto
- o i sommari mancano e sono da compilare
Prendiamo l'ultimo caso (quello in cui non c'è alcun appoggio da cui partire): Se ho capito bene ci sono due tipi di sommario, quelli facili e quelli difficili
Per quelli facili (libri il cui sommario è abbastanza breve da compilare):
- In due tab distinti mi apro l'indice e le pagine del libro (un terzo tab dovrebbe permettere di tenere d'occhio la versione transclusa in ns0 per copiarne i titoli delle eventuali sottopagine)
- Cerco se c'è un sommario in inizio o fondo libro e se lo trovo lo prendo a modello
- In ogni caso mi passo pagina per pagina il djvu o per verificare se i numeri di pagina del sommario trovato sono corretti o in assenza di sommario per sapere dove sono le pagine (capitoli, poesie, tavole ec.) da indicare in sommario.
- Compilo passo passo il sommario nella pagina indice (se poi il libro raccoglie molte poesiole sparse in giro per il progetto la vedo piuttosto acida)
Per quelli difficili (libri lunghi e/o dal sommario molto lungo)
- In una finestra tengo l'indice, e accanto tengo un file di foglio elettronico da compilare
- Seguo le fasi 2 e 3 del punto precedente (cerco un sommario nel djvu e mi passo il djvu per compilare il sommario)
- Invece di compilare direttamente il sommario in nsIndice lavoro sul foglio elettronico dove posso accelerare le azioni di copia in serie di elementi o posso gestire meglio la visualizzazione senza badare a doppie graffe o parametri vari
- Preparata la tabella la copio in una pagina wiki e chiedo a uno script di trasformarla in un sommario che poi incollerò in nsIndice
Ho capito bene? C'è un diagramma di flusso più pratico di quello che ho posto qui? Ricordando che il lavoro è lungo e meticoloso vorrei che quelli più pratici di me (ci vuol pochissimo, lo siete tutti) mi aiutino a elaborare un sistema che faciliti tutto il facilitabile... --εΔω 18:11, 17 apr 2012 (CEST)
- Se è così non è difficile, l'ho capito persino io ... :) Lagrande (disc.) 07:33, 18 apr 2012 (CEST)
- La parte più dura del lavoro è recuperare titolo e nome, che già esistono: per i campi from e delta con il divu si fa in fretta. Ora, perchè farlo a mano? I link esistono già: data una pagina, è possibile ricavare nome e titolo del testo collegato. Ci sono i casi ambigui (pagine transcluse in più di due testi) ma il caso di una pagina ransclusa in un testo solo non è ambiguo, e nemmeno il caso di pagine transcluse in due testi, dove invariabilmente il testo ricercato è il secondo. Uno script può farcela.
- Altra via. Ideando la nuova versione di Indice sommario, son stato ben attento a prevedere campi con una relazione 1:1 con le voci dell'indice del testo in ns0. Ergo, il campo nome è quasi esattamente il primo parametro del template testo (basta convertire l'indirizzo da relativo a assoluto) e il campo titolo, se diverso dall'ultimo elemento del campo nome, è il secondo parametro del template testo. Io ho già usato questa equivalenza all'inverso (predisposizione dell'indice in nso dai template Indice sommario), qui si tratterebbe di fare l'inverso: impostare la tabella excel copiaincollando i template testo, sistemarli (chi sa programmare excel con qualche funzione testo sarà favorito), aggiungere il dato alla colonna from aiutandosi con il file djvu, controllare che delta resti costante, fine. --Alex brollo (disc.) 13:32, 18 apr 2012 (CEST)
- Caro Alex, ho intuito alla prima lettura circa una metà del messaggio... quel che maggiormente mi rincuora è che quanto avevo scritto sopra sostanzialmente non è sbagliato e che Lagrande lo abbia capito (credimi, ho impiegato diverso tempo a formulare quel diagramma di flusso proprio pensando a Lagrande).
- In definitiva (cercherò di capire il messaggio di Alex mentre eseguo il lavoro) prendendo ad esempio indice:Olanda.djvu occorre tener sottomano distintamente
- Indice:Olanda.djvu; pagina:Olanda.djvu/1 per sfogliare il libro; Olanda in ns= per l'indice e degli strumenti (Blocco note/Excel/carta igienica) su cui compilare i ati con cui creare delle simpatiche liste di template:Indice sommario...
- Pensandoci bene, che ne direste se compilassi una lista da sfoltire man mano che procede il lavoro? In tal modo se volesse il cielo che si lavorasse in squadra si potrebbe scegliere liberamente a quali indici dedicarsi. Sì, mi accorgo di avere una source-deformazione per la creazione di liste: dovrò farmi visitare da uno strizzacervelli). - εΔω 15:28, 18 apr 2012 (CEST)
- Io apprezzo moltissimo le liste. Edo, per favore, non è che faresti un indice piccolino piccolino per me, magari un libercolo da venti pagine, così me lo tengo sott'occhio come esempio finchè non ci prendo mano? Sempre se è possibile logicamente. Grazie mille. P.S. Grazie a tutti voi per gli sforzi che fate per far capire anche a me, io ci terrei tantissimo a collaborare come si deve, e non solo a rileggere le pagine. Lagrande (disc.) 16:46, 18 apr 2012 (CEST)
- Mi raccomando: prepariamo anche la lista delle liste. :-P
- Mode serious on. Ieri ho pasticciato un po' in excel, l'idea è di copiaincollare l'elenco dei template Testo e fargli estrarre, in due colonne, nome e titolo. Excel ha funzioni stringa scarse e scomodissime; per non parlare delle funzioni condizionali indispensabili per gestire diversamente il template testo a due parametri da quello a un solo parametro. :-(
- Se c'è uno che manovri excel veramente bene per queste cose, lo invito a operare .-)
- Io potrei farcela accettando un piccolo compromesso: dopo copiaincollato l'elenco dei template testo così come sono, aggiungere sempre a mano il secondo parametro al template. E' un compromesso accettabile? Velocizzerebbe parecchio la compilazione della tabella: nel caso comune che delta sia costante, ci sarebbe solo da compilare una colonna, quella from (pagina djvu iniziale della sezione/capitolo). --Alex brollo (disc.) 11:33, 19 apr 2012 (CEST)
- Ecco il nuovo file excel su dropbox: http://dl.dropbox.com/u/7247684/schema_sommario.xls
- E' precompilato con Georgiche. Notate il nome della pagina principale nella cella A1, necessario a risolvere gli indirizzi relativi. Notate che tutte le voci nella "zona grigia" derivano dal semplice copiaincolla dei template testo, a cui però è stato aggiunto, aimè, il secondo parametro (titolo). Provatelo; il sistema di gestione stringhe di Excel fa schifo, e andare oltre (soprattutto evitando di aggiungere a mano il secondo parametro) va oltre le mie possibilità. :-( --Alex brollo (disc.) 09:34, 20 apr 2012 (CEST)
- Se è così non è difficile, l'ho capito persino io ... :) Lagrande (disc.) 07:33, 18 apr 2012 (CEST)
Mi aggiungo volentieri nel dare una mano, ma sarebbe utile un modello che comprenda tutti i casi che vengono in mente (o più di uno se non ciò non fosse possibile; Olanda è papabile a questo proposito?) onde evitare di chiedere aiuto spesso: se il dubbio è stato già risolto altrove perchè perderci altro tempo; a questo proposito una pagina dove raccogliere i casi risolti, non può che facilitare il lavoro. Dopo la guida a prova di stupido, una a prova di Barba. :P
Ah una lista dove raccogliere i testi man mano che vengono sistemati con accanto l'utente che se ne sta occupando, permetterebbe di non confliggere e di velocizzare il compito (quindi non è necessario inserire tutti i testi in una volta, magari una decina liberi da "scegliersi" non appena si è arrivati alla fine con la sistemazione di un indice).--Barbaforcuta (disc.) 16:34, 20 apr 2012 (CEST)
- Ottima idea, sono d'accordo, è meglio sapere chi si occupa di cosa. Lagrande (disc.) 11:46, 21 apr 2012 (CEST)
- Visto che js è moooolto più maneggevole di excel per maneggiare stringhe, "provo il colpaccio" di normalizzare (aggiungere il secondo parametro) i template testo prima di copiaincollarli su excel. L'idea è (se c'è una lista di template testo in pagina principale ns0): entrare in modifica, selezionare, cliccare. Poi copiaincollare su excel e lavorare su excel e sul file djvu aperto con djview.
- La lista c'è o va costruita? --Alex brollo (disc.) 16:56, 21 apr 2012 (CEST)
- Nel dubbio l'ho preparata, qui: Progetto:Trascrizioni/Indici senza sommario.
- L'estrazione è stata fatta via bot, leggendo le 634 pagine indice e escludendo quelle che contenevano un template {{tl:Indice sommario}} oppure una transclusione di pagina Pagina; sono 336 pagine Indice. Direi di aggiungere sempre almeno un singolo {{tl:Indice sommario}} in modo da facilitare le eventuali ricerche future. --Alex brollo (disc.) 19:13, 21 apr 2012 (CEST)
Si parte
modificaCome ho scritto in Discussioni progetto:Trascrizioni/Indici senza sommario, riesco a lavorare più velocemente sui testi (per lo più ferroviari) che conosco e di cui ho il djvu nella pancia. Anche perché da qualche giorno la banda è piuttosto stretta e le "anteprime" -con le immagini- sono una sofferenza. Quindi -con sommo dispiacere- ho rovinato il lavoro di suddivisione di Alex. Però se si mette il "Fatto" capisco perfino io... Suggerirei che in alto qualcuno aggiunga alcuni link a testi-esempio, quelli più articolati. Quelli di poche pagine e comunque il cui Sommario sarebbe di uno o due item sono piuttosto ovvi. Meno ovvi certi altri. Per esempio le Convenzioni, i Capitolati eccetera vanno sommariati per articolo? (Non credo ma alcuni testi di tipo legale sono piuttosto lunghetti...) Grazie! Silvio Gallio (disc.) 09:57, 22 apr 2012 (CEST)
- Ho provato a farne due: Indice:Del_danno_che_avverrebbe_allo_Stato_Pontificio.djvu e Indice:Roma_sotterranea_cristiana.djvu. Se mi confermate che vanno bene, vado avanti. Grazie mille. Lagrande (disc.) 21:07, 22 apr 2012 (CEST)
- OK Lagrande! bene così. Roma sotterranea cristiana l'ho rivisto, "spezzandolo" in capitoli, ma è stato facilissimo adeguare il campo sommario. Unica osservazione: non serve la section="Sommario": probabilmente ti ha tratto in inganno la cosiddetta "area dati" visibile con il tool di visualizzazione codice pagina :-). --Alex brollo (disc.) 23:48, 22 apr 2012 (CEST)
- Note generali
- il delta corrisponde alla differenza algerica numero di pagina djvu - numero di pagina cartacea; quindi: pagina djvu 10, pagina carta 2: delta= 10 - 2 =8; pagina djvu 3, pagina carta 225 (succede!): delta= 3 - 225 = -222
- se numero di pagina cartacea non è un numero arabo, ma un scritta o un numero romano, in delta mettere il "numero di pagina cartacea" come tale. Es. pagina djvu 10, pagina cartacea iv: delta = iv --Alex brollo (disc.) 06:47, 23 apr 2012 (CEST)
- suddivisione in sezioni/capitoli: io sono fautore di una suddivisione abbastanza spinta, ma in medio stat virtus. Nel dubbio, lasciate una nota a fianco dell'indice problematico in Progetto:Trascrizioni/Indici senza sommario (lasciatela anche se c'è qualcosa da annotare non strettamente riguardante la compilazione del Sommario; io lo sto facendo; usiamo questa ripassata come ripassata generale). Usate anche liberamente e largamente la pagina di discussione Discussioni progetto:Trascrizioni/Indici senza sommario, ma attirate l'attenzione di qualcuno se le risposte tardano.
- Ho aggiunto al volo (in fretta!) un po' di doc alla pagina del template {{Indice sommario}}: mancano gli esempi ma c'è il link a dove trovarli. Datemi feedback!
- Edo: dacci feedback generale, capo! :-) --Alex brollo (disc.) 07:33, 23 apr 2012 (CEST)
- OK Lagrande! bene così. Roma sotterranea cristiana l'ho rivisto, "spezzandolo" in capitoli, ma è stato facilissimo adeguare il campo sommario. Unica osservazione: non serve la section="Sommario": probabilmente ti ha tratto in inganno la cosiddetta "area dati" visibile con il tool di visualizzazione codice pagina :-). --Alex brollo (disc.) 23:48, 22 apr 2012 (CEST)
- Ho provato a farne due: Indice:Del_danno_che_avverrebbe_allo_Stato_Pontificio.djvu e Indice:Roma_sotterranea_cristiana.djvu. Se mi confermate che vanno bene, vado avanti. Grazie mille. Lagrande (disc.) 21:07, 22 apr 2012 (CEST)
Magari fosse così semplice col delta. Ci sono impazzito ieri e ci sto impazzendo adesso. Ora, io sono poco bravo in matematica come in un sacco di altre cose. Però una somma algebrica so cos'è. Peccato che ci siano anche altri fattori. Indice:Di alcuni sepolcri della necropoli Felsinea.djvu è un esempio piccolo e perfetto ma la stesa difficoltà l'ho avuta con altri indici. Pagine bianche a gogò, pagine senza numero (ma va bene, si sottrae da quelle successive, immagino), un bel 8=1 in pagelist che evidentemente sballa i calcoli. La pagina djvu10 qualsiasi delta ci metta (con la regoletta sopracitata) mi dà valori strani e addirittura vengono emesse cose così: [[Pagina:{{{2}}}|{{{3}}}. {{{4}}}]]. È chiaro che è "colpa" mia; cionondimeno sono fermo e mi devo accontentare di cose semplici da una riga. Sorry. L'ho sempre detto che sono un manovale e nessuno mi credeva :) Però non ditemi che QUI è spiegato chiaramente... --Silvio Gallio (disc.) 08:18, 23 apr 2012 (CEST)
- Se qualcosa produce un errore e non ne vieni fuori, SALVA la situazione di errore e segnalalo come annotazione a fianco dell'Indice in elenco: mi piacciono gli errori! E' dagli errori che si impara ("apprendimento per tentativi ed errori": è la mia specialità, cerco di fare più errori possibili... ) :-) --Alex brollo (disc.) 09:00, 23 apr 2012 (CEST)
- Meglio ancora: visto l'errore lo si salva e si annulla subito la modifica. L'errore è salvato in cronologia e al contempo non presentiamo a tutti le nostre magagne. εΔω di frettissima. - 09:25, 23 apr 2012 (CEST)
- Meglio ancora: visto l'errore lo si salva e si annulla subito la modifica. L'errore è salvato in cronologia e al contempo non presentiamo a tutti le nostre magagne. εΔω di frettissima. - 09:25, 23 apr 2012 (CEST)
- Proposta eccellente (perchè penso sempre a metà? :-( ) --Alex brollo (disc.) 09:46, 23 apr 2012 (CEST)
- Beh oggi non ho tempo per impazzire. Pero la Necropoli in Sommario (Ad esempio)11-7=18. Immagino che l'errore sia altrove ma per un novellino è una belle seccatura. OK Salvo con l'errore ma chi sa ci metta le mani. Ci faccio una figuraccia :)) Silvio Gallio (disc.) 09:39, 23 apr 2012 (CEST)
Fatto come dice Edo...Silvio Gallio (disc.) 09:43, 23 apr 2012 (CEST)
- Succede di incastrarsi :-)
- In necropoli, ma prima pagina cartacea è a pagina djvu 11 e ha il numero 4. Delta = Pagina djvu 11 - pagina cartacea 4 = 7. Stessa cosa si ricava dall'exoterico 8=1 di pagelist: 8 - 1 = 7. --Alex brollo (disc.) 11:03, 23 apr 2012 (CEST)
Alex, che fosse 7, il delta era chiaro perfino a me. Però il marchingegno faceva tutto da solo; io alla pagina 11 ho messo delta = 7 e sul sommario tutto a destra non dava 4 si leggeva 18! 'Naltra volta lo lascio lì. (po' forse (certo) facevo altri sbagli ma questo, no Eh!--Silvio Gallio (disc.) 12:11, 23 apr 2012 (CEST)
Esperienza di lavoro
modificaOggi ho provato un po' di indici "facili" e siccome ho trovato una metodologia di lavoro un pizzico più pratica la riporto qui:
- Apro in due tab l'indice e il testo transcluso in ns0
- Preparo per bene il template da incollare più volte (nel caso di Indice:Un giovinetto di Canzano.djvu ho preparato {{Indice sommario| nome = Un giovinetto di Canzano/| titolo = | from = | delta = 4}} dove il nome del testo in ns0 e il delta sono costanti)
- Qui la novità: muovendomi tra le sottopagine del testo in ns0 posso vedere
- Il nome della sottopagina da porre nell'indice
- Il titolo che tale sottopagina ha nel libro
- ponendo il mouse sul numero di pagina posto alla sinistra del testo transcluso ho contemporaneamente nella barra di stato il link alla pagina del nsPagina (dunque posso verificare tramite il suo numero il delta)
Quindi aggiorno il sommario, a memoria o a suon di copincollaggi, senza passare dal nsPagina (come temevo inizialmente). - εΔω 17:25, 23 apr 2012 (CEST)
- Io mi appoggio parecchio su excel. Ma in modo "creativo", soprattutto nei casi terribili come Indice:Apicius Coelius.djvu. Chi si muove su Excel con sufficiente agilità, faccia un piccolo sforzo iniziale.... --Alex brollo (disc.) 20:14, 23 apr 2012 (CEST)
Quando crearanno Wikidata per Wikisource (programmato per il 2015) sarò un uomo felice... Qualcuno ha pensato che a creare questi template, poi sarebbe possibile istruire un bottolino che potrebbe creare tutta la struttura in ns0, con template {{Includiintestazione}} completo e pure pagelist? Secondo me sarebbe fantastico, risparmieremmo un sacco di tempo, e potermmo consigliare agli utenti a lavorare solo ed esclusivamente in nsPagina, creando un buon indice e poi trascrivendo e rileggendo. Aubrey McFato 15:58, 4 mag 2012 (CEST)
Template Ns0: superato. Lo togliamo?
modificaCari amici,
Provo a ricostruire la storia di {{Ns0}}.
- Un tempo era stato inventato da Alex per fare in modo che, data la sua disseminazione nel corso della trascrizione, fosse possibile costruire l'intera transclusione in namespace principale in modo automatico.
- Dopo un po' il fervore per il "progetto di automatismo spinto" è scemato e il template ha ricoperto l'interessante ruolo di fornire un link verso la transclusione in ns0 che in effetti era sempre mancato (in ns0 abbiamo il numero di pagina a sinistra ma non avevamo il riscontro nell'altra direzione).
- Il tempo (e il genio sbrigliato di Alex) ha però portato due rimedi:
- un {{Indice sommario}} pensato per eseguire con il giocattolo autoNs0 la trasposizione in ns0 di un libro trascritto senza fatica
- il tab "testo" in NsPagina che ora permette di saltare tra entrambi i namespace con assoluta facilità
ha di fatto reso inutile l'ancoraggio delle pagine al Ns0 tramite {{Ns0}}, e svuotato di senso la sua presenza in generale. Il template di per sé non fa male a nessuno, senonché qualche utente, tornato dopo una pausa di editing, lo ha utilizzato perché si ricordava che era importante. Spero di non aver bisogno di aggiungere altro: è possibile eliminare le tracce di tale template dal NsPagina via bot? - εΔω 11:35, 23 ago 2012 (CEST)
- Certo che sì.
- Agirò in due passi: prima di tutto uccido il codice in modo da dissuadere chiunque dall'usarlo perchè resterà "muto e invisibile"; poi rintraccio le pagine dov'è presente e lo rimuovo. --Alex brollo (disc.) 11:44, 23 ago 2012 (CEST)
- Perfettamente d'accordo; vorrei far notare che il template veniva usato anche nelle Pagine dell'edizione di questo indice. In effetti non servirebbe nemmeno lì, data la presenza del sommario a fianco. Fate voi!--Barbaforcuta (disc.) 14:32, 24 ago 2012 (CEST)
- Fatto un gran repulisti. Ne ho approfittato per cancellare le tracce di un'alta mia trovata, che prevedeva il "seminamento" di commenti html nel codice pagina per supporto alle opere in versi, perfettamente superata dal banalissimo bottone per l'indentazione di gruppi di versi. Ho lavorato solo sulle pagine Pagina; qualcosa sarà sfuggito, finita la strage, cancello il template (che peraltro, al momento, è totalmente inoffensivo). Alex brollo (disc.) 14:58, 24 ago 2012 (CEST)
- Perfettamente d'accordo; vorrei far notare che il template veniva usato anche nelle Pagine dell'edizione di questo indice. In effetti non servirebbe nemmeno lì, data la presenza del sommario a fianco. Fate voi!--Barbaforcuta (disc.) 14:32, 24 ago 2012 (CEST)
Punto della situazione su più fronti
modificacari amici,
purtroppo il nostro progetto è così impregnato di lavoro sporco che periodicamente è il caso di fare il punto della situazione: se poi questo fosse funzionale a uno snellimento delle pagine del progetto... meglio ancora.
1. Trascrizioni inverse
modificaDiamo pure un'occhiata alle statistiche di transclusione: fortunatamente i nuovi testi proofread sono ormai la norma, ma il processo di assottigliamento dei testi non proofread mediante M&S sembra essersi praticamente fermato. Ieri ho sistemato le rime di Cino Rinuccini, ma sarebbe utilissimo riprendere in mano il discorso e continuare a collegare testi e fonti
1.a. testi SAL 100%
modificaQuesto ci porta alla seconda questione già accennata oggi al Bar: bisogna cercare di collegare i testi riletti ma senza fonte proofread a una fonte proofread; essi hanno la precedenza ma anche in questo caso sembra che l'assenza di Candalua abbia nociuto al lavoro in corso: riprendiamolo.
2. Pagelist e Sommari
modificaIl lavoro sui pagelist mi sembra abbastanza a buon punto, si tratta di pattugliare i nuovi indici man mano che appaiono, mentre il lavoro sui sommari è ancora in corso. Abbiamo praticamente esaurito le pagine senza alcun sommario, ma questo significa che resta da dedicarsi alle pagina che hanno già un sommario "vecchio stampo" per proseguire la migrazione verso l'attuale standard. Ci sono due tipi di sommario "vecchio stampo"
- Sommario tipo Indice:Dell'obbedienza del cavallo.pdf con parametri di colore e non connessi al ns0
- Sommario tipo Indice:Manzoni.djvu con transclusione delle pagine cartacee trascritte.
Sarebbero d'uopo delle liste per ciascuno di questi gruppi.
- Provo a vedere che possibilità ci sono di creare "liste dinamiche". Creerò una categoria temporanea per identificare i sommari di vecchio tipo. Test in Progetto:Trascrizioni/Indici con sommario fuori standard. --Alex brollo (disc.) 22:00, 23 ago 2012 (CEST)
- Fatto Ho diviso i gruppi in SAL 100% e SAL < 100%, e visualizzo solo 20 indici per ognono dei 4 gruppi per non spaventare nessuno. Alex brollo (disc.) 22:40, 23 ago 2012 (CEST)
- Per chi invece ha le viscere di bronzo... in questa pagina la lista senza sconti :D - εΔω 18:02, 28 ago 2012 (CEST)
- Alla vigilia di Natale abbiamo raggiunto un traguardo: gli indici con sommario da regolarizzare sono rimasti solo cento. Io intendo proseguire nell'opera di regolarizzazione. Ogni contributo mi permetterà di anticipare il mio ritorno alla rilettura. - εΔω 10:43, 24 dic 2012 (CET)
- Al 4 di gennaio siamo arrivati ne sono rimasti solo settantacinque! Avanti tutta: man mano che ci lavoro vedo anche di sistemare stranezze o irregolarità... avanti tutta! - εΔω 19:20, 4 gen 2013 (CET)
- Al 24 di febbraio siamo a meno quaranta. La fine non è lontana anche se man mano che procedo gli indici da sistemare rimangono i più rognosi. - εΔω 12:07, 24 feb 2013 (CET)
- Per chi invece ha le viscere di bronzo... in questa pagina la lista senza sconti :D - εΔω 18:02, 28 ago 2012 (CEST)
- Fatto Ho diviso i gruppi in SAL 100% e SAL < 100%, e visualizzo solo 20 indici per ognono dei 4 gruppi per non spaventare nessuno. Alex brollo (disc.) 22:40, 23 ago 2012 (CEST)
3. ePub
modificaNon seguo personalmente la questione, ma razionalmente capisco che la trasformabilità dei nostri testi in pdf ed ePub sia fondamentale. A che punto è la gestione dei problemi emersi mesi fa?
Sotto con le discussioni finché esamino le sottopagine del progetto per capire se quanto scritto il 9 dicembre 2010 è attuabile. εΔω 15:31, 23 ago 2012 (CEST)
Nuovo fronte
modificaChe barba che noia che noia che barba, mai niente di nuovo qui! :-D :-D :-D
Visto che c'è questa situazione, vi illustro la nuova avventura, che mi attira come una sirena. Ho intenzione di lavorare un po' su Commons, facendo ordine e trasformando i dati collegati ai nostri files .djvu e .pdf, e visto che ci sono anche ai dati collegati ai nostri Autori. Questo significherà un po' di lavoro a mano, per analizzare i problemi, seguito (spero) da una passata di bot, sempre che i commonisti non facciano ostruzionismo. L'idea è di convertire il template Information in semplici istanze del template Book, e di travasare i nostri dati nsAutore: nel namespace nsCreator:. Il tutto seguendo attentamente l'effetto che fa attraverso show(1) in modo da verificare quanti, e quali dati, possono essere tenuti allineati in modo automatico.
Siccome tutto ruota su Book e Creator, apro una sottopagina del progetto (una in più una in meno.... ) Progetto:Trascrizioni/Book e Creator, partendo innanzitutto dalla natomia di questi due template. --Alex brollo (disc.) 22:02, 29 ago 2012 (CEST)
Doppioni eschilei: decidiamo
modificaC'è un'importante Discussione COME da titolo al Caffè letterario. - εΔω 10:08, 2 gen 2013 (CET)
Poesia e metrica
modificaNella Pagina:Novelle lombarde.djvu/179 e nelle due successive ci sono versi con una spaziatura più ampia del normale. Vedendo che le parole sono in rima qual è il modo più corretto per trascriverle: nessuna spaziatura additiva (com'è adesso), una spaziatura larga oppure aggiungere degli a capo, con conseguente diversa numerazione dei versi? --Luigi62 (disc.) 15:36, 7 gen 2013 (CET)
- Fatto Il ditirambo è fatto così: un gran disordine (a dire il vero questo ditirambo è più ordinato di quelli di un secolo prima). La logica è la seguente: si ha un rapido avvicendarsi di sistemi strofici diversi, per cui le strofe di un sistema sono determinate dalle indentazioni, quando comincia un nuovo sistema si lascia un caporiga di separazione, quando invece un verso è doppio, per separarlo ho usato il template loop: {{loop|7| }} produce sette spazi "solidi" che separano due parole. Per numerare le strofe seguendo le loro bizze ho prima separato con caporiga supplementare tutte le strofe (terzine quartine ecc.), le ho fatte numerare automaticamente al js numeroriga(1) e poi ho rieliminato i caporiga supplementari che non mi servivano più. - εΔω 18:47, 7 gen 2013 (CET)
Questo ci era sfuggito
modificaCaro amici,
notavo che abbiamo un lungo testo con scansioni su commons: Volapük: Grammatica e Lessicologia con le sue immagini di coppie di pagine. A cinque anni dal caricamento abbiamo le tecnologie per suddividere, croppare e riunire in un djvu tali immagini al fine di farne il Match&Split. mamma mia quanto ci siamo evoluti! Alex, ci sei? - εΔω 16:26, 12 gen 2013 (CET)
- Djvu OCR pronto, ma preferirei riprovarci, non mi soddisfa la risoluzione.--Alex brollo (disc.) 00:12, 13 gen 2013 (CET)
Confronto fra OCR
modificaUna mostruosa opera (Indice:Opere (Chiabrera).djvu ne rappersenta una metà) mi ha dato la possibilità di confrontare 3 diversi OCR di immagini OPAL particolarmnte difficili (testo piccolo e fitto). Nella tabella sotto, la pag. 50, come da OCR:
- integrato in djvuToy (OCR Microsoft Wndows)
- FineReader 11, su djvu ottenuto con djvuToy;
- FineReader su PDF OPAL originale.
- OmniPage su PDF OPAL originale.
LIV |
LIV |
LIV |
LIV |
- Conclusioni
- Finereader resta incomparabilmente superiore;
- le differenze fra le due modalità FineReader (da djvu e da PDF) sono minori. Visto che FineReader dà un risultato molto superiore, caricherei immediatamente via bot i testi in nsPagina dopo un po' di post-elaborazione (aggiunta tag poem, aggiunta RigaIntestazione)
Nota: l'unica modifica fatta ai testi dopo l'OCR è l'eliminazione delle righe vuote (numerose nella versione FineReader). --Alex brollo (disc.) 19:53, 12 gen 2013 (CET)
- Differenza evidente, il primo è inutilizzabile per la trascrizione, tanto vale farla a mano, il secondo e il terzo invece sono un ottimo materiale di lavoro. --Accurimbono (disc) 20:01, 12 gen 2013 (CET)
- Aggiungo confronto con OmniPage, --Xavier121 02:27, 13 gen 2013 (CET)
- Eccellente anche OmniPage. Ma perchè spezza i versi? C'è qualche settaggio da sistemare? Osservazione generale: qualsiasi OCR si usi, è sempre possibile produrre un layer OCR così-così contestualmente alla trasformazione con djvuToy, e poi caricare via bot sulle pagine Pagina un OCR migliore, come ho fatto in Indice:Opere (Chiabrera).djvu. Per farlo con la massima facilità, serve un output OCR txt utf-8, meglio se un set di file txt a pagina singola. Xavier, produrresti+convideresti uno zippone dei file txt a pagina singola da OmniPage? --Alex brollo (disc.) 09:22, 13 gen 2013 (CET)
- Scusa Alex, ho spezzato di proposito (ingenuamente) qualche verso per allineare la lettura secondo lo spazio disponibile su 4 invece di 3 colonne! Ci provo in questi giorni. Ricordo che questo sistema di produrre un ottimo ocr DOPO il caricamento di quello così-così è una pratica comunemente seguita dal sottoscritto e realizzata per due vie: 1) Tramite Match & split pulito (il geniale meccanismo che aiuta a ridurre il numero di testi non proofread); 2) e attravreso la sua versione meno nobile, ma non per questo meno efficace, il M&S. sporco, (qualche esempio nella cronologia della mia pagina delle prove). Nel secondo sistema si possono aggiungere svariati parametri di formattazione ricorsivi. --Xavier121 11:18, 13 gen 2013 (CET)
- Eccellente anche OmniPage. Ma perchè spezza i versi? C'è qualche settaggio da sistemare? Osservazione generale: qualsiasi OCR si usi, è sempre possibile produrre un layer OCR così-così contestualmente alla trasformazione con djvuToy, e poi caricare via bot sulle pagine Pagina un OCR migliore, come ho fatto in Indice:Opere (Chiabrera).djvu. Per farlo con la massima facilità, serve un output OCR txt utf-8, meglio se un set di file txt a pagina singola. Xavier, produrresti+convideresti uno zippone dei file txt a pagina singola da OmniPage? --Alex brollo (disc.) 09:22, 13 gen 2013 (CET)
- Aggiungo confronto con OmniPage, --Xavier121 02:27, 13 gen 2013 (CET)
Indici doppioni cancellabili?
modificaRovistando tra le pagine indice, ne ho trovate alcune che secondo me si possono considerare cancellabili in quanto puri doppioni, ma prima vorrei confrontarmi con la comunità.
- Indice:Storia degli antichi popoli italiani.djvu è praticamente identico a Indice:Storia degli antichi popoli italiani - Vol. I.djvu e punta alla trasclusione di quest'ultimo, non presenta secondo me significative differenze ed inoltre è praticamente tutto da trascrivere.
- Invece Indice:Introduzione (Cremona).djvu è composto da pagine che ritroviamo uguali in Indice:Opere di Cremona 1.pdf ma non trascritte. Secondo me la cosa migliore sarebbe spostarle via bot dal primo al secondo indice correggendo la trasclusione ed eliminando l'indice superfluo. Giustamente Alex mi fa notare che la versione completa è un pdf, secondo voi ha senso trasformarla in djvu ed operare gli spostamenti necessari per eliminare l'indice superato? Saluti,--Federicor (disc.) 15:45, 15 gen 2013 (CET)
- Entrambe le situazioni sono risolvibili come da te indicato. solo che l'eliminazione dell'indice ha senso solo con l'eliminazione preventiva delle pagine che ad esso afferiscono.
- Nel caso del doppione di Micali sono molte e vanno eliminate via admin-bot.
- Nel caso del doppione di Cremona il pdf va trasformato in djvu e questo non è un gran problema, ma tutto il resto dell'operazione è alquanto macchinoso e impraticabile a mano.
- Bisogna chiamare in causa Alex. - εΔω 17:52, 22 gen 2013 (CET)
- Per la cancellazione di Indice:Storia degli antichi popoli italiani.djvu e sue pagine, no problem, posso travestirmi da bot e partire anche subito; l'unica perplessità è che si tratta di due edizioni diverse (1836-1949). Confermatemi ancora una volta che Indice:Storia degli antichi popoli italiani.djvu va cancellato e Indice:Storia degli antichi popoli italiani - Vol. I.djvu va conservato, e parto.
- Per quanto riguarda la conversione pdf->djvu di Cremona, guardate qui: http://archive.org/details/operematematiche027753mbp, è lui: già in djvu, bello completo. Si tratta solo di caricarlo in Commons come File:Opere matematiche (Cremona) I.djvu e trasferire un po' di pagine da qua e da là: alla fine una bella pulizia e fine. Parto da quest'ultimo. --Alex brollo (disc.) 21:25, 24 gen 2013 (CET)
- Elimina pure il doppione Micali. Ci concentreremo sull'edizione completa in tre volumi già caricata. εΔω 21:47, 24 gen 2013 (CET)
- Ok: mi eclisso :-) Alex brollo (disc.) 21:55, 24 gen 2013 (CET)
- Riappaio. Il doppione Micali è stato eliminato completamente. Il file djvu di Cremona è stato caricato in commons ed è identico al file pdf, tranne che per una qualità grafica leggermente inferiore e per 4 pagine in più in testa. Io sposterei (invece che copiarle) le poche pagine esistenti dal pdf al djvu; mentre per le pagine da Indice:Introduzione (Cremona).djvu, che provengono da un'edizione diversa, il lavoro è più delicato e comunque copierei il testo piuttosto che tentare di spostare le pagine; prevedo grattacapi. Quindi, proporrei di "lasciare il doppione" Indice:Introduzione (Cremona).djvu a tempo indeterminato. --Alex brollo (disc.) 00:04, 25 gen 2013 (CET)
- Visto che ci siamo: che fare con Indice:Opere di Cremona 2.pdf, che fra l'altro ha vari brani trascritti? Ci sono due possibilità:
- Elimina pure il doppione Micali. Ci concentreremo sull'edizione completa in tre volumi già caricata. εΔω 21:47, 24 gen 2013 (CET)
- farne un djvu con OCR via FineReader (il mio PC sta lavorando alacremente)
- caricarlo su IA (e possibilmente caricare anche il volume III per rendere accessibile all'universo mondo le preziose elaborazioni automatiche del testo). --Alex brollo (disc.) 08:55, 25 gen 2013 (CET)
- Convertito in djvu anche Indice:Opere di Cremona 2.pdf che è diventato Indice:Opere matematiche (Cremona) II.djvu. Le pagine sono già state spostate e i tag pages in ns0 corretti e fatti puntare il nuovo Indice djvu. Date un'occhiata. --Alex brollo (disc.) 00:32, 26 gen 2013 (CET)
- Ben venga la possibilità di avere anche il terzo volume.
Riguardo al doppione che hai temporaneamente lasciato: se le versioni sono simili proporrei di spostare le pagine trascritte nelle pagine del suo clone (e riportare le poche pagine 100% al 75% per un controllo); se non lo sono, bisognerebbe trovare l'intero volume (anzi volumi) per consentire l'inserimento dell'intera opera.--Barbaforcuta (disc.) 11:56, 29 gen 2013 (CET)
- Ben venga la possibilità di avere anche il terzo volume.
- Convertito in djvu anche Indice:Opere di Cremona 2.pdf che è diventato Indice:Opere matematiche (Cremona) II.djvu. Le pagine sono già state spostate e i tag pages in ns0 corretti e fatti puntare il nuovo Indice djvu. Date un'occhiata. --Alex brollo (disc.) 00:32, 26 gen 2013 (CET)
Autore da spostare
modificaWikisource:Autore citato/Vittoria Madurelli Berti va spostato in Autore:Vittoria Madurelli Berti senza lasciare redirect. Inoltre qualcuno sa individuare l'autore citato nella nota di questo testo? --Luigi62 (disc.) 11:53, 17 gen 2013 (CET)
- Fatto --Alex brollo (disc.) 22:07, 24 gen 2013 (CET)
Sembra Autore:Francesco Beltrame, "famosissimo" (sic!) autore di Tragedie. --Carlo M. (disc.) 15:15, 17 gen 2013 (CET)
- Su SBN c'è la sua scheda di autorità, che corrisponde a VIAF 90263958. "Consigliere di governo a Venezia, ammiratore di Scott e Manzoni, autore di una tragedia e di scritti d'occasione. Nato a Conegliano (TV) nel 1797." --Accurimbono (disc) 14:48, 29 gen 2013 (CET)
- Leggermente OT: stiamo lavorando per mettere gli identificatori VIAF via bot su it.wiki, dovrebbe essere una cosa che facciamo fra poco. Ma esistono gadget 8quindi no bot, ma azionati da umani) che lo fanno anche per Wikisource (basta copiarli qui da noi). sono due cose differenti (una funziona a bot, automaticamente, e potrebbe andare via interwiki da pedia a noi), l'altra la possiamo fare anche subito, importando le pagine giuste e facendo prove. Se ci diciamo che abbiamo poche centinaia di autori e vogliamo provare, forse la seconda è più veloce e migliore. --Aubrey McFato 15:54, 29 gen 2013 (CET)
- Scusa ma non ho capito quello che hai scritto. Spiegati meglio, per favore, perché la cosa come sai, mi interessa moltissimo! :) --Accurimbono (disc) 16:19, 29 gen 2013 (CET)
- In ogni caso, sono disponibile a collaborare e fare da wikignomo, ma in prospettiva, la sfida non è tanto importare inizialmente i dati VIAF (qui abbiamo solo un migliati di autori), quanto trovare una maniera automatica per _mantenerli_ aggiornati in futuro. Quindi bisognerebbe trovare un meccanismo che automaticamente (anche se guidato da umani) permetta di fare il lavoro sporco in maniera affidabile senza perdere troppo tempo. --Accurimbono (disc) 17:03, 29 gen 2013 (CET)
- Leggermente OT: stiamo lavorando per mettere gli identificatori VIAF via bot su it.wiki, dovrebbe essere una cosa che facciamo fra poco. Ma esistono gadget 8quindi no bot, ma azionati da umani) che lo fanno anche per Wikisource (basta copiarli qui da noi). sono due cose differenti (una funziona a bot, automaticamente, e potrebbe andare via interwiki da pedia a noi), l'altra la possiamo fare anche subito, importando le pagine giuste e facendo prove. Se ci diciamo che abbiamo poche centinaia di autori e vogliamo provare, forse la seconda è più veloce e migliore. --Aubrey McFato 15:54, 29 gen 2013 (CET)
- Su SBN c'è la sua scheda di autorità, che corrisponde a VIAF 90263958. "Consigliere di governo a Venezia, ammiratore di Scott e Manzoni, autore di una tragedia e di scritti d'occasione. Nato a Conegliano (TV) nel 1797." --Accurimbono (disc) 14:48, 29 gen 2013 (CET)
SAL degli indici
modificaCome mai quando cambio il SAL di un indice l'area dati si sposta in basso, e poi passa un bot per rimetterla dov'era? (esempio:Indice:Petrificazioni Monte Misma.djvu). Ho qualche settaggio sbagliato? --Luigi62 (disc.) 10:42, 19 feb 2013 (CET)
- E' così per tutti da un po' di tempo, hanno cambiato delle cose "ai piani alti" e i nostri script non riescono più a caricare l'area dati ad inizio pagina, per cui abbiamo dovuto inventarci la toppa che hai riscontrato. Niente di cui preoccuparsi, comunque :) Candalùa (disc.) 17:44, 12 mar 2013 (CET)