Discussioni indice:Castiglione - Il libro del Cortegiano.djvu
memoRegex
modifica{"á":["","à","g"], "í":["","ì","g"], "(.+)[. ]+(\\d+)":["(regex)","$1\t$2","g"], "\\ fusse":[""," fosse","g"], "\\ aiuto":[""," ajuto","g"], "\\ sòle":[""," suole","g"], "\\ gentilomo":[""," gentiluomo","g"], "difficultà\\ ":["","difficoltà ","g"], "\\ po\\ ":[""," può ","g"], "\\ omini\\ ":[""," uomini ","g"], "singular":["","singolar","g"], "abundan":["(regex)","abondan","g"], "súbito":["","subito","g"], "Ducnessa":["","Duchessa","g"], "\\n+{{§\\|":["(regex)","\n\n{{§|","g"], "Fe[dp]ERIco":["(regex)","Federico","gi"], "\\t":["(regex)"," ","g"], "Pag\\. (\\d+)":["(regex)","Pag. {{Pg|$1}}","g"], "ú":["","ù","g"], "^(Pag\\..+lin\\. \\d+\\.)":["(regex)","''$1''","g"], "^(Pag\\. .+lin\\. \\d+\\.)":["(regex)","''$1''","gm"], "î":["","i","g"], "Dig.+":["(regex)","","g"], "Cortegianìa":["","Cortegianía","g"], "ů":["","ù","g"], "å":["","à","g"], "oggidi":["","oggidì","g"], "^c$":["(regex)","{{colonna|em=-1}}","gm"], "^ac$":["(regex)","{{altraColonna|em=-1}}","gm"], ", (\\d+)":["(regex)",", {{Pg|$1}}","g"], "4(\\d\\d)":["(regex)","1$1","g"], "\\n+([EFGHILMNOPQRSTUVZ])\\n+":["(regex)","\n{{Ct|f=120%|v=1|t=1|L=0px|'''$1'''}}\n","g"]}
- disabilitate
"([\\s\\S]+\\n+)([IVXLC]+\\.\\ [\\s\\S]+)":["(regex)","<section begin=\"s1\" />$1<section end=\"s1\" /><section begin=\"s2\" />$2<section end=\"s2\" />","gm"], "^([IVXLC]+)\\.":["(regex)","{{§|$1|$1}}.","gm"], "\\n\\n\\n":["(regex)","\n\n","gm"],
Annotazioni per la rilettura
modifica- Le pagine 17-321 derivano da match & split di Il libro del Cortegiano; attenzione a piccole differenze di ortografia e punteggiatura e alle parole iniziale e finale delle pagine, per correggere imprecisioni del match.
- Le pagine successive derivano da OCR rielaborato.
- Le annotazioni al testo vanno rese con {{Nota separata}}
Problemi di transclusione e di link interni
modifica- Il testo derivato da M & S presenta alcune differenze nell'ortografia e parecchie differenze nella punteggiatura.
- La suddivisione in microcapitoli (in genere di lunghezza inferiore a una pagina) rende molto debole la relazione pagine-capitolo vanificando profondamente l'efficacia del template Pg nel caso di una struttura ns0 in microcapitoli separati; esiste una buona relazione, invece, pagine-libro, da considerare quindi l'ipotesi di una transclusione per libro. Tutti i capitoli sono comunque stati associati a section s1, s2, s3.
- Nelle Annotazioni, i riferimenti ai personaggi sono fatti per libro e numero capitolo (arabo) mentre invece le annotazioni al testo sono fatte per pagina-linea nella pagina.
- Nel Sommario dell'edizione, i capitoli sono talora elencati singolarmente, talora sono elencati a blocchi; in tutti i casi i capitoli o i gruppi di capitoli sono associati a un breve sommario (una o poche righe di testo), struttura temporaneamente riprodotta nel campo Sommario della pagina Indice in questa versione.
Aggiornamento
modifica- Dopo test su alcune pagine, le differenze sono risultate molto più numerose e insidiose di quanto previsto; si ripiega sull'OCR Tesseract, che è eccellente e i cui errori sono facilmente individuabili, utlizzando la procedura per ovviare il problema del mancato aggiornamento delll'url della pagina (apertura di una pagina dedicata all'OCR ("avanzate"); utilizzo del pulsante Copia url e sua copia nel campo url della pagina OCR).
- dopo test su molte pagine, ripiego sull'OCR in modo sistematico, utilizzando sempre il pulsante OCR tesseract e rimpiazzando sistematicamente il testo derivato dal M & S. --Alex brollo (disc.). 08:19, 30 dic 2021 (CET)
le annotazioni
modificaLe note separate in Annotazioni presentano serie difficoltà, in quanto il numero delle linee indicate sembra non corrispondere al testo e, quando consistono solamente in una generica indicazione di un testo classico senza altri riferimenti, sono difficili o impossibili da collocare.
- @OrbiliusMagister Rinuncio a collocare il riferimento nota nei casi dubbi, in particolare quelli in cui non si fa riferimento a una variante del testo esplicita. Di conseguenza molte annotazioni resteranno orfane. --Alex brollo (disc.). 08:16, 30 dic 2021 (CET)