Discussioni indice:Alighieri, Dante – La Divina Commedia, 1933 – BEIC 1730903.djvu
memoRegex
modifica{"^r$":["(regex)","{{RigaIntestazione||{{Sc|}}|}}","g"], "({{R.+)\\n([^ ])":["(regex)","$1\n $2","g"], "({{R.+)\\n([^< ])":["(regex)","$1\n $2","g"], " +</poem>":["(regex)","</poem>","g"], "ì":["","í","g"], "si\\ che":["","sì che","g"], "si\\ come":["","sì come","g"]}
Note di formattazione
modifica- Il testo deriva dalla rapida revisione e formattazione dell'ottimo OCR prodotto da Internet Archive.
- Proveniendo da OCR, contiene errori di interpretazione di due tipi:
- errori di interpretazione dei caratteri (anche nella punteggiatura!); più facili da riconoscere perchè senza senso;
- errori nell'interpretazione delle parole dopo confronto con le voci del vocabolario italiano corrente (tipico caso: ornai invece di omai), più difficili da riconoscere se non si segue il senso dell'intera frase).
- la struttura del testo in versi è molto regolare:
- ogni terzina inizia con un verso indentato;
- la numerazione dei versi cade sempre nel terzo verso di ogni terzina;
- di conseguenza, ogni verso numerato è seguito da un verso indentato.
- gli errori di riconoscimento dei caratteri di punteggiatura sono particolarmente frequenti in quelli con significato di w:virgolette, ossia quelli che identificano frammenti di discorso diretto. Ci sono due casi:
- i frammenti di primo livello sono delimitati da "caporali",
«....»
- i frammenti di secondo livello (frammenti di discorso contenuti in frammenti di discorso) sono delimitati da "virgolette alte singole"
‘...’
, le seconde dopo i "caporali" in toolbar.
- i frammenti di primo livello sono delimitati da "caporali",
Il codice {{Ms|7}}
precede il primo codice poem di ogni canto, e centra, in ns0, l'intero canto (si basa su templatestyles). In nsPagina l'effetto di centratura compare solo nella prima pagina, ma questo non disturba la rilettura nè la corretta transclusione. Per ottenere la centratura in nsPagina di tutte le pagine, potrebbe essere ripetuto prima di tutti i codici poem; al momento non è stato giudicato necessario.
Ad oggi il testo dei Canti è stato formattato ma non corretto, e quindi, nonostante sia formattato, è SAL 25%. Il passaggio a SAL 75% richiede una attenta correzione delle parole, della punteggiatura e delle spaziature.