Progetto:Trascrizioni/Progetto Phe: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 134:
* I test sono stati fatti sulla seconda parte di [[Indice:La pastorizia.djvu]] da bot locale, e su [[Indice:Rivista di Scienza - Vol. II.djvu]] da bot su toolserver.
* Nel secondo test sono stati calcolati via python e caricati anche alcuni "parametri pagina":
** altezza "tipica" delle linee nella pagina
** valore minimo del margine sin (min_x1) e massimo del margine dx (max_x2) nella pagina
** pattern del margine pagina sin (stringa di valori 0,1,2,3, ognuno rappresenta lo ''scarto'' fra una riga e la successiva, 0=scarto minimo, 3=scarto notevole; l'indentatura paragrafi cade su 2 o su 3; un margine allineato è una stringa con molti 0 e pochi 2-3, un margine "seghettato" come quello dei versi è una stringa con molti 1,2,3 casuali, un margine "ripetitivo" come quello di versi in strofe con indentature regolari è una sequenza regolare e ripetitiva di 0 e di 2-3)
** pattern del margine pagina sin
** pattern del margine pagina dx
 
Riga 143:
# gestione cancellazioni dati intermedi
# interfaccia Python Cgi per l'interazione via web (manuale o automatica)
# inizio test formattazione automatica {{fatto}} (vedi elaborarighePagina() in Common.js e in [[Utente:Alex brollo/vector.js]])
## centrato {{fatto}} ma non funziona su pagine in cui tutte le righe siano centrate (es. frontespizi), in quanto la riga più lunga viene presa come termine di riferimento e quindi non viene riconosciuta come centrata
## centrato
## righe vuote (richiede la disponibilità di un'altezza linea tipica, per interpretare le pagine, tipo frontespizio, in cui vi siano poche righe a interlinea "esotica")
## righe vuote
# calcolo dati "di formato generale" dell'opera
## altezza dell'interlinea tipica, espressa in % dell'altezza della pagina (da calcolare sulle pagine "di pieno testo", ossia quelle con il numero massimo di righe); il calcolo va fatto sull'insieme delle pagine, non può essere ricavato dall'analisi delle pagine singole (idem il punto successivo), a livello di elaborazione globale dei dati.
## ampiezza "tipica" della linea di testo (espressa in % della larghezza completa dell'immagine su pagine che abbiano le righe di maggior lunghezza).