Progetto:Trascrizioni/Progetto Phe: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Creata nuova pagina: Il "progetto Phe", da un suggerimento di Phe (attuale manovratore del robot Match and Split), consiste nel far ricevere alla pagina Pagina, a...
 
Nessun oggetto della modifica
Riga 23:
 
sono stati sperimentati nelle ultime 48 ore e non sono particolarmente complessi.
=== Il parsing dell'output djvutxt -detail=line ===
* Opera test: [[:File:La pastorizia.djvu]] [[Pagina:La pastorizia.djvu/55]]
 
Testo prodotto da djvutxt -page=55 La pastorizia.djvu:
<pre>
Ifi LA PASTORIZIA,
D'antichissime selve avete in cura,
Oreadi benigne, il vostro regno
Ne concedete; perocché, solenne
Ostia votiva, la miglior dell’agnc
A voi cadrà sui coronati altari
Devotamente al rinnovar d’ogn’anno.
Voi dagli estri mortiferi volanti
E dall’orride serpi e da vepraj
E dalle avvelenate erbe guardale
Le pecorelle ai pascoli. Per voi
</pre>
 
Testo prodotto da djvutxt -page=55 -detail=line La pastorizia.djvu:
<pre>
(page 268 465 868 1553 (line 269 1520 681 1553 "Ifi\tLA PASTORIZIA,")
(line 268 1479 750 1514 "D'antichissime selve avete in cura,")
(line 269 1432 707 1467 "Oreadi benigne, il vostro regno")
(line 268 1388 719 1423 "Ne concedete; perocché, solenne")
(line 270 1342 727 1379 "Ostia votiva, la miglior dell’agnc")
(line 268 1308 694 1335 "A voi cadrà sui coronati altari")
(line 268 1258 779 1289 "Devotamente al rinnovar d’ogn’anno.")
(line 268 1213 707 1245 "Voi dagli estri mortiferi volanti")
(line 268 1165 705 1203 "E dall’orride serpi e da vepraj")
(line 269 1124 730 1158 "E dalle avvelenate erbe guardale")
(line 269 1078 712 1115 "Le pecorelle ai pascoli. Per voi")
</pre>
 
Script per l'estrazione dei dati da una variabile testo che contiene l'output -detail=line::
<pre>
righe=[];
patt=/(\d+)\s(\d+)\s(\d+)\s(\d+)\s\"(.+)\"\)\s\n/;
while (patt.test(testo)) {
l=testo.match(patt);
l1=l.slice(0,1);
testo=testo.replace(l1,"");
lista.push(l.slice(1));
}</pre>
Sul testo sopra, si ottiene una lista righe di 11 elementi del tipo:
<pre>["269", "1520", "681", "1553", "Ifi\tLA PASTORIZIA,"]</pre>
 
E' quindi possibile caricare su una pagina Pagina locale l'output grezzo di djvutxt -detail=line ed eseguire:
# il parsing;
# la ricostruzione del puro testo identico all'output di djvutxt per estrazione e accodamento delle stringhe in posizione 4;
# il salvataggio in una variabile locale dell'intero array righe;
# la serializzazione JSON di righe, che nel caso del testo di esempio è:
 
"[["269","1520","681","1553","Ifi\\tLA PASTORIZIA,"],["268","1479","750","1514","D'antichissime selve avete in cura,"],["269","1432","707","1467","Oreadi benigne, il vostro regno"],["268","1388","719","1423","Ne concedete; perocché, solenne"],["270","1342","727","1379","Ostia votiva, la miglior dell’agnc"],["268","1308","694","1335","A voi cadrà sui coronati altari"],["268","1258","779","1289","Devotamente al rinnovar d’ogn’anno."],["268","1213","707","1245","Voi dagli estri mortiferi volanti"],["268","1165","705","1203","E dall’orride serpi e da vepraj"],["269","1124","730","1158","E dalle avvelenate erbe guardale"],["269","1078","712","1115","Le pecorelle ai pascoli. Per voi"]]"