Differenze tra le versioni di "Aiuto:Match and Split"

(metto un bel messaggio minatorio, a futuro monito... ;-))
* una pagina del namespace principale contenente un tag <nowiki><pages/> (esempio: <pages index="Storia della letteratura italiana I.djvu" from=121 to=161 />)</nowiki>
* una serie di pagine (esempio: [[Pagina:Storia della letteratura italiana I.djvu/121]] e seguenti) contenenti il vostro testo di partenza. Queste pagine si trovano al [[Aiuto:SAL 25%|SAL 25%]], quindi sarà necessario ripassarle a mano (o chiedere l'intervento di un bot) per portarle al 75%.
 
== La procedura inversa M&S in un'opera inesistente ==
 
Nonostante la procedura M&S sia creata per la trascrizione inversa, è possibile, e forse vantaggioso, utilizzare la procedura in modo "creativo" anche per i casi in cui ''una versione testuale già pronta non esiste ancora''.
 
Le premesse per questa possibilità sono che esista, o sia scaricabile in qualche modo, un testo "in blocco" (ad esempio può essere utilizzato il file .....djvu.txt disponibile su IA), e che, ovviamente, sia anche disponibile un file djvu con layer di testo.
 
Il sistema si basa su queste due osservazioni:
# le procedura Match e Split sono del tutto indipendenti l'una dall'altra;
# la procedura Match segmenta il testo in pagine, inserendo un particolare codice nel punto di inizio di ogni pagina;
## eseguito il match, si ottiene semplicemente un testo con intercalati titoli di sezione di secondo livello, che contengono il link alla pagina. In questa fase (prima di lanciare lo Split) il testo ''può essere liberamente modificato'', facendo attenzione a non toccare i "titoli di sezione speciali".
# La procedura Split fa due cose:
## copia il testo, pagina per pagina, nelle pagine linkate dal codice;
## nel testo da cui sono state copiate le pagine sostituisce la testo il codice di transclusione puntato sulle stesse pagine.
 
Quindi la procedura "inversa" consiste in:
# caricare il testo in blocco in una pagina Ns0 provvisoria
# far partire Match
# dopo che il Match è concluso, "aggiustare" quanto più possibile il testo (molto comodo estrarlo e procedere su un buon programma di elaborazione testi); il vantaggio è che piccoli scannos ricorrenti possono essere corretti in blocco con un solo edit, e inoltre che può essere aggiunto codice in testa alle pagine, subito sotto il codice Match, con la certezza che non confonderà il programma e che sarà ricopiato esattamente tal quale nella pagina.
 
Un primo test preliminare è stato fatto qui:[[Don_Chisciotte_della_Mancia/TestoSecondaParte]], elaborando in blocco circa 250 pagine su 650, ma non si è trattato di un test "raffinato", in quanto non è stata eseguita la "pre-elaborazione post-match". La procedura potrebbe, se ben attuata, consentire anche l'introduzione dei tl|Ns0 e quindi permettere, in una seconda fase, la costruzione automatica delle pagine Ns0 dei vari capitoli; è molto probabile che risulti anche piuttosto semplice l'inserimento quasi automatico dei tl|RigaIntestazione (che dovrebbero essere messi in testa alle singole pagine, e che potrebbero essere spostati all'interno dell'header noinclude da Alebot).
 
==Osservazioni==