Utente:Candalua/Sandbox: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Etichetta: Ripristino manuale
Nessun oggetto della modifica
Riga 1:
roadmap:
{{#babel:it|vec|en-3|admin|burocrate}}
 
presa una pagina indice:
* vedere quante pagine ha
* chiamare un parse per ottenere il testo di tutto il libro:
<pre>
text = '<pages index="indice.djvu" from=1 to=208 />'
$.ajax({
url: "/w/api.php?action=parse&text="+text+"&prop=text&format=json&contentmodel=wikitext&disablelimitreport",
success: function(data) {
testo = data.parse.text['*'];
}
});
</pre>
* strippare i tag html, convertire le html entities in normali caratteri unicode e rimanere quindi con il puro testo. Lasciare però il marcatore dei numeri di pagina
* lanciare tutti i vari controlli per trovare gli errori. Mostrare la lista degli errori trovati, con link in modifica alla pagina corrispondente.
 
bonus:
* possibilità di segnare un errore come "falso positivo" in modo che non venga più riproposto
* possibilità di scaricare il puro testo