Utente:Candalua/Sandbox: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Nessun oggetto della modifica
Riga 4:
* vedere quante pagine ha
* chiamare un parse per ottenere il testo di tutto il libro:
* strippare i tag html, togliere i css, convertire le html entities in normali caratteri unicode e rimanere quindi con il puro testo. Lasciare però il marcatore dei numeri di pagina
* lanciare tutti i vari controlli per trovare gli errori. Mostrare la lista degli errori trovati, con link in modifica alla pagina corrispondente.
 
bonus:
* possibilità di segnare un errore come "falso positivo" in modo che non venga più riproposto
* possibilità di scaricare il puro testo
 
 
<pre>
var index = mw.config.get('wgPageName');
text = '<pages index="indice.djvu" from=1 to=208 />'
index = index.substring(index.indexOf(':') + 1);
textvar wtext = '<pages index="indice.djvu' + index + '" from=1 to=208 />'
$.ajax({
url: "/w/api.php?action=parse&text=" +text wtext + "&prop=text&format=json&contentmodel=wikitext&disablelimitreport",
success: function(data) {
testovar html = data.parse.text['*'];
var div = document.createElement("div");
div.innerHTML = html;
var text = div.textContent || div.innerText || "";
console.log(text);
}
});
</pre>
* strippare i tag html, convertire le html entities in normali caratteri unicode e rimanere quindi con il puro testo. Lasciare però il marcatore dei numeri di pagina
* lanciare tutti i vari controlli per trovare gli errori. Mostrare la lista degli errori trovati, con link in modifica alla pagina corrispondente.
 
bonus:
* possibilità di segnare un errore come "falso positivo" in modo che non venga più riproposto
* possibilità di scaricare il puro testo