Wikisource:Siti autorevoli/Internet archive: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 50:
# eliminare, spesso, i doppi a capo.
 
Molte di queste correzioni possono essere fatti con pochi click chiamando funzioni javascript. ChiedeteNon apreoccuatevi [[Utentese la cosa vi sembra aliena:Alex brollo]]anche se non avete idea di cosa sia javascript,o lo sapete vagamente ma non avete laminima idea di come utilizzarlo, tutto si risolve nel far comparire qualche tastino o qualche link in più nella vostra finestra di modifica. Basta che chiedete aiuto a qualcuno, che vi aiuti.
 
Utenti disponibili dare una mano con javascript:
# [[Utente:Alex brollo]]
 
=== Strategia 2: tools e tecniche per caricare i testi "in massa" ===
Esiste la possibilità di caricare i testi di IA "in massa" sulle pagine Pagina:. E' difficile immaginare come queste tecniche risultino, alla fine, più efficenti del tool di ThomasV; è bene tuttavia sapere che esistono, per utilizzarle in casi particolari o in casi in cui non si disponda di un djvu con layer di testo.
 
====Caricamento via bot, script djvutext.py====
Lo script legge, pagina per pagina, il layer testo del file djvu e lo scrive nella corrispondente pagina Pagina:. La sua azione, al momento, è esattamente identica a quella del tool di ThomasV ma il caricamento avviene "in massa": tutte le pagine vengono caricate così come sono nel layer, al ritmo di 5-10 pagine al minuto.
 
Utenti a cui chiedere l'attivazione della procedura di caricamento:
# [[Utente:Alex brollo]]
 
Riferimento per i bottolatori (su it.source occorre una versione modificata di djvutext.py!):
# [[Utente:Alex brollo]]
 
====Caricamento via bot, script vari "fai da te"====
[[Utente:Alebot|Alebot]] accede a alcuni script "fai da te" per caricare in nsPagina testi a partire dal file djvu.xml di IA, o da qualsiasi file testo dove sia presente un chiaro messaggio di "inizio e numero pagina". Nel caso dei file di Internet Archive (djvu con layer di testo), è difficile immaginare come questa procedura, alla fin fine, sia più efficente dello script di ThomasV associato all'uso di qualche buon tool js per la post-elaborazione dell'OCR non appena caricato nella pagina.