Discussioni progetto:Trascrizioni/Match and split

Ultimo commento: 6 mesi fa, lasciato da Alex brollo in merito all'argomento L'Avarchide
Bar del Match and split

Portale progetti   Progetto trascrizioni   Match & Split 

Split senza match: Gutemberg

modifica

Lavorando su La guerra del vespro siciliano, inserita acchiappando il testo da Gutemberg e poi elaborata a fronte, mi sono accorto che il testo era disseminato di codici del tipo {3}, {4} .... e mi sono reso conto che indicavano il punto d'inizio del testo di una pagina cartacea e il numero della pagina. :-)

In altri termini: è bastato aggiungere i pochi codici che mancavano, sostituirli con il codice split, che altro non è che una cosa del genere:

==[[Pagina:Per le vie (1883).djvu/203]]==

dove l'unica cosa da sistemare per bene è il numero della pagina djvu, che in genere, tranne occasionali errori o stranezze, si può calcolare dal numero di pagina cartacea.

In altri termini: nelle opere come Gutemberg, o altre, in cui l'inizio e numero pagina sia compreso nel testo, si può passare direttamente allo split senza passare per il match! Basta che l'utente umano o bot sostituisca il codice inizio pagina originale con quello che attiva lo split. :-)

Quindi: nuova vita per i caricamenti di questo tipo di opere, purchè esista online un file immagine corrispondente; e tenete conto che in questo caso NON serve che ci sia il layer di testo nel file immagine, perchè tale layer serve solo per fare il match, NON per fare lo split! --Alex brollo (disc.) 10:10, 1 nov 2010 (CET)Rispondi

Ecco una prima cosa che potrebbe fare il buon Alebot su toolserver, volendo. Dobbiamo ripristinare un modo per fare richieste al bot, in modo che tu non debba tutte le volte farlo partire. Io sono molto intrippato per questa storia dei form, che però sono codici js. Se il buon Candalu a volesse aiutarci, potremmo far partire delle pagine speciali in cui uno mette i dati e poi parte tutto: scaricamento libro, regex, match and split. E in generale, creazione testi, sommari, ecc. Si potrebbe fare tutto (sto andando un po' OT, lo so, ma questo è il mio sogno da sempre qui su Source...) Aubrey McFato 10:48, 1 nov 2010 (CET)Rispondi
Avete mandato avanti me, ma sul toolserver dovrebbe starci Candalua! Bè, magari se ci stiamo entrambi qualcosa di buono verrà. Certo, avere un bot in attesa di richieste sarebbe molto bello; ma c'è un problema: quasi sempre, fare delle richieste complesse è complesso... l'illusione che si possano fare richieste complesse in modo semplice si schianta rapidamente con la realtà. Altrimenti sarebbe facile maneggiare i database; e invece.... :-( --Alex brollo (disc.) 17:38, 1 nov 2010 (CET)Rispondi

Galileo

modifica

@OrbiliusMagister Ripassando i vari elenchi di M & S trovo, in quello dei lavori incompleti, varie opere di Galileo. mi punge vaghezza di cominciare a ristrutturarle come testi indipendenti, adesso sono sottopagine di volumi. meglio ancora: come raccolte indipendenti di testi indipendenti; es. Discorso intorno alle cose che stanno in su l'acqua o che in quella si muovono da Favaro dovrebbe stare in una raccolta di testi correlati all'opera, fra l'altro di autori diversi. Che ne dici? Alex brollo (disc.). 19:44, 17 ago 2022 (CEST)Rispondi

Che dire, @Alex, tutto ciò che riesce a mettere ordine all'opera di Galileo e d fonte cartacea ai nostri testi è per me benvenuto.
Ti rimando allo stato dell'arte di cinque anni fa: se fosse per me accoppierei tutto ciò che è ancora naked con i volumi di Favaro, ma so che non è né agevole né sempre correttissimo ;-) εΔω 20:13, 17 ago 2022 (CEST)Rispondi

Luciano e Settembrini: diamoci un taglio

modifica

Cari amici (e in particolare @Alex brollo,

Ho trovato il file perfetto per unire le opere di Luciano di Samosata tradotte da Luigi settembrini in questo file (IA): peccato che sia un unico file che contiene i tre volumi dell'opera: il vantaggio è la coerenza del package: sono tre volumi acquisiti a suo tempo tutti della stessa edizione e IA ci permette di cvaricare i file djvu; lo svantaggio è che l'ordine dei volumi è sbagliato: nel file compaiono nell'ordine i vol 2º, 3º ed ultimo e 1º. O carichiamo un unico file djvu con tutti e tre i volumi ma nel giusto ordine, oppure separiamo i tre volumi caricandoli a parte (soluzione utile per rendere più accettabile il lavoro di trascrizione). Posso approfittare dell'esperienza di chi maneggia file djvu come niente? εΔω 21:24, 28 dic 2022 (CET)Rispondi

@OrbiliusMagister I volumi hanno una numerazione pagine autonoma: dividere senz'altro. Mi proponi, per favore, tre buoni nomi per i file djvu? Alex brollo (disc.). 21:41, 28 dic 2022 (CET)Rispondi
@Alex brollo, Propongo File:Opere di Luciano voltate in italiano da Luigi Settembrini - Tomo 1.djvu, lasciando da parte anno, città e autore+traduttore, già citati nel titolo; la pagina raccolta in ns0 sarà Opere di Luciano. εΔω 22:00, 28 dic 2022 (CET)Rispondi
@OrbiliusMagister Affare fatto. Naturalmente a te rivedere il tl Book su Commons (schema base: quello su Utente:Alex brollo/Book). Alex brollo (disc.). 22:11, 28 dic 2022 (CET)Rispondi
@OrbiliusMagister File caricati, il primo è File:Opere di Luciano voltate in italiano da Luigi Settembrini - Tomo 1.djvu. Se hai bisogno di una mano per il resto, mi trovi... nella Roma del 1835 :-) Alex brollo (disc.). 22:33, 28 dic 2022 (CET)Rispondi
Grazie, @Alex brollo! Sei una scheggia! Lo sai che non ti tedio se non per quello in cui non riesco ad arrangiarmi: per il M&S mi posso muovere in autonomia. Per fortuna Snark è stata un'ottima trascrittrice, dunque il lavoro è abbastanza liscio. Occupati di Belli, che è un lavoro molto meritorio. εΔω 23:03, 28 dic 2022 (CET)Rispondi

L'Avarchide

modifica

@OrbiliusMagister L'Avarchide ha una strana impaginazione... intanto vedo come viene il djvu con pdf2djvu. Per evitare il problema del doppio numero di pagine, una possibilità sarebbe quella di sezionare le pagine normalizzandole, ma bisognerebbe eliminare la curiosa intestazione e riducendo di molto la fedeltà della riproduzione. Alex brollo (disc.). 20:15, 23 apr 2024 (CEST)Rispondi

Ritorna alla pagina "Trascrizioni/Match and split".