Apri il menu principale
OrbiliusMagister è in Wikisinghiozzo permanente per motivi di famiglia e lavoro...
chiedete pure, ma non abbiate troppa fretta di ricevere risposta.
Archivi
Dall'iscrizione al 07/11/07......a maggio 2008......a novembre 2008......ad aprile 2009......a novembre 2009......al 15 maggio 2010......al 3 novembre 2010......al 26 maggio 2011...
...al 5 novembre 2011......al 1° maggio 2012......al 9 novembre 2012......al 6 maggio 2013......a fine 2013......a fine 2014......a fine 2015...a fine 2016
...a fine 2017 ...a fine 2018
Questi archivi sono "link permanenti". per vedere a che periodo facciano riferimento passaci sopra il puntatore. Se vuoi creare link a uno specifico messaggio nell'archivio basterà aggiungere un'ancora (#titolo_del_messaggio) dopo l'indirizzo completo dell'archivio.
Esempio: iPork il 22 dicembre 2007 mi scrisse un ringraziamento: il link al messaggio all'interno dell'archivio è Speciale:LinkPermanente/246069#Grazie
Edward Collier's trompe l'oeil painting.jpg Buchladen.jpg
Scatolotte dal passato
Aubrey · iPork

BenvenutoModifica

se non lo vedi, clicca qui!
Benvenuto su Wikisource!

Ciao OrbiliusMagister, un saluto di benvenuto su Wikisource, la biblioteca libera!

Per iniziare la tua collaborazione, leggi come prima cosa cos'è Wikisource, la pagina delle linee guida ed i manuali contenuti nella sezione aiuto. Se hai domande, dubbi o curiosità non esitare a chiedere al Bar, a un amministratore o a qualsiasi utente vedessi collegato seguendo le ultime modifiche.

Buon lavoro e buon divertimento da tutti i wikisourciani.


Naturalmente benvenuto anche da parte mia e se avessi bisogno non esitare a contattarmi. IPork 11:46, 7 gen 2006 (UTC)

Convenzioni nomi pagine IndiceModifica

Dove stanno? Non le trovo! Magari un utente inesperto ha più fortuna..... :-(

Intanto Ruthven sta aiutandomi per Progetto:Trascrizioni/Illustrazioni, e nel frattempo ho oltre 700 immagini tl|Ritaglio già realmente croppote e salvate in locale che aspettano di essere sistemate graficamente e poi caricate. Dopodichè la bella, ma temporanea avventura di Ritaglio si chiude :) --Alex brollo (disc.) 14:50, 3 gen 2019 (CET)

Pope! /2Modifica

Ciao Edo! In questo periodo ho deciso di battezzare il Pope come mia rilettura, proprio per poterlo finire, dato che aspetta la convalida da tempi ancestrali, quindi, come direbbe Crozza... Yessa, conta su di me! Lo concludo io (ovviamente in base alle mie esigenze lavorative, ma si fa). -- Modafix (disc.) 16:28, 8 gen 2019 (CET)

Salgari e una vecchia richiestaModifica

Salgari ha un M&S molto problematico, si incanta spesso in corrispondenza delle illustrazioni (due pagine dimancato match confondono l'algoritmo). Nella cronologia della pagina Utente:Alex brollo/Salgari vedi i numerosi lanci di Match che ho dovuto fare, facendolo ripartire ridando un codice Match là dove si era incantato.

Mi sono deciso a studiare il codice python di Match per farlo lavorare offline. Ho qualche barlume di speranza di farcela, sto modificando le cose generali per farlo lavorare in locale e poi (sarà dura....) devo capirlo riga per riga. Vediamo! --Alex brollo (disc.) 22:12, 11 gen 2019 (CET)

PS: forse lo script si orienterebbe meglio inserendo nel testo, prima del match, le didascalie delle illustrazioni, in questo caso il numero delle pagine senza corrispondenza calerebbero da due a una. Serve inoltre un "estrattore di testo ns0" che crei un unico file testo accodando i testi dei capitoli ripuliti dalle monnezze. Questo non è difficile. Tu puoi lanciare in una tua cartella locale uno script python? --Alex brollo (disc.) 22:17, 11 gen 2019 (CET)
Ahem.... ho un terminale, ho python, ma tutto lì :D
Se ci organizziamo con una sessione "live" via chat, telegram, Hangout o simili e mi segui passo passo posso farlo. - εΔω 23:51, 11 gen 2019 (CET)
Può bastare, tanto ce ne vuole di tempo.... la parte ostica dell'algoritmo sta cedendo, imparerò parecchio dalla sua autopsia, ma prima di capirlo riga per riga (e forse migliorarlo per permettergli di superare i problemi Salgari) ce ne vuole. Tu sai che sono lento...... :-). Nel codice c'è un commento, ad un certo punto, messo lì da chi ha ereditato lo script: "No idea about what it means"... E' realmente un algoritmo duro. --Alex brollo (disc.) 07:36, 12 gen 2019 (CET)
Hurrà. --Alex brollo (disc.) 22:33, 12 gen 2019 (CET)

Prospettive M & S localeModifica

Lo script funzia, non solo: non fallisce là dove (per eccesso di pagine "fuori testo") il M & S canonico si pianta. Adesso c'è Ruthven che lavora per il djvu, anche se mi pare azzoppato dall'uso di un Mac (tu ne sai qualcosa), e si profilano cose notevoli. Prossimo passo per il M & S locale: farlo lavorare anche con i testi pdf. Di certo è possibile; forse sarà addirittura facile :-) --Alex brollo (disc.) 10:43, 14 gen 2019 (CET)

Fatto, effettivamente era facile, il M & S locale corre anche sui pdf (Internet Archive).
Che ne dici, comunico la cosa a Phe, o la passo pr ma a Ruthven, che certamente sa muoversi meglio di me nel magico mondo del debugging? --Alex brollo (disc.) 11:13, 14 gen 2019 (CET)
@Alex brollo, passa la palla prima a Ruthven, che è meglio.
P.S. Dai un'occhiata alla cartella Dropbox "Djvu files Edo" che condividi con me. Ci ho caricato la fonte di L'insegnamento della vita e massimamente del parlare, un libello di una trentina di pagine da trasformare in Djvu. Mi arrangerei del tutto se non fosse che l'originale ha una sacco di noterelle che nel nostro testo non sono state trascritte e che richiederebbero diverso tempo da trascrivere da zero. Si tratterebbe di un altro piccolo tassello di M&S. - εΔω 13:57, 14 gen 2019 (CET)
Mi stai chiedendo se è possibile integrare nel Match il nostro testo con i testi aggiuntivi della fonte che non sono stati trascritti? Se questa è la domanda, a naso direi sì, è possibile, ma è un problema tutt'altro che banale.... ci devo riflettere. L'ho già incontrato in Salgari, dove le didascalie delle foto sono presenti solo nel'OCR ma sono totalmente assenti nel nostro testo da matchare, mi ero infastidito ma le didascalie sono brevi e avevo scrollato le spalle.
Bella sfida, grazie! --Alex brollo (disc.) 11:43, 15 gen 2019 (CET)
Per dirla tutta a me basta anche solo un OCR delle note utilizzabile, mentre il testo preesistente lo elaborerei a mano. Non voglio farti usare tempo prezioso che ti serve per progetti più ambiziosi (come ad esempio... che ne so, la Storia della letteratura italiana di Tiraboschi) ^_* - εΔω 19:26, 15 gen 2019 (CET)
Meno male.... stavo per dirti che è impossibile, per la logica di Match; per capirla bene mi è servito un tremendo intoppo in La Città dell'Oro. Ci ragionerò. Forse qualcosa si può fare, ma non attraverso Match. Intanto, appena recupero FineReader, micci metto (prima però vorrei andare avanti con Salgari: hai furia?) Alex brollo (disc.) 01:01, 16 gen 2019 (CET)
Aimè, non trovola cartella su dropbox, ho fatto pulizia e forse l'ho scollegata. Puoi rispedirmi la condivsione? Nel frattempo, un occhio a c:Category:Salgari - La Città dell'Oro (1898) e sua sottocategoria Illustrations from...., controlla se le categorizzazioni (seguendo i suggerimenti d Ruthven) ticonvincono e poi...vedi che utente ha caricato le illustrazioni...? :-) BrolloBot (disc.) 22:48, 16 gen 2019 (CET)
https://www.dropbox.com/s/08m2y53y159qlzl/L_insegnamento_della_vita_e_massimamente.pdf?dl=0 --εΔω 00:13, 17 gen 2019 (CET)

IndentaturaModifica

Per favore mi aggiusti l'indentatura del brano iniziale di questa pagina, grazie --Susanna Giaccai (disc.) 15:46, 14 gen 2019 (CET)

Ultima paginaModifica

Puoi portare questa pagina al 100% così si può chiudere la rilettura. Per di più la pagina sarà visibile solo nel 2030. --Luigi62 (disc.) 22:51, 21 gen 2019 (CET)

Tesi e copyrightModifica

Senza mettere troppa carne sul fuoco, ma inizia col leggere il mio commento su Discussioni progetto:Tesi. L'idea è di, pian pianino, sanare la situazione. --Ruthven (msg) 11:57, 25 gen 2019 (CET)

Tiraboschi su IAModifica

Ecco la tabella degli item trovato con tiraboschi storia letteratura italiana su IA, dopo (faticoso) completamento dei metadati essenziali: Utente:Alex brollo/Tiraboschi

A te! Alex brollo (disc.) 19:28, 28 gen 2019 (CET)

Passo II:; scaricati tutti i volumi linkati a GB nella pagina Autore:Girolamo Tiraboschi, II edizione modenese. Sto verificando cosa succede a fare una trasformazione diretta in djvu con pdf2djvu. Ho anche dato un'occhiata al testo OCR di Google, come si estrae con pdftotxt, e non è malaccio. Impressionante il corretto riconoscimento dei caratteri ſ. Mancano però gli hyphen, il che è un problema.
Secondo me va fatto un serio pensiero all'edizione 1822 e succ. di IA, che ha grafia moderna e di cui sono disponiobili scansioni multiple (di esemplari diversi) elencati sotto "Classici" nella tabella linkata, che corrisponde all'editore Milano: Società tipografica de' classici italiani. Le scansioni sono molto buone, penso che l'OCR sia altrettanto buono, la disponibilità di scansioni diverse dovrebbe essere una garanzia per pagine mancanti/fallate ecc. Aspetto feedback. --Alex brollo (disc.) 12:35, 29 gen 2019 (CET)

Primo tentativo TiraboschiModifica

Indice:Tiraboschi - Storia della letteratura italiana, volume I, 1822.djvu, ma non mi soddisfa, in corso altra conversione djvu. --Alex brollo (disc.) 15:20, 7 feb 2019 (CET)

Ricaricato. --Alex brollo (disc.) 09:38, 8 feb 2019 (CET)
Pensi di tentare un M&S da LiberLiber? --Alex brollo (disc.) 15:53, 7 feb 2019 (CET)
Mi secca ossessionarti, ma ho bisogno di conferma.
Dopo alcuni test seguo questa procedura:
  • accodamento in unico PDF del vari PDF di un volume
  • estrazione della sequenza immagini con pdfimages
  • pre-elaborazione immagini (divisione, raddrizzamento, cropping e memorizzazione TIFF colore 300dpi) con Scan Tailor
  • elaborazione sequenza TIFF con FineReader e produzione djvu
Sono caricati i primi due djvu. Dimmi se ti sembrano decenti.
A questo punto sistemerò i campi Sommario e fatto questo occorre predisporre una strategia di caricamento. Io tenterei, come dicevo, un Match offline sui testi ricavati da LiberLiber, ma fatto il Match prima di lanciare lo Split vorrei passarti i file per verifica/eventuale raffinamento. Ce la fai a fare tu questa verifica? --Alex brollo (disc.) 09:37, 8 feb 2019 (CET)
Caro @Alex brollo, l’idea di prendere LiberLiber mi piace, però ho imparato dal lavoro su Satira e antisatira che partendo da un'edizione moderna è richiesto prima del M&S un grosso lavoro di "antichizzazione del testo" ora banale ma in qualche caso (in particolare quando si consideri la punteggiatura) francamente ineseguibile. Liberliber si basa sull'edizione Molini-Landi, che spero non abbia differenze rilevanti rispetto a quella da noi utilizzata, mentre scopro che dietro la trascrizione su Liberliber c'è Utente:F.Chiodo, persona esperta e molto accurata. Passami i txt e darò loro un esame approfondto per vedere cosa differisca e cosa manchi. - εΔω 10:23, 8 feb 2019 (CET)
Bene, mi organizzo per fare un test sul Volume I, così vado anche un po' avanti con il progetto "Match offline". Alex brollo (disc.) 11:50, 8 feb 2019 (CET)
Primi test deludenti, il testo delle note (numerose nella parte I, Etruschi) non viene esportato nel txt ottenuto dall'ocd LiberLiber e il match automatico si inchioda. La vedo brutta. Alex brollo (disc.) 23:32, 10 feb 2019 (CET)

Particolare Tiraboschi con Match and FixModifica

Vewdo che l'edizione originale non usa i caratteri latini combinati æ, œ mentre il testo di riferimento LiberLiber li usa. Io li lascerei come ae, oe rispettando la grafia del testo a fronte. Sei d'accordo? Se sei d'accordo, modifico il testo LiberLiber prima di lanciare Match and Fix, e ottengo il risultato. Ma lo stesso risultato si può ottenere anche che un colpetto di memoRegex. --Alex brollo (disc.) 14:53, 15 feb 2019 (CET)

Match and Fix caricabile con splitModifica

Mi sono permesso di caricare in Utente:OrbiliusMagister/9 l'output alternativo di Match and Fix, dovrebbe essere pronto per essere caricato con Split, previa eventuale correzione manuale. Il comando che ho usato è stato: maf(ini=111,fin=131, load=False), load=False disattiva il caricamento via bot pagina per pagina. Fai dei test se vuoi; naturalmente puoi copiarne e caricarne solo dei piccoli pezzi di poche pagine, per prova.

IO al momento "salto" questo gruppo di pagine e inizio con la sezione successiva (Magna Grecia se non ricordo male). --Alex brollo (disc.) 16:36, 15 feb 2019 (CET)

Ricaricato Utente:OrbiliusMagister/9 previa modifica del testo di riferimento, adeguandolo per alcune differenze sistematiche fra edizioni: scioglimento dei caratteri latini æ, œ e sostituzione della finale in j con ii (studj->studii). --Alex brollo (disc.) 08:45, 16 feb 2019 (CET)
Ricaricato ancora Utente:OrbiliusMagister/9 dopo ripassata con Match and Fix, versione 2. Vedo che sei impegnato altrimenti; aspetto lasciando in sospeso quel gruppo di pagine. --Alex brollo (disc.) 14:22, 21 feb 2019 (CET)
@Alex brollo, la mia attuale settimana è piuttosto infernale quanto a impegni lavorativi; Scusa se non ti ho risposto prima. Immagina di rivolgerti a un analfabeta: leggendo Aiuto:Match and Fix il comando che hai usato prevede l'installazione offline di uno script da lanciare via linea di comando: da dove scarico tale script? - εΔω 22:46, 21 feb 2019 (CET)
Immaginavo che tu fossi stra-impegnato.
Pert quanto riguarda le pagine che ti ho preparato in Utente:OrbiliusMagister/9 non serve nulla: guardale, eventualmente fa qualche piccola correzione, e poi lancia il solito "Split".
Per quanto riguarda invece lo script Match and Fix, può essere scaricato da Progetto:Bot/Programmi in Python per i bot/matchAndFix.py, ma negli ultimi giorni c'è stata una forte accelerazione nella sua messa a punto.... per ora il consiglio è, lascia perdere, guarda il risultato dal file Split come Utente:OrbiliusMagister/9 in poi. --Alex brollo (disc.) 07:54, 22 feb 2019 (CET)

Lavori su SplitModifica

@Xavier121, Candalua, Ruthven Dopo il lavoro su Match, Xavier121 mi ha sottoposto un caso che suggeriva un intervento su Split. La cosa è stata più facile del previsto ed è totalmente scroitta in javascript: in pratica, lanciando la funzione da una pagina in edit, contenente codici split (tipo ==[[Pagina:....]]==), lo split viene eseguito immediatamente. La funzione crea le pagine nsPagina, ma anche le sovrascrive se già presenti (era questo il problema di Xavier: vedi colloquio nella mia pagina di discussione).

Il problema è la potenza dello script, che corre a una velocità inumana (in pochi secondi, il tempo che lo Split normale utilizza per una-due pagine, ha lavorato su centinaia di pagine). Non vorrei che i "piani alti" lo vedano come un problema o che la mitragliata di edit attivi qualche allarme. Al momento non ha costruito un'interfaccia utente ma mi domando se - oltre a tutte le prec auzioni per limitare il rischio di errori - sia opportuno implementare un meccanismo di rallentamento del lavoro.

Naturalmente, il fatto che Match and fix produca, opzionalmente, una pagina testo con i codici Split già pronti costituisce un raccordo funzionale fra il "nuovo Match" e il "nuovo Split", che testerò con Tiraboschi. --Alex brollo (disc.) 11:51, 18 feb 2019 (CET)

Per me il nuovo Split è fondamentale nel lavoro off line e permette di gestire interi testi approcciando uno studio totale della formattazione. Direi che, vista la potenza dello strumento, dovrebbe essere abilitato solo per utenti esperti (non necessariamente anche amministratori). --Xavier121 12:46, 18 feb 2019 (CET)
@Alex brollo Per la velocità d'esecuzione, non penso che sia un problema maggiore. Però fai queste cose con l'utenza bot, a scanso di equivoci (e magari usa il parametro -pt perché quello che rischi è di perdere alcuni "salvataggi"). --Ruthven (msg) 14:43, 18 feb 2019 (CET)
@Ruthven Grazie. Lo script dovrebbe essere "per tutti", con le opportune cautele, quindi personalmente posso usare l'utenza bot ma non tutti ne dispongono. Per gli utenti normali ci vuole una soluzione diversa. Ma.... cos'è il parametro -pt? Non ne ho la minimissima idea... Dammi un link che mi tolga dal buio.... --Alex brollo (disc.) 16:01, 18 feb 2019 (CET)
@Alex brollo Quando lanci un bot, gli puoi dire ogni quanti secondi salva una modifica. Questo è essenziale per 1) non intasare le ultime modifiche 2) non avere bot che girano all'impazzata. Di solito, si fanno fare modifiche ogni tot secondi... bisogna andarsi a rivedere le raccomandazioni di WM. @Valerio Bozzolan aveva avvertito sui pericoli delle modifiche troppo fitte (temporalmente). --Ruthven (msg) 10:38, 19 feb 2019 (CET)
@Ruthven Non stiamo parlando di un bot python, ma di un gadget javascript. Per quello la menzione del patrametro -pt mi confondeva. Ci penserò. --Alex brollo (disc.) 13:55, 19 feb 2019 (CET)
@Alex brollo Ahhh il poblema si era posto su Commons, tempo fa, per il cat-a-lot. Non ricordo che sia stata apportata una soluzione, alla fine. --Ruthven (msg) 15:50, 19 feb 2019 (CET)
@Ruthven Bene. Siccome comincio a usare cat-a-lot e vedo che è velocino o_O, fintanto che cat-a-lot resta così veloce non me ne preoccupo :-) Alex brollo (disc.) 18:37, 19 feb 2019 (CET)

Osservazioni e sviluppi di Match and fixModifica

Sono sempre più soddisfatto di M&F!

Due osservazioni:

  1. dà il meglio dove OCR dà il peggio (testi latini, francesi, abbreviazioni ecc). Esempio: Pagina:Tiraboschi - Storia della letteratura italiana, Tomo I, Classici italiani, 1822, I.djvu/652.
  2. se, come in LiberLiber, si dispone di un pdf, si può usare direttamente come testo di riferimento il pdf, M&F può occuparsi serenamente dell'estrazione del testo. --Alex brollo (disc.) 12:06, 24 feb 2019 (CET)

Il punto su Match and FixModifica

Sono preso dalla messa a punto di Match and Fix, che pone interessanti e difficili problemi (aumentare il numero di correzioni giuste e diminuire il numero di correzioni sbagliate). Dovrei essere al punto di estendere le correzioni ai casi di erroneo splitting di parole singole nell'OCR (per dire: ampia mente, invece che ampiamente) che è al momento il più frequente errore non riconosciuto e non corretto.

Non riesco bene a capire se Match and Fix - modellato su Tiraboschi - può avere un uso più ampio e generale, al momento mi basta che serva per Tiraboschi, certamente ne valeva la pena; poi vedremo. Grazie ai caricamenti su Tiraboschi la statistica annuale dice che abbiamo di poco superato (come caricamenti totali, SAL 25% compreso) gli amici polacchi :-) --Alex brollo (disc.) 08:33, 7 mar 2019 (CET)

Un esempio della "intelligenza" di M&F, ogni tanto chiede conferma se è incerto:
[u'bindelli', u'lineai', u'liis'] [u'tandem', u'finem', u'his']
sequenza molto diversa, confermi match?
--Alex brollo (disc.) 17:23, 7 mar 2019 (CET)

Tiraboschi newsModifica

Come avrai visto, ho completato una prima fase dei lavori (alcuni tomi li ha prenotati Xavier, ma ne ho a sufficienza per farmi un'idea generale).

A questo punto passerei a una rilettura "ortografica" del tomo IX, Indice generale, con qualche esperimento di linkaggio.

Un paio di problemi:

  1. granularità della suddivisione in livelli ns0. Ho rinunciato per ora alla suddivisione in Capi ma sento la mancanza di link almeno fra gli Indici e sommari e i singoli capi. Si potrebbe pensare a un uso smodato di tl|§.
  2. tomi multi-indice. Ho riunito i tomi in ns0, il peggiore, come sai, deriva dalla fusione di 4 diversi indici. Per ogni tomo ho riunito le pagine Indice e sommario dei vari volumi in un'unica pagina. Non è fedelissimo alla fonte ma mi sembra logico e funzionale (in fondo è solo una ricollocazione).
  3. indice generale. Ho intenzione di stressare i nostri strumenti - come tl|Pg - ma è possibile un fallimento, potrebbe essere necessario inventarsi qualcosa di nuovo. Esiste poi il problema: le singole voci possono essere collegate semplicemente a livello pagina, o è necessario "puntare", nella pagina, al singolo "bersaglio" con un'ancora?

In breve: ci hai affidato una bella gatta da pelare..... --Alex brollo (disc.) 23:46, 12 mar 2019 (CET)

Riguardo al test sul tl|Pg (senza ancora puntuale, solo recupero link alla pagina) vedi primi test es. in Pagina:Tiraboschi - Storia della letteratura italiana, Tomo IX, Indici, Classici italiani, 1826, XVI.djvu/5. Può andare? Alex brollo (disc.) 22:50, 14 mar 2019 (CET)
Rispetto ai problemi:
  1. L'uso smodato di qualunque template allo stato attuale della tecnologia ci è precluso, oltre un certo numero non così esorbitatne di chiamate a uno stesso template la pagina si impalla;
  2. Ottimo lavoro: nulla da ridire e complimenti.
  3. Meglio accontentarsi di mirare a livello di pagina: per me sarebbe già un guadagno notevole. A proposito: il test sull'inizio dell'indice da te linkato qui sopra è un gran successo, pensavo però la problema del sovraccarico di template pg in ns0: abbiamo indici con molte pagine transclusi in ns0? come si comportano?
Avanti tutta: vedo la fine del lavoro sporco tecnico. - εΔω 23:11, 15 mar 2019 (CET)
Mi era sfuggita la risposta, l'ho adocchiata solo dopo aver aggiunto l'ultimo messaggio,grazie. Per quanto riguarda il template Pg, effettuata la trasclusione in nso di pagine veramente grosse del volume (suddiviso per lettere iniziali), come la A, di una quarantina di pagine, tutto OK: il sistema regge, il limite di impallo è lontano (attorno alle 150 pagine). Naturalmente Titaboschi è un lavoro pesante, assorbe quasi tutte le mie energie.... ma come dice la storiella cinese: e chi dice che sia un male?.... mi resta meno tempo per fare danni.... :-) Alex brollo (disc.) 07:12, 29 mar 2019 (CET)

aiutoModifica

Mi puoi aiutare per questo problema?, Ciao --Susanna Giaccai (disc.) 21:14, 17 mar 2019 (CET)

Passaggio da VeronaModifica

Ciao! Passerò da Verona martedì, per un corso a docenti di scuola superiore: possiamo sentirci nei prossimi giorni? --Mirko Tavosanis (disc.) 19:34, 22 mar 2019 (CET)

TiraboschiModifica

Quando "passo" la metà di un libro, sento che ce la posso fare. Ebbene, ho "passato" la metà del terrificante Volume XVI di Tiraboschi. Spero che le scelte che ho fatto per i linkaggi siano passabili, anche se ho sempre l'impressione che si potrebbe fare qualcosa di più. --Alex brollo (disc.) 07:00, 29 mar 2019 (CET)

m:WikiClassics User GroupModifica

Hi OrbiliusMagister! :-) There is a WikiClassics User Group under construction at meta. So far, it's a place for users who are interested in Classics and want to help each other. I'd appreciate if you would join us. And when you like, please help spread the word. Best, DerHexer (disc.) 00:37, 30 mar 2019 (CET)

I'm back for Bandini!Modifica

Hiya, I know, it's been ages since I last worked on Discorso economico sopra la Maremma di Siena. I haven't forgotten it, life just got very busy for me! I remember how helpful you were to me. :) Can you help me again? You previously linked me to a very clean scan of the text - much better than the one I uploaded. Does it make sense for me to keep working on this fuzzy one? Is there a way to replace the scan with the more clear one? What do you recommend? Thanks! And sorry for using English. Julia\talk 22:56, 4 apr 2019 (CEST)

Dear @Julia W, there is no actual need for a replacement: any Italian reader can understand that DjVU and the link to the cleaner copy is useful in case of doubt. As you may have noticed, if you can go on and transcribe as best as you can, we (or at least I) are going to format and proofread the reamining pages, leaving the honor of validating them to you. - εΔω 12:07, 5 apr 2019 (CEST)
Thank you! I will keep adding pages. :) Is it okay to be marking my transcriptions as 75% or should I mark them 50% so I know when they have been checked by an Italian speaker? Validating refers to marking them as 100, is that correct? Many thanks, sorry I am not more familiar with Wikisource. Julia\talk 21:07, 5 apr 2019 (CEST)

Tiraboschi XVI a SAL 75%Modifica

Ho il piacere di avvisarti che il terribile Volume XVI di Tiraboschi è passato a SAL 75%. Non lo metto in Nuovi arrivi perchè... è una sottopagina. Un mese di lavoro da pensionato....

Ti prego, quando hai pochi minuti, di aprire l'Indice in visualizzatore, e di rovistarlo con la funzione Ricerca. Per fortuna il bug di CirrusSearch è risolto e la Ricerca funziona di nuovo.

Seconda cosa: ti propongo anche di guardare questa pagina, di Paperoastro: ha superato difficoltà di formattazione (testo e grafica) veramente notevoli. Lo propongo per una "stelletta" adeguata. --Alex brollo (disc.) 23:53, 7 apr 2019 (CEST)

PS: vedo una deflessione verso il basso del grafico delle riletture, straordinariamente corrispondente a quella degli amici polacchi. Lascio per un po' Tiraboschi e mio dedico a "casi semplici" per vedere se riesco a muovere la curva. Dimmi pure, comunque, se ci sono altre attività più utili per il progetto. --Alex brollo (disc.) 10:48, 10 apr 2019 (CEST)

La curva si è mossa.... un effetto piccolissimo ma si è mossa. Vedo di persistere :-) --Alex brollo (disc.) 09:53, 14 apr 2019 (CEST)
Torno a Tiraboschi; sempre con la strategia "prima le rogne", ho formattato i quattro "Cataloghi" che chiudono i volumi I-IV e adesso con pazienza li rileggerò. Appena torno ai testi veri e propri cercherò di fare qualche "pensata" per i link autori. :: PS: Sarebbe interessante verificare quanti, fra i testi antichi nominati da Tiraboaschi nei quattro Cataloghi, sono online da qualche parte.... Alex brollo (disc.) 17:14, 22 apr 2019 (CEST)
PS molto corretto. Tiraboschi cita una tale miriade di autori (non meno di Leopardi nel suo Zibladone) per cui è opportuno capire quali sicuramente vadano rilevati mediante categorie e quali lasciare repribili con la normale casella di ricerca.

Altra applicazione di Match and FixModifica

Guardando Wikisource:Scrittori d'Italia, mi sono accorto che abbiamo a disposizione due OCR: quello "incorporato" nel pdf originale BEIC, e quello prodotto da Internet Archive e incorporato nel djvu. Controntando i testi a campione, l'OCR djvu è migliore, tuttavia contiene errori che in genere non sono presenti nell'OCR pdf. Nell'uno e nell'altro gli errori sono pochi; la punteggiatura nel djvu è ben riprodotta, nel pdf è un disastro (per probabili errori di conversione di qualche simbolo interno del pdf). Nessuno dei due può servire come "testo di riferimento" per Match and Fix.

Sto riflettendo sulla possibilità di inserire nell'OCR djvu le parole discordanti, affiancate una all'altra con qualche trucco che consenta di scegliere, in rilettura o in pre-elaborazione, l'una o l'altra con un click. Una cosa come affiigevano#affliggevano basterebbe.

L'idea generale comunque, a parte i tecnicismi, è quella di trasformare quanti più possibili testi BEIC in "SAL 25% pieno" invece di lasciarli là come "SAL 25% vuoto", e chiedo il tuo parere sull'opportunità di farlo; se mi dai l'OK io procederei in modo sistematico nell'elenco Wikisource:Scrittori d'Italia --Alex brollo (disc.) 15:01, 4 mag 2019 (CEST)

@Alex brollo, Un buon 25% pieno è un invito sempre migliore del link rosso, dunqeu hai il mio bene palcito immediato. Prendi il Canone della letteratura italiana e vedi se ci sono opere che hanno la precedenza in quanto mancanti o bisognose di un invito. - εΔω 18:51, 4 mag 2019 (CEST)
Ottimo suggerimento! Il primo testo utile è:   Storia d'Italia    di Francesco Guicciardini (1540), ideale per Match and Fix (edizioni differenti), per un po' non farò danni software :-) --Alex brollo (disc.) 20:23, 4 mag 2019 (CEST)

Orlando furiosoModifica

La prima galoppata è finita. Sia Orlando furioso, che Orlando furioso (sec. la stampa 1532), entrambi proofread, dovrebbero essere rupuliti e bluificati. Logicamente, SAL 25%, ma almeno dovrebbe esserci un po' d'ordine: non mi ripromettevo di più. --Alex brollo (disc.) 19:04, 26 mag 2019 (CEST)

Dichiarazione e pasticciModifica

Caro OrbiliusMagister, oggi ho importato un testo da Wikipedia e l'ho formattato a dovere:   Dichiarazione dei diritti della donna e della cittadina    di Olympe de Gouges (1791), traduzione dal francese di Francesca Di Donato (2004). Andandolo a linkare su Wikidata, scopro che esistono delle sottopagine "volanti" (in pratica, le sottopagine di Speciale:Prefissi/Dichiarazione_dei_diritti_della_donna_e_della_cittadina/) create anni fa da @Giaccai da una traduzione di Francesca Di Donato, autrice vivente e quindi in copyviol. Devo ammettere che del testo importato da Wikipedia non sono stato capace di verificare l'autore e che, avendolo trovato quasi ovunque in Rete, l'ho taggato ottimisticamente come "anonimo", ma potrebbe essere lo stesso identico testo. Come risolviamo questo pasticcio (sia di formattazione che di diritti)? Per precauzione, io cancellerei tutto. --Ruthven (msg) 18:38, 27 mag 2019 (CEST)

Scusa il doppio messaggio, caro. Sia Susanna che io siamo salvi dall'infame marchio del copyvioler! Ho trovato la fonte del testo di Francesca Di Donato a https://archiviomarini.sp.unipi.it/589/1/decla.pdf Riproduciamo la nota di copyright come richiesto e siamo in regola. Rimane la formattazione della pagina e delle sottopagine (e l'eventuale caricamento su Commons del testo). Questo è più campo tuo.... --Ruthven (msg) 18:47, 27 mag 2019 (CEST)

Domanda su Orlando FuriosoModifica

Daresti una rapida occhiata a IA, per suggerirmi - fra le moltissime edizioni disponibili - una con note attendibili? vorrei un aiuto per individuare autori e personaggi storici a cui spesso Ariosto accenna con espressioni che per me sono molto peggio di quiz enigmistici.... e nè l'edizione Laterza, nè tantomeno quella letterale aiutano.

PS: avrai notato che il SAL 75% per almeno uno dei due Orlandi furiosi è ormai a portata di mano.... :-) --Alex brollo (disc.) 08:19, 9 giu 2019 (CEST)

Re: Un salutoModifica

Ciao, tutta "colpa" dell'Edithaton a Nesso! (Sono tornata anche attiva su Wikipedia...) Vediamo quanto riesco a conciliare tutto con la vita fuori da qui... :) Grazie per il saluto!!! Inskatolata (disc.) 18:02, 16 giu 2019 (CEST)

Galoppata....Modifica

.... ma alla fine i cinque terribili sommari di Indice:Le antiche rime volgari I.djvu e seguenti ci sono. Tutti i dati indispensabili sono riuniti in un grosso Excel. Lo condivido nella cartella Edo di Dropbox, AnticheRimeVolgari.xls; confermami che lo vedi please. --Alex brollo (disc.) 00:31, 21 giu 2019 (CEST)

Ancora sul Canzoniere VaticanoModifica

Ho constatato che il testo si presta pochissimo a una decente elaborazione offline, ci vogliono i tools di wikisource per aggiungere i poem, gli smaller block per le annotazioni, ecc. Userei una tattica indiretta: creerei delle sottopagine temporanee tipo Canzoniere Vaticano latino 3793/1-50 con il testo, fornito di link split, del blocco di pagine comprendenti le poesie dalla I alla L, per pre-processarlo grossolanamente prima di caricarlo; niente impedisce (conflitti permettendo...) di scaricare il testo e processarlo anche online prima di lanciare lo split o lo split ultraveloce.

D'accordissimo sulla doppia transclusione, a blocchi nelle sottopagine, poesia per poesia in pagine indipendenti. Mi piacerebbe assemblare i blocchi per autore, piuttosto che semplicemente per ordine numerico. Se sei d'accordo potrei dedicarmi a questa cosa, ma prima ti segnalo la pagina temporanea Discussione:Canzoniere Vaticano latino 3793/Elenco autori che dovrebbe essere completamente bluizzata, creando le pagine Autore che mancano. Fatto questo potrebbe essere creato l'indice delle sottopagine del testo, con dei nomi sottopagina "decenti", e sarebbe anche più facile la compilazione dei template Intestazione per le poesie singole.

So che il testo ti interessa, usami pure come bot fornito di scarsa intelligenza artificiale :-) --Alex brollo (disc.) 15:32, 21 giu 2019 (CEST)

Problema noteModifica

Ti carico in utente:OrbiliusMagister/common.js una riga di codice che fa scomparire/comparire i riferimenti come da discussione in bar tecnico. Per non perdere tempo nella costruzione di bottoni ecc, ho associato l'attivazione della funzione a un semplice doppio click sul box che contiene il testo. Giusto per farti vedere l'effetto finale. --Alex brollo (disc.) 14:40, 11 lug 2019 (CEST)

Greco da controllareModifica

Quando hai 3 min di tempo puoi controllare questa Pagina:Rivista italiana di numismatica 1897.djvu/247. Non riesco a vedere gli spiriti, né sul testo originale, ma neanche sulle lettere da inserire. Te lo chiedo perché lo stesso testo è usato in più parti della rivista. Grazie.

--Carlo M. (disc.) 14:59, 16 lug 2019 (CEST)

Ho problemi visivi: non riesco a vedere il tipo di spirito, sia nel testo, ma neanche nel gadget che permette di scrivere in greco antico. Immagino che lì sotto la seguenza accenti spiriti ecc. sia sempre la stessa. Se me la fai sapere lavori di meno. Spesso mi sono anche aiutato con Perseus.. D'altro canto il greco dopo il liceo l'ho semi abbandonato. Prima metà degli anni '60. --Carlo M. (disc.) 20:22, 22 lug 2019 (CEST)

Due cosetteModifica

  1. "cosa" wikisourciana: trovo il lavoro su Goldoni divertente e anche molto stimolante per i test di pre-formattazione e non solo (vedi ultimo messaggio in Bar tecnico); ti va come va il lavoro? C'è ancora tutto il tempo di ripensarlo.
    Risposta: il lavoro procede molto bene: un girettino mi ha dato da pensare su un altro lato (un sal 100% non era del tutto impeccabile), ma dal punto di vista della preelaborazione è un lusso non indifferente: medito sulla possibilità di proporlo a qualche mio studente.
  2. "cosa" WMI: inaspettatamente Marta mi ha dato un buon feedback per l'evento di Milano, io non ero (e non sono) minimamente soddisfatto delle mie capacità; se possibile eviterei volentieri di accettare l'invito per settembre, evento molto più grosso e con ascoltatori di rilievo, sarei molto ma molto più sereno se lo prendessi in carico tu e/o altro wikisourciano capace di una migliore presentazione e dotato di una maggiore "veduta d'insieme". Parliamone! --Alex brollo (disc.) 00:39, 20 lug 2019 (CEST)
    @Alex brollo, Con tutto il cuore ti dico già di sì, ma evidentemente la disponibilità dipende dalla data precisa e dalla sede. Come sai settembre è un mese importante per chi lavora nella scuola e io sarò sicuramente impegnato nelle prime due settimane di settembre. εΔω 09:38, 20 lug 2019 (CEST)
Vedo che Marta di ha mandato una mail, senz'altro ti darà tutti i dettagli. Ti inoltro intanto la mia risposta alla proposta di Marta. Se dovessi bere io l'amaro calice, farei l'unica cosa che so fare: qualcosa di "boldo", ma con un taglio completamente diverso dal tutoraggio-test di Milano; il pubblico è diverso, le aspettative diverse e stle e contenuti devono quindi essere diversi. Qualche dimostrazione sì, ma pratica poca o niente. Alex brollo (disc.) 00:36, 24 lug 2019 (CEST)

I sette a TebeModifica

Per qualche motivo I sette a Tebe, SAL 75%, è finito fra gli ultimi riletti invece che fra gli ultimi trascritti. Almeno mi pare... Dacci un'occhiata. --Alex brollo (disc.) 00:28, 24 lug 2019 (CEST)

Caro @Alex brollo, il motivo è presto detto: ero di frettissimissima e ho scritto nella sezione sbagliata. Grazie alla tua segnalazione ho rimediato subito. - εΔω 08:36, 24 lug 2019 (CEST)

Errore nell'evidenziazione della sintassiModifica

Mi sono scervellato per capire da dove viene quella categoria rossa del Bar: Categoria:Pagine con errori nell'evidenziazione della sintassi. Sospetto che venga da <source lang=wiki>, può essere? Non trovo wiki fra i linguaggi che il tag supporta. --Alex brollo (disc.) 22:01, 28 lug 2019 (CEST) Caro @Alex brollo, grazie della segnalazione. Mi sembrava infatti incredibile che non esisttesse un evidenziatore di sintassi per mediawiki... eppure è così. Ho sostituito con il più spartano pre. - εΔω 10:36, 29 lug 2019 (CEST)

PropostaModifica

Ciao e grazie per il benvenuto. Se non ti dispiace, vorrei portare avanti io la trascrizione di La villa medicea di Careggi. Penso possa essere un buon inizio per imparare a capire come funziona, ed essendo anche un testo di poche pagine non sarebbe troppo difficile per un eventuale rilettore trovare eventuali errori. E poi, mi dà un pò fastidio tirare in ballo qualcosa e lasciarla fare a qualcun altro, se posso farlo anch'io. Fammi sapere. Saluti. --DonShimoda (disc.) 14:25, 10 ago 2019 (CEST)

Grazie mille per i consigli. Appena possibile (in giornata) mi metterò all'opera. Saluti e buon proseguimento. --DonShimoda (disc.) 15:46, 10 ago 2019 (CEST)

---Ho iniziato la rilettura e la sistemazione delle pagine seguendo le modifiche che hai effettuato. Penso di essere a un buon punto. Sono pronto a capire come importare le immagini da una pagina di testo. Quando vuoi. Saluti --DonShimoda (disc.) 15:02, 11 ago 2019 (CEST)

WikilinkModifica

Ciao e scusa il disturbo. Ho iniziato a porre i wikilink nelle varie pagine. Per il momento sono arrivato alla 13 del testo. Potresti, a tempo perso, controllare se lo sto facendo nel modo giusto? Grazie e buon proseguimento. --DonShimoda (disc.) 16:06, 12 ago 2019 (CEST)

Goldoni finito (per modo di dire...)Modifica

Che galoppata! Ma fra poche ore sarà finito il "precaricamento preformattato" di tutti i 22 volumi delle Commedie di Goldoni. Un'esperienza intensissima, un mare di scoperte.... quanto e come condividere? Solito dilemma: condividere completamente operazioni abbastanza complesse, in cui l'utente normale si raccapezzerebbe con difficoltà, o considerarla un'avventura personale in cui conta il risultato, più che il percorso?

Come risultato: abbiamo circa 10000 nuove pagine con un SAL particolare ("formattato ma non riletto"). :-) --Alex brollo (disc.) 11:57, 14 ago 2019 (CEST)

@Alex brollo, ti prego documenta quello che puoi: queste migliaia di pagine saranno rilette a distanza di molti anni, non sappiamo da chi e come e se quando tu sarai o non sarai presente: il risultato migliore finora ottenuto è stato quello Zibaldone dove appunto la documentazione è stata costante e chiara. - εΔω 14:51, 14 ago 2019 (CEST)
Giusto, ho un'età che impone prudenza, non si sa mai :-)
Ci sono comunque due aspetti della documentazione: il codice wiki così com'è, e questo lo documenterò di certo per capire bene come e perchè funziona (e avere idea di dove mettere le mani se non funziona), e il meccanismo di pre-elaborazione, che richiede python, regex, excel ed altro ancora ma che interessa a una esigua minoranza di utenti avanzati. Prima la documentazione del codice, in una pagina che dovrà essere linkata a ciascuna Discussione indice. Non so se mi è sfuggito, in caso indicamelo, un tuo parere sul template {{Poem t}}. Io sono entusiasta, ma come sai ogni scarafone ecc. --Alex brollo (disc.) 15:04, 14 ago 2019 (CEST)
@Alex brollo, te lo scrivo qui perché sia semipubblico: al Bar non mi ero espresso completamente per leggere anche il parere di altri. Se mi chiedi il *mio personale* parere ripensa a quello che ci dicemmo a Como: a mio parere il template allontana gli utenti e circnda il testo come avevamo stabilito di non fare per tenere il testo testo il più possibile fuori dai template. Lo so, sono un laudator temporis acti ma più complichiamo le operazioni di lavoro su Wikisource più allontaniamo i nuovi utenti. Nel caso più recente un nuovissimo utente, dopo pochi giorni di permanenza su Wikipedia si rende disponibile qui per lavorare su La villa medicea di Careggi e mentre lo seguivo mi sono reso conto che per spiegare il meccanismo delle note separate ho fatto prima a inserirle direttamente io, ma questo per permettere all'utente di digerire Capolettera; Ct; CropTool; AutoreCitato/Wl. Ecco, spero di rendere un'idea del fatto che la nostra curva di apprendimento (apprendimento di per sé poco e male documentato) è tale da inibire quelle soluzioni che non portino ad una reale semplificazione. Facciamo un eoldoni e ci facciamo riferire se per lui è semplice o meno. - εΔω 15:44, 14 ago 2019 (CEST)
Che delusione.... va be', smetto di pensare ai possibili sviluppi, e, come faccio di solito, do la precedenza alla rilettura delle commedie in versi, una volta portate a SAL 100% il caso si "chiude", e resterà un caso isolato, che verrà scovato solo da rari "filologi digitali" che vadano a rovistare nel codice di opere finite. Il nuovo codice potrà essere sempre confrontato con quello "tradizionale" di Il Moliere. Non è difficile, se sarà necessario, convertire i codici poem t in "codice Moliere" con una passata di bot, lasciandolo eventualmente attivo in una sola opera, come caso test. Alex brollo (disc.) 22:44, 14 ago 2019 (CEST)
Iniziato l'aggiornamento e approfondimento di Progetto:Teatro/Goldoni (Commedie).
PS. cosa significa "facciamo un eoldoni"? Staroveronese...? Alex brollo (disc.) 16:04, 15 ago 2019 (CEST)
@Alex brollo, LOL, hai ragione: è una forma errata per facciamo rileggere un "Goldoni" a un utente nuovo come prova di rilettura; se si districa tra i codici vorrà dire che mi sto sbagliando.εΔω 01:01, 16 ago 2019 (CEST)

──────────────────────────────────────────────────────────────────────────────────────────────────── Hai mai provato a editare con il primordiale visual editor de noaltri poareti, ossia dall'anteprima di eis? Ha mille difetti e limitazioni, ma consente di editare singole parole senza vedere nulla del markup, ed inoltre è dinamicamente e istantaneamente "allineato" con il sottostante testo. Alex brollo (disc.) 09:29, 16 ago 2019 (CEST)

@Alex brollo, in effetti ci ho provato una o due volte, ma mi fa paura non vedere cosa sta accadendo "sotto scocca" quando cancello o aggiungo qualcosa. Sono un procariote del progetto, non faccio testo. - εΔω 09:34, 16 ago 2019 (CEST)

Nuova rilettura del meseModifica

Ciao, abbiamo finito la rilettura di      Elogio della pazzia    di Erasmo da Rotterdam (1509), traduzione dal latino di Eugenio Camerini (1863) (Carino! Il re dell'aria non mi aveva appassionato, invece...) ; ho segnalato la fine e archiviato la rilettura... ma come funziona la scelta del prossimo libro? --Inskatolata (disc.) 05:21, 15 ago 2019 (CEST)

Simplex, @Inskatolata! Vedi Discussioni Wikisource:Rilettura del mese, proponi qualcosa o cerchi tra le proposte in ballo, e ne poni una nuova. Oppure se non te la senti lasci un messaggio e proponi tu una nuova rilettura tra gli indici al 75%. Insomma... molto easy. Chiaro che se tutto questo avviene per tempo non sci sitrova a prendere decisioni affrettate, ma in caso di necessità si fa: io l'ho fatto molte volte.

Re: Problematica.... cioè?Modifica

Ciao, buongiorno. Non so se il ping ha funzionato. Comunque ti ho risposto di là. --DonShimoda (disc.) 09:16, 22 ago 2019 (CEST)

Test bot su CommonsModifica

Finalmente ho riattivato il mio bot su Commons (il passaggio a Linux, insieme alle modifiche di pywikibot, mi stavano scoraggiando).

Ci sono due grandi "pulizie" da fare su Commons, soprattutto su quelle ottenute con CropTool:

  1. eliminazione del background (spesso, ma non sempre, il background "colorato" è estremamente fastidioso)
  2. revisione radicale del testo (CropTool combina seri disastri, es. conserva scioccamente il tl|DjVu di Commons anche alle jpg ricavate dal libro, e categorizza immagini come "Book").

Avevo cominciato ma poi la migrazione ad altro pc e a altro sistema operativo mi avevano bloccato.

Ti chiedo di indicarmi qualche testo da usare per fare delle prove. --Alex brollo (disc.) 09:02, 30 ago 2019 (CEST)

Un esempio importante: File:Iliade (Romagnoli) I (page 58 crop).jpg. Non è un caso semplice: per alcune illustrazioni di Iliade il background colorato non dà particolare fastidio, ma per altre sì; mi sarebbe più agevole eliminare il background in tutte (in questo caso si tratta di immagini che possono perfino essere rese in BN). Il problema è in parte presente anche in tutte le altre opere curate da Romagnoli. --Alex brollo (disc.) 09:10, 30 ago 2019 (CEST)
@Alex brollo: tutte le immagini dei libri di Romagnoli derivano da xilografie: sono in bianco e nero punto: dato il tipo di disegno a tratto spesso idealmente sarebbero vettorizzabili, ma questo è un pensiero superiore agli obiettivi pratici. Quando le immagini sono private di sfondo e rese a tratto spesso nero verrebbero alleggerite e rese utilizzabili dappertutto. Il mio tentativo di estrazione del canale alfa con XnView è questo, cioè un fallimento. - εΔω 12:53, 30 ago 2019 (CEST)

Community Insights SurveyModifica

RMaung (WMF) 16:34, 9 set 2019 (CEST)

AttivitàModifica

Oltre sistemare Goldoni, sto dando la caccia a indici SAL 50% per la presenza di poche pagine problematiche. In effetti ce ne sono, e sistemandoli la lista "Ultimi testi trascritti" in Main page si sta muovendo un po'. :-) --Alex brollo (disc.) 01:27, 16 set 2019 (CEST)

Ritorna alla pagina utente di "OrbiliusMagister".