Valeria De Francesca (BEIC)
Ciao Valeria De Francesca (BEIC), un saluto di benvenuto su Wikisource, la biblioteca libera!
Per iniziare la tua collaborazione, leggi come prima cosa cos'è Wikisource, la pagina delle linee guida ed i manuali contenuti nella sezione aiuto. Se hai domande, dubbi o curiosità non esitare a chiedere al Bar, a un amministratore o a qualsiasi utente vedessi collegato seguendo le ultime modifiche.
Buon lavoro e buon divertimento da tutti i wikisourciani.
Vuoi aiutarci a migliorare i progetti tematici e la navigabilità del sito? Unisciti al Progetto Qualità e vieni a dare il tuo contributo. |
Ciao, mi ha detto Chiara che con te lavoreremo qui in Wikisource, fantastico! Io ho qualche ideuzza, ho messo un paio di collegamenti in questa pagina. Ti va di aggiungerla agli osservati speciali e parlarne in pagina di discussione là, quando hai tempo? Altrimenti sentiamoci/vediamoci come preferisci. --Federico Leva (BEIC) (disc.) 10:47, 19 gen 2015 (CET)
Deledda
modificaBenvenuta, felicissimo di incontrarti su queste pagine; per qualsiasi cosa, chiedi pure senza riserve :)--Xavier121 19:35, 3 feb 2015 (CET)
- Grazie! Sono alle primissime armi, quindi senza dubbio ti disturberò!--Valeria De Francesca (BEIC) (disc.) 16:37, 11 feb 2015 (CET)
- Ecco, trovato: cosí funziona. Non so se sia prassi, ma mi sembra ragionevole limitarsi all'opera che dà il titolo al volume. --Federico Leva (BEIC) (disc.) 13:38, 5 feb 2015 (CET)
- Oooooh, molto bene! Grazie assai!--Valeria De Francesca (BEIC) (disc.) 16:32, 11 feb 2015 (CET)
- Mi intrometto, attirato dalla sigla BEIC :-).
- Stasera completo la pagina Indice di cui si parla, compilando il campo Sommario ancora intonso. Dalla stessa struttura del Sommario (che è il vero "indice elettronico" del libro) penso che ogni dubbio sarà chiarito... e si preparerà ciò che serve per il procedimento di transclusione semiautomatica delle due opere in namespace principale. --Alex brollo (disc.) 12:28, 12 feb 2015 (CET)
- Ecco fatto. La pagina Indice è la digitalizzazione di un singolo libro, che è una raccolta di due opere. La pagina corrispondente in ns0 è una pagina tipo raccolta: Il vecchio della montagna - Odio vince. Separate, le due opere che fanno parte della raccolta: Il vecchio della montagna e Odio vince. La suddivisione in capitoli di ognuna delle due opere è registrata nella pagina Indice, nel campo Sommario. Tutti gli elementi sono collegati fra loro da link. --Alex brollo (disc.) 17:03, 12 feb 2015 (CET)
- Oooooh, molto bene! Grazie assai!--Valeria De Francesca (BEIC) (disc.) 16:32, 11 feb 2015 (CET)
Re: Pirandello
modificaBellissimo! Ci hai risparmiato dozzine di pagine inutilissime, infatti. :) Federico Leva (BEIC) (disc.) 11:08, 12 feb 2015 (CET)
- In compenso ho trovato interessante il passaggio sulla scarsità della carta! Le voci di Wikipedia in italiano sulla prima guerra mondiale sono pietose ma ho infine trovato un paragrafo che parlasse delle conseguenze della guerra sui civili: [1]. --Federico Leva (BEIC) (disc.) 11:24, 12 feb 2015 (CET)
Non aver paura di parlare al vento ;) Federico Leva (BEIC) (disc.) 16:11, 19 feb 2015 (CET)
Posso aiutarti?
modificaCiao, se c'è qualche modo in cui io possa semplificarti il lavoro che ci siamo prefissi qui per Wikisource, fammi sapere. Intanto ho chiesto a Chiara di darmi/darci l'elenco dei PID dei libri IA, cosí te li carico tutti e poi scegli liberamente senza "intermediazioni". Ti serve poi che ti faccia una tabella di qualche genere per incrociarli con quanto esiste in Wikisource? C'è altro? --Federico Leva (BEIC) (disc.) 08:50, 27 feb 2015 (CET)
- Ciao! Direi che se carichi tutti i pdf di IA e mi generi una tabella che confronti gli autori Ia con quelli presenti in Wikisource va già benissimo! Grazie!--Valeria De Francesca (BEIC) (disc.) 14:19, 2 mar 2015 (CET)
Kalevala
modificaCiao, ho appena finito di leggere il Kalevala in italiano e lo voglio aggiungere a Wikisource, ma non trovo una scansione. IT\ICCU\CUB\0353032 sostiene che BEIC ne abbia una copia, ma senza collegare il catalogo, e Primo non trova nulla. Chi ha ragione? --Federico Leva (BEIC) (disc.) 21:27, 28 feb 2015 (CET)
- Entrambi! Su SBN trovi la localizzazione alla BEIC, ma non della Digital Library, bensì del patrimonio del cartaceo :)--Valeria De Francesca (BEIC) (disc.) 14:23, 2 mar 2015 (CET)
Elenchi per categorie
modificaOltre alla ricerca normale: http://tools.wmflabs.org/catscan2/catscan2.php Federico Leva (BEIC) (disc.) 16:47, 17 mar 2015 (CET)
- Esempio: [2] --Federico Leva (BEIC) (disc.) 16:49, 17 mar 2015 (CET)
Bettinelli
modificaA Toronto non c'è: http://search.library.utoronto.ca/details?313544 --Federico Leva (BEIC) (disc.) 11:18, 19 mag 2015 (CEST)
- Caricati.[3] Federico Leva (BEIC) (disc.) 11:30, 19 mag 2015 (CEST)
trovata buona scansione di Bettinelli, Tomo 1
modificaHo trovato su Opal Libri Antichi una buona scansione non-google books del Tomo I delle opere di Bettinelli, ed. 1799. Ho giusto recuperato alcuni attrezzi (briss: fenomenale) che mi consentirebbero di elaborare i due file pdf di Opal ([4] e [5]) e caricarli su Internet Archive senza troppo fatica. Ti serve? Ci provo? --Alex brollo (disc.) 16:36, 19 mag 2015 (CEST)
- Oh, ma grazie! Il primo e il terzo volume sono gli unici che provengono da googlebooks, inoltre in BEIC ci manca il ventesimo.. Se c'è una versione migliore (e completa) tanto meglio! Appena sono disponibili, creo le corrispondenti pagine indice e modifico il link nelle esistenti.--Valeria De Francesca (BEIC) (disc.) 16:42, 19 mag 2015 (CEST)
- Volendo posso ricaricare il djvu direttamente come "modifica" del file esistente , riutilizzando quindi (forse con piccole modifiche) la pagina Indice attuale. Controllo se su Opal ci sono anche i volumi 3 e 20. --Alex brollo (disc.) 16:54, 19 mag 2015 (CEST)
- Sì, ci sono entrambi, sia il 3 che il 20. Ci sentiamo a caricamento su IA fatto! Li troverai dentro la collezione opallibriantichi di Internet Archive. Non fra mezz'ora, ovviamente.... :-P --Alex brollo (disc.) 16:57, 19 mag 2015 (CEST)
- Ma benone, direi! Grazie ancora! Non me li aspetto neanche fra un'ora o due eh... :D--Valeria De Francesca (BEIC) (disc.) 17:00, 19 mag 2015 (CEST)
- Caricato il tomo 1 da Opal su IA: IA, ma il djvu risultante dall'elaborazione automatica è molto insoddisfacente (forti artefatti per compressione troppo aggressiva da parte di Internet Archive). Sto tentando di ottenere una versione di migliore qualità con FineReader11.
- Aperta pagina Progetto:Trascrizioni/Bettinelli, per ora molto scarna (uno stub), per coordinare i lavori; ne parleremo in Bar --Alex brollo (disc.) 08:03, 20 mag 2015 (CEST)
- Ma benone, direi! Grazie ancora! Non me li aspetto neanche fra un'ora o due eh... :D--Valeria De Francesca (BEIC) (disc.) 17:00, 19 mag 2015 (CEST)
- Sì, ci sono entrambi, sia il 3 che il 20. Ci sentiamo a caricamento su IA fatto! Li troverai dentro la collezione opallibriantichi di Internet Archive. Non fra mezz'ora, ovviamente.... :-P --Alex brollo (disc.) 16:57, 19 mag 2015 (CEST)
Bettinelli completo
modificaHo caricato anche il volume XX di Bettinelli, dovremmo essere a posto, per la revisione del volume 3 mi prendo un po' di tempo :-) --Alex brollo (disc.) 07:41, 21 mag 2015 (CEST)
Prime impressioni da Lettere dieci di Virgilio
modificaCi sono problemi... le scansioni originali che IA ha utilizzato per il tomo 12 (e aimè, non solo) sono di qualità spesso molto scadente, il che comporta due problemi: le immagini del djvu sono talora veramente brutte (vengono ulteriormente peggiorate dalla compressione), ma quel che è peggio la qualità dell'OCR è variabile da pagina a pagina, e spesso è cattiva o pessima.
Un buon metodo per valutare rapidamente la qualità delle scansioni su IA è quella di scaricarsi il "full text" e di dargli una rapida occhiata per vedere che sia leggibile, anche se con qualche inevitabile errorino; in questo caso il full text dimostra evidentemente che ci sono grossi problemi.
Poichè ho deciso di partire con il tomo 12, Lettere di Virgilio e Inglesi, l'ho caricato da Opal e ci sto lavorando con FineReader - intanto spero di produrre un OCR decente, poi vediamo. --Alex brollo (disc.) 10:06, 27 mag 2015 (CEST)
Categoria opere in italiano
modificaTi sto popolando la categoria delle opere in italiano: [6]. A causa di una serie di bachi, però, l'elenco è comunque "sporco"... Mi dovrò inventare qualcos'altro. --Federico Leva (BEIC) (disc.) 17:19, 4 giu 2015 (CEST)
Due pagini mancanti in Beccaria
modificaCiao, vedi l'utile scoperta dei nostri ineffabili rilettori. Si riesce a segnalare l'errore nel catalogo? Penso non ci sia da fare altro dato che c'è già un'altra scansione (presumibilmente) corretta. Federico Leva (BEIC) (disc.) 17:22, 8 ott 2015 (CEST)
- Fenomenali! Segnalo senz'altro l'aggiunta della nota nel catalogo (che confido si potrà inserire a breve...). Grazie!--Valeria De Francesca (BEIC) (disc.) 09:38, 30 ott 2015 (CET)
Indice sommario in pagina Indice
modificaCara Valeria, ti segnalo che abbiamo un problema "bloccante" che riguarda il Template:Indice sommario. Poichè questi template alimentano gli script che creano il Modulo:Dati e da qui il mageggio del template Pg, è al momento necessario che abbiano una struttura testo rigorosa altrimenti il parsing fallisce (rimedieremo ma al momento questo è) e precisamente:
- il template deve essere scritto di seguito su una sola riga;
- non devono esserci spazio bianchi attorno ai caratteri | e =
Quindi: non così:
{{Indice sommario | nome = Memorie inutili/Parte prima | titolo = Parte prima | from = 7 | delta = 6 }}
ma così:
{{Indice sommario|nome=Memorie inutili/Parte prima|titolo=Parte prima|from=7|delta=6}}
--Alex brollo (disc.) 09:33, 7 set 2017 (CEST)
- @Alex brollo Uh! Va bene!! Grazie!--Valeria De Francesca (BEIC) (disc.) 09:36, 7 set 2017 (CEST)
- Non preoccuparti dei campi Sommario già compilati, ma solo di quelli nuovi; quelli vecchi li correggo al volo nel momento che mi serve Modulo:Dati. L'errore comunque è mio, appena ripesco lo script che fa il parsing lo aggiusto. Alex brollo (disc.) 11:47, 7 set 2017 (CEST)
- Bug pescato, lascia pure tutto com'è che è anche più carino :-) --Alex brollo (disc.) 13:05, 7 set 2017 (CEST)
- Non preoccuparti dei campi Sommario già compilati, ma solo di quelli nuovi; quelli vecchi li correggo al volo nel momento che mi serve Modulo:Dati. L'errore comunque è mio, appena ripesco lo script che fa il parsing lo aggiusto. Alex brollo (disc.) 11:47, 7 set 2017 (CEST)
Rtl
modificaNon va.... non si ottiene una tabella "come dico io" con le celle ben allineate. Non importa, proverò a sistemare mediante modifiche del codice template. --Alex brollo (disc.) 12:26, 21 set 2017 (CEST)
- @Alex brollo ecco... non volevo sembrare ossessivo-compulsiva, ma dà molto fastidio anche a me che non stiano allineate le colonne! :P
- Fatto --Alex brollo (disc.) 13:17, 21 set 2017 (CEST)
- La prossima volta dimmelo subitissmo, appena ti accorgi di qualche "ciambella senza buco" in quello che produco! --Alex brollo (disc.) 21:53, 21 set 2017 (CEST)
- @Alex brollo d'accordo, grazie mille! :) --Valeria De Francesca (BEIC) (disc.) 08:41, 22 set 2017 (CEST)
- La prossima volta dimmelo subitissmo, appena ti accorgi di qualche "ciambella senza buco" in quello che produco! --Alex brollo (disc.) 21:53, 21 set 2017 (CEST)
- Fatto --Alex brollo (disc.) 13:17, 21 set 2017 (CEST)
Algarotti - Saggi
modificaMi piacerebbe anticipare il caricamento dei Saggi di Algarotti, BEIC 226. Ho quindi creato Wikisource:Scrittori d'Italia/226 e vorrei procedere, sto lavorando per ottenere il djvu, ma ti chiedo innanzitutto de al vostro gruppo va bene l'anticipo, e se sì ti chiedo di verificare che abbia io scelto un nome giusto per il pdf, da cui deriveranno i nomi dei file derivati. A nome verificato cercherei di seguire il modello "standard" per caricare pdf e djvu su Commons, mentre il caricamento su IA sarebbe meglio che lo facciate voi in modo che risulti un caricamento vostro (ai fini di creare, in seguito, una collezione IA, che si potrà fare non appena il numero di caricamenti BEIC arriverà a 50). Fammi sapere - nel frattempo continuo a lavorare sul djvu.
PS: siamo a posto con il copyright per un'opera stampata nel 1963...? -Alex brollo (disc.) 06:02, 5 ott 2017 (CEST)
- PS PS: riguardando l'intestazione di Wikisource:Scrittori d'Italia suggerirei di aggiungere una nota autorevole riguardo al copyright/copyleft di tutte le opere della collana (eventualmente distinguendo i casi in base alla data di pubblicazione). E' un aspetto delicato che mi crea imbarazzi e credo non solo a me. --Alex brollo (disc.) 08:20, 5 ott 2017 (CEST)
- La data di pubblicazione e la collana non sono rilevanti, se non per il fatto che sono tutte edizioni di oltre 20 anni fa, quindi se anche si applicasse l'art. 84-quater (che non è automatico) i diritti relativi sarebbero scaduti. Conta solo la data di morte dell'autore e che io sappia abbiamo solo caricato scansioni di autori morti da oltre 70 anni. BEIC non vanta nessun diritto su ciò che è nel pubblico dominio, vedi http://www.beic.it/it/articoli/copyright . --Nemo 10:15, 5 ott 2017 (CEST)
- Ciao @Alex brollo, per il quesito sul copyright, ho passato la palla a Federico, che ha risposto qui sopra. Riguardo al pdf di Algarotti: nessun problema per l'anticipazione del caricamento (semplicemente lo escludiamo dai nostri caricamenti in commons), per il nome invece, metto quello corretto nella sottopagina (va modificato il nostro identificativo). Riguardo Archive, stiamo procedendo a caricare i pdf anche lì: è un processo un po' più lento rispetto a quello in commons, ma è inesorabile! ;) Grazie!--Valeria De Francesca (BEIC) (disc.) 10:36, 5 ott 2017 (CEST)
- Perfetto, procedo io su Commons seguendo il modello metadati / template di uno dei vostri caricamenti. Il djvu verrà carino (ho modificato i livelli di grigio e sono soddisfatto). --Alex brollo (disc.) 11:46, 5 ott 2017 (CEST)
Strabiliamento....
modificaSono strabiliato dalla tabella Wikisource:Scrittori d'Italia, e sono veramente soddisfatto del mio piccolo contributo costituito dal "template maggico". E' veramente una soddisfazione creare qualcosa che serve! --Alex brollo (disc.) 15:21, 14 nov 2017 (CET)
- @Alex brollo fai bene ad esserlo, è proprio utile!! :D :D--Valeria De Francesca (BEIC) (disc.) 18:30, 14 nov 2017 (CET)
Richiesta di caricamento anticipato
modifica@OrbiliusMagister ha scovato quattro vecchi file txt di Scrittori d'Italia, due dei quali non ancora caricati (217, Buonarroti; 224, Boiardo); ti chiedo di anticiparne il caricamento per procedere con esperimenti di caricamento del testo sulle pagine. Grazie! --Alex brollo (disc.) 10:02, 26 nov 2017 (CET)
- Ciao @Alex brollo, OrbiliusMagister! Sono già inseriti nella prossima tranche di caricamento entrambi: domattina arrivano!--Valeria De Francesca (BEIC) (disc.) 08:31, 27 nov 2017 (CET)
- Speravamo che fossero trascrizioni, ma mi sembra siano solo testi da OCR (ottimo, ma OCR). Lavori in corso su Indice:Bonarelli_-_Filli_di_Sciro.djvu. Riguarda e adatta i metadati su Commons, ho caricato in fretta, dimenticando, fra l'altro, di dare il nome "canonico" al djvu.... se vuoi siamo in tempo per cambiarlo. Una ottima notizia: alcuni problemi di IA Uploader sono sistemati. --Alex brollo (disc.) 12:49, 28 nov 2017 (CET)
- @Alex brollo, peccato! Ho rivisto i metadati; se possibile il nome da dare sarebbe 'Bonarelli, Guidubaldo – Filli di Sciro, 1941 – BEIC 1774985.djvu'. Bene invece per IAUploader: spero domani di concludere il caricamento dei pdf, quindi poi posso dedicarmi anche io ai djvu!--Valeria De Francesca (BEIC) (disc.) 13:23, 28 nov 2017 (CET)
- Rename del file richiesto su Commons. Finchè non si creano pagine nsPagina a nastro rinominare è semplice... --Alex brollo (disc.) 16:22, 28 nov 2017 (CET)
- @Alex brollo, peccato! Ho rivisto i metadati; se possibile il nome da dare sarebbe 'Bonarelli, Guidubaldo – Filli di Sciro, 1941 – BEIC 1774985.djvu'. Bene invece per IAUploader: spero domani di concludere il caricamento dei pdf, quindi poi posso dedicarmi anche io ai djvu!--Valeria De Francesca (BEIC) (disc.) 13:23, 28 nov 2017 (CET)
- Speravamo che fossero trascrizioni, ma mi sembra siano solo testi da OCR (ottimo, ma OCR). Lavori in corso su Indice:Bonarelli_-_Filli_di_Sciro.djvu. Riguarda e adatta i metadati su Commons, ho caricato in fretta, dimenticando, fra l'altro, di dare il nome "canonico" al djvu.... se vuoi siamo in tempo per cambiarlo. Una ottima notizia: alcuni problemi di IA Uploader sono sistemati. --Alex brollo (disc.) 12:49, 28 nov 2017 (CET)
Test su Internet Archive
modificaNon so più dove ti ho inviato la proposta di riflettere sulla possibililità di assegnare i caricamenti BEIC alla collezione Internet Archive itwikisource, intanto che ci pensi vorrei proporti un esperimento.
Cosa carichi su IA? Il file pdf, immagino. Bene: prendi un caricamento - esempio: Rime di Gaspara Stampa (IA), e rinomina quello che hai caricato, spero il pdf, da 052_Stampa_Rime_si242.pdf a 052StampaRimeSi242.pdf. Lo puoi fare, c'è un link "edit item", scegli la modifica dei files, la finestra che ti si apre è abbastanza intuitiva. Salva, IA dovrebbe avvisarti che partirà una riderivazione, ossia una rielaborazione di tutti i file derivati. Uffa! Potessi farlo io! Esiste la possibilità che IA Uploader sia "confuso" dalla differenza fra nome del file pdf (e derivati) e nome ID Internet archive.
L'altra strada è di chiedere a Sam di rivedere lo script e verificare se è possibile eliminare questa eventuale confusione, ma è molto più dura. --Alex brollo (disc.) 18:28, 7 dic 2017 (CET)
- Ciao @Alex brollo, fatto! Se funziona, posso farlo per tutti i file che ho caricato, nessun problema. Aspetto aggiornamenti!--Valeria De Francesca (BEIC) (disc.) 08:30, 11 dic 2017 (CET)
- Niente da fare... test negativi; ipotizzo un ulteriore problema, ho riferito agli sviluppatori: T182778, aspetto feedback (e intanto mi arrangio). Hai provatoil "tool stefano" per i campi Sommario? Alex brollo (disc.) 09:40, 20 dic 2017 (CET)
Share your experience and feedback as a Wikimedian in this global survey
modificaCiao! La Fondazione Wikimedia chiede il tuo parere con un sondaggio. Vorremmo sapere se stiamo sostenendo efficacemente il tuo lavoro all'interno e all'esterno del mondo wiki, e come possiamo cambiare o migliorare le cose in futuro. Le opinioni che condividi influiranno direttamente sull'attuale e futuro lavoro della Fondazione Wikimedia. Sei stato selezionato in modo casuale per partecipare a questo sondaggio poiché vorremmo ascoltare l'opinione della tua comunità Wikimedia. Il sondaggio è disponibile in diverse lingue e necessita tra i venti e i quaranta minuti per essere completato.
È possibile trovare maggiori informazioni sul progetto in questa pagina. Il sondaggio è ospitato da un servizio terzo ed è regolamentato dalla seguente informativa sulla privacy (in inglese). Visita la nostra pagina delle domande più frequenti per avere maggiori informazioni sul sondaggio. Se necessiti ulteriore aiuto o se non vuoi ricevere future comunicazioni su questo sondaggio, invia una email attraverso la funzionalità InviaEmail a WMF Surveys per essere rimosso dalla lista.
Grazie!
pdf2djvu
modificaTi raccomando di scaricarlo e di imparare a usarlo. Converte al volo i pdf in djvu e - se il pdf contiene uno strato OCR, e tutti i testi della serie Scrittori d'Italia ce l'hanno - incorpora nel djvu lo strato testo.
Non solo: essendo "a riga di comando" puoi scrivere un bat per cui pdf2djvu lavora, uno dopo l'altro, una serie di pdf. Ti interessa? --Alex brollo (disc.) 19:19, 4 apr 2018 (CEST)
- Esempio di bat. In questo momento sta correndo in background sul mio portatile un file go.bat con il seguente contenuto:
pdf2djvu -o BEIC_1872860.djvu BEIC_1872860.pdf pdf2djvu -o BEIC_1873537.djvu BEIC_1873537.pdf pdf2djvu -o BEIC_1962407.djvu BEIC_1962407.pdf
- Quando avrà finito, avrò tre djvu pronti da caricare su Commons, scopiazzando i metadati dei corrispondenti pdf. Nota che ho dovuto semplificare il nome file, pdf2djvu non "gradisce" i nomi file troppo lunghi e complessi. --Alex brollo (disc.) 20:21, 4 apr 2018 (CEST)
- Il primo djvu di prova costruito in questo modo è: File:Boccalini, Traiano – Ragguagli di Parnaso e scritti minori, Vol. I, 1948 – BEIC 1771083.djvu, prova a costruire la pagina Indice e a verificare come va l'OCR. Nota: per segnalare i file su cui sto lavorando, aggiungo il nome del djvu, in modo che il link lo mostri "rosso"; poi, appena caricato, si bluizzerà. --Alex brollo (disc.) 20:26, 4 apr 2018 (CEST)
- Grazie @Alex brollo! Avevo tentato, moooolti mesi fa, con pdf2djvu, ma il risultato OCR faceva pena... in ogni caso, ritenterò! E nel frattempo ho qualche altra pagina indice da sistemare ;)--Valeria De Francesca (BEIC) (disc.) 08:49, 6 apr 2018 (CEST)
- @Valeria De Francesca (BEIC) Hai ragione, ero stato ottimista. Lo strato testo derivato da pdf2djvu a partire dai pdf BEIC (buono in un caso, per le poche pagine verificate) è inaccettabile nella maggior parte dei casi. Tuttavia le immagini del djvu sono buone e - per i casi già caricati e derivati da IA - c'è il modo di caricare l'ottimo OCR di IA sul djvu senza testo, o con testo difettoso. Se hai un po' di familiarità con python (basta sapere come si installa e come di fa partire un programma da riga di comando) potrei farti avere lo script e le istruzioni. In qualche caso ci sono terribili problemi, ma non si sono per ora verificati nei caricamenti su IA dei volumi BEIC. Sto cercando di vare "annusare" allo script le condizioni di errore ancora non gestite e di fagli porre rimedio. Alex brollo (disc.) 15:25, 6 apr 2018 (CEST)
Lavori in corso
modificaCome avrai visto, sto caricando vari djvu di Wikisource:Scrittori d'Italia, se vuoi hai già un po' di lavoro, Xavier ne sta caricando altri.
Uso sistematicamente la tattica di creare il djvu immagine dal pdf con pdf2djvu; poi ci monto dentro l'OCR di Internet Archive (il che sfrutta la vostra utilissima fatica del caricamento su IA!). Dopo alcuni tentativi, ho abbandonato completamente il caricamento via pdf2djvu del testo nascosto dei pdf: la qualità è imprevedibile e mai ottimale.
Ti segnalo che ho trovato un caso con link IA errato, il numero 44 (Opere di Metastasio I) che puntava si Guicciardini; in più proprio per quell'opera IA si ingrippava e non me la mostrava (oggi le cose sono sistemate), per cui ho usato FineReader. Ho così potuto constatare il motivo per cui in questo tipo di opere FineReader fa una grande confusione nella struttura pagina, il che mi ha fatto pensare al modo di sistemare le cose. Per provarci apro l'Indice di Metastasio I, n. 44, vedrai un po' di movimento e di pagine fatte e rifatte....
Nel frattempo, se continui a creare Sommari, attenzione alla scelta del nome della pagina principale, è bene che sia "nuova/rossa" senza entrare in conflitto con testi già esistenti. --Alex brollo (disc.) 21:47, 7 apr 2018 (CEST)
- Ciao @Alex brollo, benissimo tutto. Ho visto i nuovi djvu e senz'altro mi occupo dei sommari quanto prima, stando attenta al nome principale. Grazie per la correzione al link di Metastasio... è sfuggito! Sono contenta che il caricamento su IA serva a qualcosa (stante la fine ingloriosa di IA uploader), se poi dovessi - improbabilmente - restare senza pagine indice da sistemare, ti chiederò come fare a montare l'OCR di IA sul djvu fatto con pdf2djvu ;)--Valeria De Francesca (BEIC) (disc.) 08:27, 9 apr 2018 (CEST)
- Bene. Sono molto eccitato dalle novità che sto sperimentando in Metastasio I, finalmente la teoria sulla questione "testo mappato" si è tradotta in vantaggio pratico. Per un colpo d'occhio alla cosa puoi scorrere Catone in Utica/Atto secondo; la differenza fra il "prima" e il "dopo", piuttosto impressionante, è questione di un singolo click.... + pochi aggiustamenti. Mi dedico per un po' alla creazione delle pagine Metastasio; avvisami quando hai carenza di djvu.
- Tieni conto che se le novità (caricamento dell'xml via bot) superano la fase test, la conversione in djvu sarebbe inutile: il caricamento dell'xml può avvenire anche in file aperti come pdf, cioè: quelli che ci sono. Quello che interessa è che esista su IA un file _djvu.xml. Proverò su uno dei volumi successivi proprio di Metastasio. --Alex brollo (disc.) 11:20, 9 apr 2018 (CEST)
- @Alex brollo uuuuuh... attendo i risultati del test dunque, e spero!--Valeria De Francesca (BEIC) (disc.) 09:42, 10 apr 2018 (CEST)
- partiti i lavori su Indice:Metastasio, Pietro – Opere, Vol. II, 1913 – BEIC 1884499.pdf, iniziando da Artaserse. Nota che il file è quello pdf originale che hai caricato su Commons e su IA, ma il sistema può tranquillamente ignorare l'assenza del file djvu e usare lo stesso lo strato testo del djvu "virtuale", precisamente usa il file _djvu.xml che IA pubblica regolarmente.
- Ti chiedo un piccolo sforzo: prova! induci altri a provare! Ci sono delle istruzioni minime in pagina Discussioni indice, ricordati solo di aggiungere la parolina magica
reorder
inserendola immediatamente prima di <OBJECT e prima di lanciare postOCR. Lo script fa cose complicate per noi umani, ma banali e velocissime per lui. In caso di dubbi, ovviamente, sono qua. - Dall'esito di questo test e dalla relativa discussione (sempre che riesca a farla partire... al momento sento solo un attonito silenzio.... :-) ) dipende la possibilità di ignorare la trasformazione djvu e lavorare direttamente sui pdf dell'intera collezione Scrittori d'Italia. --Alex brollo (disc.) 12:46, 11 apr 2018 (CEST)
- @Alex brollo evviva! Però ho bisogno di un tutorial for dummies, perché non mai riletto niente di niente, quindi mi serve essere presa per mano :P Ho provato a fare ciò che dici a pagina 165 (la prima di Adriano in Siria), ma c'è qualcosa che non mi torna: scrivo reorder prima di <OBJECT, clicco su postOCR Alt+7 nei link a sx 'strumenti per la rilettura' e... non succede nulla! cosa dovrebbe succedere? cosa non faccio? HELP!--Valeria De Francesca (BEIC) (disc.) 13:06, 11 apr 2018 (CEST)
- Ok, grazie... no, se non hai esperienza di rilettura ti ho lanciata in una "mission impossible" :-)
- Devo scegliere altre cavie, ma visto che segui BEIC ti saprò dire come la cosa procede e come finisce; l'ho notificata anche in lista email wikisource globale, vediamo. --Alex brollo (disc.) 14:11, 11 apr 2018 (CEST)
- @Alex brollo, ok, torno in ultima fila e aspetto... :D--Valeria De Francesca (BEIC) (disc.) 17:08, 11 apr 2018 (CEST)
- @Alex brollo evviva! Però ho bisogno di un tutorial for dummies, perché non mai riletto niente di niente, quindi mi serve essere presa per mano :P Ho provato a fare ciò che dici a pagina 165 (la prima di Adriano in Siria), ma c'è qualcosa che non mi torna: scrivo reorder prima di <OBJECT, clicco su postOCR Alt+7 nei link a sx 'strumenti per la rilettura' e... non succede nulla! cosa dovrebbe succedere? cosa non faccio? HELP!--Valeria De Francesca (BEIC) (disc.) 13:06, 11 apr 2018 (CEST)
- @Alex brollo uuuuuh... attendo i risultati del test dunque, e spero!--Valeria De Francesca (BEIC) (disc.) 09:42, 10 apr 2018 (CEST)
Reminder: Share your feedback in this Wikimedia survey
modificaOgni risposta in questo sondaggio aiuta la Fondazione Wikimedia a migliorare la tua esperienza sui progetti Wikimedia. Finora, abbiamo ricevuto commenti dal 29% degli utenti Wikimedia. Il sondaggio è disponibile in varie lingue e richiede tra i 20 e i 40 minuti per essere completato. Inizia il sondaggio adesso.
Se hai già compilato il sondaggio, siamo spiacenti che tu abbia ricevuto questo avviso. Abbiamo progettato il sondaggio in modo che sia impossibile identificare gli utenti che l'hanno già compilato, quindi dobbiamo inviare un avviso a tutti. Se non vuoi ricevere ulteriori avvisi o non vuoi essere più informato sui futuri sondaggi, invia una mail tramite la funzione InviaEmail a WMF Surveys. Puoi anche inviare qualsiasi domanda tu abbia a questa email. Maggiori informazioni su questo sondaggio sono disponibili alla pagina del progetto. Il sondaggio è ospitato da un servizio terzo ed è regolamentato dalla informativa sulla privacy della Fondazione Wikimedia. Grazie!
Your feedback matters: Final reminder to take the global Wikimedia survey
modificaCiao! Questo è l'ultimo promemoria sulla scadenza del sondaggio della Fondazione Wikimedia che verrà chiuso il 23 aprile 2018 (07:00 UTC). Il sondaggio è disponibile in diverse lingue e necessita tra i venti e i quaranta minuti per essere completato. Inizia il sondaggio adesso!
Se hai già compilato il sondaggio - grazie! Non ti disturberemo ulteriormente. Abbiamo progettato il sondaggio in modo che sia impossibile identificare gli utenti che l'hanno già compilato, quindi dobbiamo inviare un avviso a tutti. Per non riceve più informazioni su sondaggi futuri, invia una mail attraverso la funzione InviaEmail a WMF Surveys. Puoi anche inviare qualsiasi domanda a questa mail utente. Maggiori informazioni su questo sondaggio sono disponibili sulla pagina del progetto. Il sondaggio è ospitato da un servizio terzo ed è regolamentato dalla informativa sulla privacy della Fondazione Wikimedia.
Modifica nome file
modificaTi avviso che ho modificato il nome del pdf su Commons di Wikisource:Scrittori d'Italia/57, Vol. II di Prose di Ugo Foscolo, per armonizzarlo con quello dei volumi I e III; dai tre pdf sono stati ottenuti i djvu. Ho corretto di conseguenza i dati della tabella Scrittori d'Italia, c'è altro da correggere? --Alex brollo (disc.) 06:49, 27 apr 2018 (CEST)
- @Alex brollo ciao! Grazie, è stata ovviamente una mia svista di nomenclatura -.-' No, non c'è altro di collegato da correggere!--Valeria De Francesca (BEIC) (disc.) 08:21, 27 apr 2018 (CEST)
Attività per BEIC
modificaSto continuando, pian piano, a ricavare file djvu di Scrittori d'Italia e caricarli; creo anche il link per la pagina Indice ma non sempre creo la pagina. Ti va bene come strategia? Preferisci che invece di caricare i "nudi djvu" rifinisca un po' meglio i caricamenti e le pagine Indice?
La tecnica è ormai stabilizzata: pdf-> pdf2djvu.exe-> djvu (passaggio lento, 3-4 secondi a pagina col mio pc); poi file _djvu.xml+djvu di IA -> djvuXml.py -> djvu con OCR IA (passaggio rapido, varie pagine al secondo). Al momento la procedura sembra funzionare colpo su colpo; se trovi qualche pasticcio nell'OCR avvisami. --Alex brollo (disc.) 22:40, 10 mag 2018 (CEST)
- @Alex brollo va benissimo così, parto dal link rosso della pagina Indice e imposto il tutto dal djvu che carichi. Sto monitorando la pagina e ho 5-6 pagine indice da sistemare, che conto di fare oggi e nei prossimi giorni, ma direi che come routine va bene. Sono contenta che la procedura di creazione dei djvu funzioni, credo che il secondo passaggio (caricare lo strato OCR di IA) sia quello meno fattibile per i profani (o no?), ma in ogni caso, pur lento pede, andiamo avanti!
OT: poiché vivo a Torino, spero domani o dopodomani di andare al Salone del libro (compatibilmente col pargolo unenne), dove ho visto ci sono in programma cose sourciane :D!!--Valeria De Francesca (BEIC) (disc.) 08:51, 11 mag 2018 (CEST)
- Ottimo, salutami Sbubi :-)
- Il caricamento dell'OCR di IA è facilissimo.... purchè uno non svenga all'idea di usare python. Sistemato quello che va sistemato, ed è la parte "dura", tutto si riduce, nel mio pc, a aprire una finestra di comando e scriverci, immaginando che siano là due file blabla_djvu.xml (quello scaricato da IA) e blabla.djvu (ottenuto con pdf2djvu dal PDF BEIC):
python djvuXml.py blabla blabla.djvu
- Attenzione: pdf2djvu non gradisce affatto i nomi file lunghi e complessi con caratteri non-ascii (aimè!) e quindi, anche per sbagliare meno, io scarico sia il file pdf, che il file _djvu.xml, assegnandogli nomi semplicissimi di pochi caratteri. Se tu, o qualche amico geek, ve la sentite, sono disponibilissimo a darvi istruzioni passo-passo.
- PS: se ci sono più edizioni successive dello stesso testo, io procedo comunque in ordine cronologico (quindi carico la prima e rimando a tempi migliori la seconda); dimmi se è OK come procedura. --Alex brollo (disc.) 09:21, 11 mag 2018 (CEST)
- @Alex brollo, mumble mumble... vediamo se riesco a sfruttare le competenze del marito nerd e ti faccio sapere :P per le edizioni successive va benissimo come stai procedendo!--Valeria De Francesca (BEIC) (disc.) 09:41, 11 mag 2018 (CEST)
Interrogatorio......
modificaTi propongo una serie di quesiti ostici.
- il tuo gruppo ha riflettuto sull'opportunità di chiedere a IA la creazione di una collezione BEIC? Creare una collezione significa poter assegnare i caricamenti anche alla collezione e poter elencare i libri della collezione; ma permette anche di esserne amministratore - e possono esserci più utenti con i "privilegi" di amministratore, basta che l'amministratore ne chieda l'abilitazione.
- vai su IA, loggati, poi segui questo link: https://archive.org/account/s3.php . Dovrebbero comparirti due parole chiave, sono quelle che ti permettono di accedere via script a tutte le funzioni a cui sei abilitata come utente "loggato"
- forse te l'ho già chiesto ma non ricordo la risposta. Svieni all'idea di maneggiare degli script python - solo lanciarli, eh, non scriverli? Hai in caso un amico che non sverrebbe?
Le domande non sono fine a se stesse. Se al punto 2 rispondi SI e al punto 3 rispondi NO, allora posso scrivere una cosa in python che carica fra i file dell'item il file djvu ottenuto dal pdf + il file _djvu.xml; a questo punto IA UPLOAD funzionerebbe a colpo sicuro, perchè sarebbero aggirate tutte le difficoltà, che si annidano proprio in questa "fusione"; e tu (con l'eventuale aiuto del solito amico) saresti perfettamente autonoma nella conversione pdf-djvu e caricamento su Commons. Se poi al punto 1 rispondi SIIII! e ottieni la collezione, la stessa cosa potrebbero fare tutti coloro che hai fatto nominare "co-amministratori". --Alex brollo (disc.) 19:06, 15 giu 2018 (CEST)
- (Nel frattempo mi ripasso la doc di internetarchive.py....) --Alex brollo (disc.) 00:37, 16 giu 2018 (CEST)
- Ciao @Alex brollo! Rispondo con ordine: 1. Risollevo la questione e ti aggiorno! 2. SI 3. NO, non svengo ma ne so molto poco: ingaggio il marito che ha più familiarità di me per darmi una mano! :D Diventare autonoma nel processo di conversione sarebbe certamente la cosa migliore! Grazie!--Valeria De Francesca (BEIC) (disc.) 08:25, 18 giu 2018 (CEST)
- Benissimo. Il prossimo passo è costruire l'ambiente python necessario a mandare avanti il marchingegno. Serve installare (oltre a python 2.7) la [libreria internetarchive.py] e installare anche pdf2djvu (ad esempio da qui: https://github.com/jwilk/pdf2djvu). Una volta installato il tutto, magari ti proporrò dei semplici test per verificare che tutto funzi; poi ti passo gli script python. Alla fine ouò essere che ti chieda - per la prova finale - il permesso di usare il tuo account IA per la prova di caricamento del file djvu via script; altrimenti farò qualche test su miei caricamenti su IA di prova. Teniamoci in contatto! --Alex brollo (disc.) 10:01, 18 giu 2018 (CEST)
- Giusto perchè lo sappiano anche gli altri, aggiorno: i djvu con OCR ricavati con creaDjvu() stanno in una cartella condivisa su Dropbox, l'idea è di caricarli ciascuno nel loro item IA (cosa che può fare solo chi ha i permessi Internet Archive per farlo, ossia chi ha creato l'item, ossia, al momento, tu) e poi di verificare se IA Upload, trovando un file djvu fra i file dell'item, carica su Commons nella modalità "veloce e diretta". --Alex brollo (disc.) 07:52, 20 giu 2018 (CEST)
- Benissimo. Il prossimo passo è costruire l'ambiente python necessario a mandare avanti il marchingegno. Serve installare (oltre a python 2.7) la [libreria internetarchive.py] e installare anche pdf2djvu (ad esempio da qui: https://github.com/jwilk/pdf2djvu). Una volta installato il tutto, magari ti proporrò dei semplici test per verificare che tutto funzi; poi ti passo gli script python. Alla fine ouò essere che ti chieda - per la prova finale - il permesso di usare il tuo account IA per la prova di caricamento del file djvu via script; altrimenti farò qualche test su miei caricamenti su IA di prova. Teniamoci in contatto! --Alex brollo (disc.) 10:01, 18 giu 2018 (CEST)
- Ciao @Alex brollo! Rispondo con ordine: 1. Risollevo la questione e ti aggiorno! 2. SI 3. NO, non svengo ma ne so molto poco: ingaggio il marito che ha più familiarità di me per darmi una mano! :D Diventare autonoma nel processo di conversione sarebbe certamente la cosa migliore! Grazie!--Valeria De Francesca (BEIC) (disc.) 08:25, 18 giu 2018 (CEST)
Tool Stefano
modificaPer attivarlo basta copiare nel proprio file [nome utente]/common.js questo codice:
importScript("Utente:Alex brollo/tool_stefano.js");
Il tuo sta nella pagina Utente:Valeria De Francesca (BEIC)/common.js.
Purtroppo la nuova organizzazione dei "privilegi" non mi permette, in questo momento, come "sysop semplice", di modificare i file common.js degli altri utenti: ciascuno deve fare da sè. Pe motivi molto misteriosi non sono riuscito a trasformarlo in un gadget. --Alex brollo (disc.) 11:04, 28 ago 2018 (CEST)
- PS avvisami quanto ti serve un'altra infornata di djvu! --Alex brollo (disc.) 11:06, 28 ago 2018 (CEST)
- Grazie Alex! pingo @Federica Viazzi (BEIC) così provvede! Per i djvu: quelli che erano in dropbox li ho caricati in commons e piano piano sto facendo gli Indici: ce ne sono ancora una ventina da fare. Dunque, con moooolta calma, puoi preparare una nuova infornata: credo che saremo 'in astinenza' fra un paio di settimane :D--Valeria De Francesca (BEIC) (disc.) 11:17, 28 ago 2018 (CEST)
Fine in vista
modificaCorre l'ultimo bat, è questione di ore per trattare il 273, poi la revisione di qualche buco e sarà finita. Wikisource, volendo, ha lavoro per qualche anno :-)
Ho un impegno trascurato con Ruggeri e OPAL, vediamo se riesco a dedicarmici: per un po' di Laterza non voglio più sentir parlare :-) --Alex brollo (disc.) 11:33, 17 set 2018 (CEST)
- @Alex brollo wow! appena finisco di caricare i djvu (compresi quelli in lavorazione) in Commons faccio il punto: non dovrei stressarti più di tanto - almeno non su questa specifica questione... ammicca ammicca :P. Grazie tantissimo per il tuo aiuto!--Valeria De Francesca (BEIC) (disc.) 12:22, 17 set 2018 (CEST)
- Finito, salvo E & O che mi segnalerai. Mi sposto sul problema Opal Libri Antichi e i misteri dei pdf :-) --Alex brollo (disc.) 20:43, 18 set 2018 (CEST)
- Complimenti! --Nemo 16:26, 20 set 2018 (CEST)
- Finito, salvo E & O che mi segnalerai. Mi sposto sul problema Opal Libri Antichi e i misteri dei pdf :-) --Alex brollo (disc.) 20:43, 18 set 2018 (CEST)
Maccheronee I
modificaSistemata (quasi del tutto) la formattazione del volume primo con record di velocità di eis (niente bot.... ma un po' più veloce...); domani sera formatto il volume II che è molto più facile e adesso ho gli attrezzi giusti. Giusto come segno di apprezzamento per le vostre fatiche! --Alex brollo (disc.) 23:12, 20 nov 2018 (CET)
- @Alex brollo Cose belle assai! Grazie!--Valeria De Francesca (BEIC) (disc.) 10:43, 21 nov 2018 (CET)
Problema: Il milione
modificaGià oltre la metà della trascrizione di Il milione (Laterza,1912), mi accorgo che ho commesso un serio errore: nella casella della lista Wikisource:Scrittori d'Italia/30 corrispondente alla riedizione dell'opera nella collana, 1928, per oscuri motivi ho infilato il djvu della prima edizione, 1912. Ma.... nella lista, la prima edizione dov'è?
Naturalmente, se si trova in BEIC l'edizione 1912, nulla sarà perduto del lavorodi trascrizione, c saràsolo un po' da lavorare e naturalmente io ho sbagliato e io mi impegno a sistemare; mi spiace. Sappimi dire! --Alex brollo (disc.) 00:16, 25 dic 2018 (CET)