Wikisource:Bar/Archivio/2020.08

Archivio delle discussioni del mese di agosto dell'anno 2020


Data di pubblicazione e epoca dell'operaModifica

Riassumo e riprendo qui l'ultima discussione del mese precedente sul tema della data di pubblicazione e epoca dell'opera, su cui persistono ambiguità e malintesi.

  1. la storia: itwikisource nasce prima dell'affermazione della procedura proofread, basata sui namespace nsIndice e nsPagina, che si è affermata in un secondo tempo ed ha assunto un'importanza crescente, anche se diversa da progetto a progetto;
  2. inizialmente esisteva solo il tl {{Intestazione}}, che raccoglieva i metadati dell'opera per visualizzarli e categorizzarli; il secondo template, {{Infotesto}}, collocato nella corrispondente pagina Discussione del testo conteneva i dati sulla fonte del testo. Il template è ancora presente in parecchi testi "naked", cioè privi di pagine nsIndice e nsPagina.
  3. in questa fase il campo "Anno di pubblicazione" del tl|Intestazione era l'unico visualizzato in chiaro nel box di intestazione del testo in ns principale, e veniva usato come base per la categorizzazione (Testo del....). La data di pubblicazione dell'edizione fonte era registrata solo in Infotesto e non era utilizzata nella categorizzazione (era compresa in un testo libero, non utilizzabile per elaborazioni). Aveva il significato di "Epoca dell'opera" oppure di "Data di prima pubblicazione", sostanzialmente coincidenti nella grande maggioranza dei casi (perlomeno dopo l'invenzione della stampa).
  4. con l'avvio della procedura proofread, i metadati bibliografici dell'edizione scansionata, rappresentata alla pagina Indice, sono stati valorizzati e suddivisi in specifici campi (editore, titolo originale, luogo e data di pubblicazione); in particolare nel form della pagina Indice la data di pubblicazione della specifica edizione scansionata va inserita in un campo chiamato "Anno di pubblicazione", con nome identico al parametro "Anno di pubblicazione" del tl Intestazione ma con un significato diverso.
  5. nel tempo sono stati sviluppati gadget che autocompilano il tl Intestazione a partire dai dati della pagina Indice, e in moltissimi casi il campo Anno di pubblicazione di Intestazione è stato ricavato dal campo Anno di pubblicazione della pagina Indice.

Conclusione: in moltissimi casi il dato contenuto in Intestazione e usato sia in visualizzazione, che in categorizzazione, NON rispecchia il significato originale "data di prima pubblicazione o epoca di composizione dell'opera". Guardate la pagina Autore:Cecco Angiolieri: fra le opere c'è Quando Ner Piccolin tornò di Francia, categorizzato in base alla data "XIII secolo", e S'i' fosse foco, arderei 'l mondo, proveniente dalla stessa edizione, categorizzato con la data 1916. Non va bene. :-) Il problema riguarda centinaia/migliaia di pagine.

Naturalmente, per l'utente-lettore, il dato più importante è l'epoca di composizione dell'opera: per chi ignora chi sia Cecco Angiolieri, la data 1916 non è del minimo aiuto per orientarsi, e l'intera categoria Categoria:Testi del 1916 è informaticamente inutilizzabile, perchè contiene dati disomogenei.

Soluzioni prospettate:

  1. aggiungere sia in nsIndice che in ns0 un campo con il significato "Epoca di composizione", e attribuire al campo "Anno di pubblicazione" solo il significato di "Anno di pubblicazione dell'edizione usata come fonte" (come in nsIndice e come nei comuni riferimenti bibliografici):
  2. associare sempre le due date nascita-morte al nome dell'autore, per permettere all'utente di orientarsi immediatamente sul periodo di composizione dell'opera;
  3. attendere che l'inserimento dei metadati bibliografici in wikidata si consolidi, e poi allineare i dati delle opere ai dati wikidata, come già avviene in nsAutore.
  4. altro?.... Alex brollo (disc.) 08:50, 1 ago 2020 (CEST)
La mia proposta operativa: aggiungere, sia nel form della pagina Indice che nel tl|Intestazione, un campo "Epoca di composizione". All'inizio sarà un campo del tutto ignorato dagli script, sarà in genere vuoto, la sua eventuale compilazione non avrà alcun effetto. Pian piano, potrà essere popolato di dati (inizialmente non utilizzati) e in seguito ai vari template e script può essere "spiegato come utilizzarlo". Sarà lunga, sarà dura, ma probabilmente sarà decentemente indolore. Alex brollo (disc.) 10:51, 1 ago 2020 (CEST)
Mi permetto di dire la mia... Persone più nel ramo di me, mi hanno spiegato che nei cataloghi delle biblioteche viene specificata sia la data di composizione (o il periodo in cui si suppone che l'opera sia stata composta), sia la data dell'edizione. Penso che dovremmo rassegnarci a tenere entrambe, considerato anche che di alcune opere su it.Wikisource abbiamo più edizioni. Dal punto di vista operativo, penso che la proposta più "indolore" sia quella di Alex. Mi sembra interessante anche l'uso di Wikidata, ma questo vorrebbe dire che dovremmo inserire anche là i metadati di tutti i testi (non so a che percentuale siamo). Se imbocchiamo questa strada, secondo me sarebbe interessante anche specificare insieme alla data di edizione (magari con un flag o qualcosa di simile) se essa è una prima edizione o se il testo è un manoscritto. --Paperoastro (disc.) 11:42, 1 ago 2020 (CEST)
Aggiungo alcune mie considerazioni. Da quando ho ripreso la mia attività qui su Wikisource ho iniziato anche a confrontarmi con Wikidata e, dopo un primo periodo "destabilizzante", adesso lo trovo fondamentale per mettere bene in chiaro tutto quello che so su un determinato testo su cui voglio lavorare qui su Wikisource. E questo proprio perché Wikidata ti obbliga a distiguere il livello opera dal livello edizione e questo è molto utile proprio per il discorso delle date. Mi rendo conto che non è facile, ma penso che il workflow di pubblicazione di edizioni qui su Wikisource debba per prima cosa spingere il più possibile l'utente a caricare su Wikidata tutti i dati a sua disposizione su un determinato testo e, dopo, iniziare a impostare il lavoro qui su Source. Man mano che si creano pagine Indice e Ns0, i dati dovrebbero essere importati esclusivamente da Wikidata.
Per quanto riguarda invece la disambiguazione "data di creazione e/o prima edizione" e "data di edizione", secondo me sarebbe bene rivedere il template Testo in modo che fornisca i dati dell'edizione in due modi. Vi faccio un esempio utilizzando un caso abbastanza complesso, questo (per chi fosse interessato, questa è la relativa pagina Opera):
  1. in NsAutore: Atto di abdicazione, in Santorre di Santarosa, Storia della rivoluzione piemontese del 1821, traduzione dal francese di Anonimo (1850), Torino, presso tutti i librai, 1850. Data di pubblicazione: Torino, 13 marzo 1821.
    Mi rendo conto che è molto verboso ma è anche molto chiaro nel far comprendere il significato delle varie date espresse.
  2. su tutte le altre pagine (dove, credo, non è necessario il precedente livello di dettaglio): Vittorio Emanuele I di Savoia, Atto di abdicazione, in Santorre di Santarosa, Storia della rivoluzione piemontese del 1821, Torino, 1850. --Cinnamologus 02:28, 2 ago 2020 (CEST)
@Cinnamologus Grazie, molto interessante! Ho partecipato attivamente alle discussioni preliminari sulla "struttura dati" per i nostri testi e ho sostenuto fin dall'inizio la necessità di distinguere i livelli "Opera" e "Edizione"; ma poi ho aspettato che "quelli bravi" organizzassero le cose su wikidata. Ci indichi, per favore, delle buone pagine di aiuto per fare le cose per bene in wikidata? Magari con un paio di link a esempi ben fatti di elementi wikidata? E poi una domanda pratica: è stato risolto, su wikidata, il problema delle "relazioni inverse automatiche", per cui (facendo un esempio nell'ambito dei testi) se definisco "Alessandro Manzoni" come autore de "I promessi sposi" nell'elemento-opera I promessi sposi, all'elemento-uomo Alessandro Manzoni venga automaticamente attribuita l'opera "I promessi sposi"? Se questo automatismo ancora non c'è, temo che wikidata sia ancora acerbo. Alex brollo (disc.) 09:47, 2 ago 2020 (CEST)
La soluzione Wikidata io ce l'avrei pronta da ben 5 anni (Il Principe), quello che però ancora mi spaventa è la difficoltà di utilizzo. Compilare un template è facilissimo e qualunque dei nostri utenti ci riesce con un minimo di sforzo, districarsi tra le mille proprietà e attributi di Wikidata è ben altra cosa, e non vorrei ritrovarmi un domani con centinaia o migliaia di testi non collegati a Wikidata e/o senza date. Possiamo magari cominciare ad agganciare Wikidata ma in maniera "facoltativa", ovvero: per ciascun dato del template, se si trova una proprietà su Wikidata si usa quella ignorando il valore immesso nel template, altrimenti si usa il valore. Proverò a implementare questa soluzione parziale, nell'immediato però proporrei questo:
  1. Rinominiamo l'attuale campo "Anno di pubblicazione" in "Epoca di composizione" o qualunque altro nome che vi piaccia ("Data di composizione", o "Anno e secolo di composizione", vedete voi). Si potrebbe aggiungere un nuovo campo come dice Alex, e poi rimuovere il vecchio, ma secondo me la presenza contemporanea di 2 campi farebbe solo ancora più confusione.
  2. Ho aggiunto in Intestazione un controllo di coerenza fra tale data e le date di nascita e morte dell'autore, che genera Categoria:Data di composizione da controllare, in modo che possiamo andare a vederle una per una e sistemarle. Can da Lua (disc.}}}}) 10:50, 2 ago 2020 (CEST)
@Candalua spetta... stai parlando solo di ns0, vero? perchè in nsIndice Anno di pubblicazione va conservato. E io aggiungerei in nsIndice anche il campo Epoca di composizione o come lo chiameremo, altrimenti salta il flusso dei dati per autoNs0. Stavo pensando proprio di rivedere autoNs0 in modo che legga solo nsIndice... Alex brollo (disc.) 11:41, 2 ago 2020 (CEST)
Ma certo, solo ns0. In Indice non avrebbe molto senso perché è un dato dell'opera e non dell'edizione (se uno carica due edizioni della stessa opera potrebbe inserire due date di composizione diverse...). Poi se il problema è che gli utenti compilano l'indice con la dovuta attenzione, ma NON compilano il template Intestazione con la stessa attenzione perché si fidano ciecamente di autons0, allora mettiamolo pure lì, che vi devo dire... Can da Lua (disc.) 11:53, 2 ago 2020 (CEST)
@Candalua Sarò il tuo incubo, ma ti faccio rallentare.... prima di operare modifiche sostanziose, anche se siamo a un buon punto della discussione, proporrei di dare una buona occhiata ai due progetti leader (soprattutto a fr.wikisource) e anche di verificare se lo scambio dei dati con wikidata è agevole. Alex brollo (disc.) 16:20, 2 ago 2020 (CEST)
@Alex brollo Penso che la miglior pagina di aiuto su Wikidata sia Wikidata:WikiProject_Books/it. Come esempi di elementi su Wikidata ve ne sottopongo due, uno relativo a opere letterarie e l'altro relativo a documenti d'archivio.
  1. Per quanto riguarda il primo caso faccio riferimento all'edizione delle tragedie di Alfieri, collana Scrittori d'Italia.
  2. Per quanto riguarda il secondo caso segnalo un decreto di Carlo Alberto a cui è allegato l'atto di abdicazione di Vittorio Emanuele I, presente qui su Source in tre edizioni differenti.
Non mi risulta che esistano "relazioni inverse automatiche" su Wikidata: si deve fare tutto manualmente.
Tornando al problema delle date distinguerei la Data di edizione dalla Data di pubblicazione che dovrebbe essere: per le opere letterarie, la data di prima di edizione, mentre per i documenti (lettere, atti giuridici, leggi, ecc.) l'indicazione di luogo e data in cui fu redatto il documento. --Cinnamologus 17:34, 2 ago 2020 (CEST)
Francesi e inglesi non mi pare abbiano nessuna "data di composizione", usano solo la data di pubblicazione dell'edizione, presa dall'indice. Ovviamente non vuol dire che dobbiamo seguire il loro esempio: sulla maggioranza dei testi abbiamo una "data di composizione" corretta, anche se chiamata in un altro modo, non ha senso buttarla via. Per Wikidata credo di aver già risposto: è fattibile, ma non agevole. Ora che ho messo a punto il controllo di coerenza, io farei intanto una cosa: laddove la data "anno di pubblicazione" di ns0, intesa come "data di composizione", non risulta compatibile con le date in cui è vissuto l'autore, la nasconderei dal box. Così intanto torniamo ad una situazione coerente, nel senso che le date visibili hanno tutte lo stesso significato di "data di composizione", poi abbiamo tutto il tempo di aggiustare le date sbagliate (che sono 1290). Can da Lua (disc.) 09:46, 3 ago 2020 (CEST)
  •   Mi pare ottimo. Via bot posso ridurre notevolmente quel 1290 visto che di recente ho inserito un bel po' (alcune centinaia di pagine....) incoerenti. Il dato "Epoca di composizione" è essenziale per categorizzare decentemente le opere. Accetto l'idea che, temporaneamente, in ns0 "Anno di pubblicazione" contenga, invece, il dato "Epoca di composizione" (che, nella quasi totalità dei casi post-Gutenberg, mi pare coincida come periodo con la "data di prima pubblicazione", tranne le opere postume, con uno scarto che penso sia irrilevante ai fini pratici). Naturalmente "nascondere" il dato in box Intestazione non risolve il problema della errata categorizzazione: se tu potessi anche sopprimere temporaneamente la categorizzazione in caso di discrepanza, meglio. --Alex brollo (disc.) 11:48, 3 ago 2020 (CEST)
Alla fine non ho più nascosto niente, quasi metà delle date le abbiamo già messe a posto, altre potrebbero essere corrette così come sono: penso alle antologie contenenti testi di più autori e di epoche diverse, che nascono come opera unitaria solo nel momento in cui il curatore le assembla, anche se le singole parti vennero scritte secoli prima. Can da Lua (disc.) 14:50, 6 ago 2020 (CEST)

Collegamento con wikidata degli editoriModifica

Che ne direste di collegare le nostre categorie "Libri pubblicati da..." con l'elemento wikidata della casa editrice? Test fatto su Categoria:Libri pubblicati da Laterza. --Alex brollo (disc.) 11:37, 3 ago 2020 (CEST)

No, sono due concetti diversi e devono rimanere separati in Wikidata. --Accurimbono (disc) 08:51, 5 ago 2020 (CEST)
Se avessimo un namespace Editore: si collegherebbe quello, giusto? --Cruccone (disc.) 09:04, 5 ago 2020 (CEST)
@Cruccone Già.... sempre che riuscissimo a distinguere bene "publisher" e "printer". Rimuovo il link di prova. Però qualcuno dovrebbe dirlo anche a Commons, che linka la sua pagina-categoria Laterza. Alex brollo (disc.) 10:01, 5 ago 2020 (CEST)
Quello che si può fare è creare un elemento Wikidata che connetta, ad esempio, queste due pagine di Wikisource e Commons, che rappresentano concetti equivalenti:
* Categoria:Libri pubblicati da Laterza
* commons:Category:Books published by Laterza
Adesso provo a farlo. (vedi d:Q98102423)
--Accurimbono (disc) 10:19, 6 ago 2020 (CEST)
Provo un'istintiva avversione per gli elementi wikidata costituiti da categorie; ma siccome mi sono reso conto che a proposito dei concetti base di wikidata nel mio cervello si sta addensando la nebbia, non discuto. --Alex brollo (disc.) 08:10, 7 ago 2020 (CEST)

Prova templateModifica

Non so se è mai stata sperimentata l'inclusione del tag dynamicpagelist dentro un template; comunque è possibile. Il tl di prova {{Testi di}}, con un unico parametro molto intuitivo (il nome dell'autore), produce ad esempio la lista dei testi di Iacopo da Leona, visibile sotto. Certo, meglio sarebbe una lista di tl|Testo (aggiornata dinamicamente): è ipotizzabile un gadget che lo faccia (automaticamente o con un click).



Se prendo ad es.

sarebbe difficile scrivere un template Traduzioni da o Traduzioni di? - εΔω 11:40, 6 ago 2020 (CEST)

dynamicpagelist permette di fare quasi qualsiasi cosa sia desumibile da una o più categorie. Per "traduzioni di [autore]" basta interrogare una singola categoria, facilissimo; ma, più semplicemente, qualsiasi risultato si possa ottenere con dynamicpagelist può essere ottenuto con un template che incorpora il "motore" dynamicpagelist. Intanto creo il (semplicissimo) template {{Traduzioni di}}. --Alex brollo (disc.) 12:14, 6 ago 2020 (CEST)
Traduzioni
di da


Traduzioni di Achille Giulio Danesi


@OrbiliusMagister, Alex brollo: per rendere possibile questo template, Alex ha aggiunto in Intestazione la categoria "Traduzioni da ...", ovviamente rossa. Volete che la faccia creare automaticamente dal bot? Can da Lua (disc.) 16:35, 6 ago 2020 (CEST)
Domando: è sufficientemente chiara la differenza fra "Traduzioni di ...." e "Traduzioni da ...."? L'esempio che ho usato è abbastanza particolare: è una auto-traduzione fatta da Pascoli di una propria opera in latino. Alex brollo (disc.) 17:23, 6 ago 2020 (CEST)
Ho corretto il tuo esempio con un altro paio di più comuni e documentati. Mi interessava capire gli automatismi di categorizzazione per vedere quali documenti apparissero da questa DPL. I risultati sono al tempo stesso interessanti e preoccupanti: di tutte le molte traduzioni di Giovanni Pascoli appaiono solo quelle che non sono sottopagine attribuite agli autori e non al traduttore (eccetto Traduzioni e riduzioni/Da Orazio perché... avevo messo la categoria a mano ;-D) e questo vale per tutte le traduzioni, come le molte traduzioni dal greco di Danesi. εΔω 21:06, 6 ago 2020 (CEST)
Eh, garbage in, garbage out... dynamicpagelist non fa che utilizzare il contenuto delle categorie; le sottopagine sono poco categorizzate. Non aggiunge e non toglie niente. C'è un altro problema: nell'html (se non sbaglio.... verifico) non resta traccia della query che genera la lista e quindi del significato dell'elenco di link; ma passando attraverso un template, è possibile immaginare vari sistemi per registrarlo (i tre template propongono una fra le tante possibili soluzioni), come aggancio per una eventuale post-elaborazione della lista con javascript. Alex brollo (disc.) 22:10, 6 ago 2020 (CEST)
@OrbiliusMagister Ammetto - con desolazione - che il mio cervello si rifiuta di rappresentare il significato di "quelle che non sono sottopagine attribuite agli autori e non al traduttore". Siccome non me lo rappresento, non ho capito; e quindi, chissà che stupidaggine ho scritto, come risposta a una domanda che non ho capito. :-)
In generale: comincio ad avere la vaga, ma allarmante intuizione che le categorie sono qualcosa di simile alle query di wikidata: per cui, per capirle bene, devo per forza capire come funzionano le query di wikidata, e perchè funzionano (ossia: qual'è la struttura dati necessaria per il loro funzionamento). Al momento sono inorridito e confuso, proprio come quando ho affrontato le regex o javascript. Vediamo se supero questa spiacevole condizione. Per il momento, "mollo". Nel caso delle regex mi ci sono voluti un po' di anni per superare il fossato. :-( Alex brollo (disc.) 07:29, 7 ago 2020 (CEST)
@Alex brollo: per una post-elaborazione dell'output di DPL, puoi usare {{EspandiLista}}. Funziona con il gadget omonimo, che è attivo di default. Gli passi un template e il gadget passa tutti i risultati di DPL attraverso quel template. Esempio con: {{EspandiLista|TAA}} {{#tag:dynamicpagelist|category=Traduzioni da Saffo}} ti genera:

Can da Lua (disc.) 13:04, 7 ago 2020 (CEST)

@Candalua Che meraviglia! Non ho resistito a provare a montarlo subito dentro i tl Testi di, Traduzioni di e Traduzioni da.... :-) Adesso vediamo se è il caso di disabilitarlo o abilitarlo opzionalmente. Avevo visto un "lampeggiamento nelle categorie", ma ho rimandato le congetture. Alex brollo (disc.) 13:23, 7 ago 2020 (CEST)
Annotazione: per le opere di autori che hanno scritto in lingue diverse dall'italiano, {{Testi di}} e {{Traduzioni da}} dovrebbero dare l'identico risultato, perchè se sono presenti qui, sono senz'altro traduzioni; la possibilità di espandere le liste toglie ogni ulteriore dubbio. Penso che si possa accoppare subito il neonato {{Traduzioni da}}. --Alex brollo (disc.) 13:32, 7 ago 2020 (CEST)
Verificato che si può fare, riporto i tre template alla situazione iniziale (non espansione); se l'espansione verrà giudicata utile in ogni caso, basta "decommentare" il template che al suo interno fa scattare l'espansione; se verrà giudicata utile come opzione, basterà modificare i template in modo che il template {{EspandiLista}} si attivi solo a richiesta, passando un parametro aggiuntivo. Se poi i template non saranno giudicati utili di per sè, nè espansi nè non espansi.... resteranno in un sereno letargo. :-). Torno a Leopardi. --Alex brollo (disc.) 08:15, 9 ago 2020 (CEST)

Tech News: 2020-32Modifica

17:43, 3 ago 2020 (CEST)

Pare facile....Modifica

Sto lavorando alla correzione delle (centinaia) di dati scorretti che ho caricato nel famigerato campo "Anno di pubblicazione" del tl|Intestazione. E mi sono presto incartato, nonostante il proponimento, in caso di dubbio, di limitarmi alla precisione "secolo".

Dalle due categorie pedia w:Categoria:Poeti italiani del XIII secolo e w:Categoria:Poeti italiani del XIV secolo ho estratto i nomi in due liste. Ci sono 105 nomi nella prima, e 75 nella seconda. Ma, come mi aspettavo, 20 nomi sono presenti sia nella prima che nella seconda. Si tratta di antipatici soggetti che hanno avuto la brutta idea di vivere a cavallo fra due secoli. Certo, l'intervallo nascita-morte non coincide con il floruit, quindi non potevo aspettarmi un dato "pulito".... E adesso che fo, per attribuire a ciascuna opera di ciascun autore di Sonetti burleschi e realistici dei primi due secoli (1920) un Anno di pubblicazione approssimato almeno al secolo? Li attribuisco a entrambi i secoli?

Cosa curiosa a cui non avevo pensato: il floruit non è un grossolano dato utile solo quando non si conoscono i dati anagrafici precisi di nascita e morte; per quello che riguarda la datazione approssimativa delle opere, il floruit è un dato essenziale aggiuntivo indipendente, necessario anche in presenza delle date di nascita e morte dell'autore. Alex brollo (disc.) 11:03, 5 ago 2020 (CEST)

La mia esperienza di bibliotecaria mi suggerisce una doppia attribuzione di secolo, per agevolare la ricerca di più utenti. La questione del floruit... proprio non so che cosa voglia dire "floruit" :-/ Mimidellaboheme (disc.) 11:26, 5 ago 2020 (CEST)
@Mimidellaboheme floruit = "fiorì ossia fu attivo nel periodo". Non sapendo altro è utile a fini anagrafici... di certo se "fu attivo" era già nato da vari anni e non era ancora morto ;-) Alex brollo (disc.) 13:59, 5 ago 2020 (CEST)

News da bnwikisource riguardo wikidataModifica

Ricevo via FB questo messaggio da @Bodhisattwa (bnwikisource): "On work and publisher namespaces, we are now automatically adding everything from Wikidata.". Molto interessante: quindi bnwikisource ha un namespace Publisher e sembra lo gestisca come il nostro nsAutore. Non ho capito bene quel "adding", potrebbe essere due cose diverse, devo cercare di capire. --Alex brollo (disc.) 07:38, 6 ago 2020 (CEST)

Technical Wishes: FileExporter and FileImporter become default features on all WikisModifica

Max Klemm (WMDE) 11:13, 6 ago 2020 (CEST)

Wikidata e frwikisourceModifica

Avvicinandomi con circospezione a wikidata per wikisource, ho sfogliato frwikisource e ho trovato un sonetto proofread, in pagina autonoma ns0, collegato al suo elemento wikidata. Ho seguito con entusiasmo il link a wikidata ("adesso capirò come si fa una buona registrazione wikidata di una breve opera") e.... ho trovato questa roba: d:Q19170782, che interpreto come un semplice "segnaposto", ha due sole proprietà (istanza di, autore) e di due una non mi convince per niente. Ma se l'hanno fatto, un motivo ci sarà. Qualcuno sa come hanno in mente di procedere? Vedrò anche cosa fanno su enwikisource. --Alex brollo (disc.) 23:42, 7 ago 2020 (CEST)

Dalla cronologia si intisce che trattasi della conseguenza di un carico massiccio di dati via bot che poi non è stato seguito adeguatamente da occhi umani, o meglio, un paio di utenti umani di cui uno anche affidabile è passato, ma senza apporre cambiamenti interessanti. Dato che le poesie di Guglielmo IX di Aquitania non sono prive di importanza anche a livello letterario intuisco che o il caricamento via bot doveva all'origine contenere qualche dato in più in ogni entità. Purtroppo non ho capito da dove provengano i dati di questo upload. - εΔω 08:52, 10 ago 2020 (CEST)
Farò qualche prova di caricamento "minimo ma secondo linee guida" partendo dalle opere di Leopardi su cui sto lavorando. Spero di fare meglio di quel bot.... purtroppo, il caricamento di dati non precisi su wikidata vanifica in profondità l'intero progetto.
Chiedo una sola conferma: siamo d'accordo che per "opera" si intende ogni componimento "autonomo", perfino un sonetto, a meno che non sia parte di una "catena" o di una "tenzone", che vedrei come "opere" unitarie? Nella pagina di aiuto per le entità "libri e opere" di wikidata non ho trovato indicazioni chiare. Per ora adotto il principio "una opera autonoma, lunga o breve che sia, un elemento wikidata opera". --Alex brollo (disc.) 12:17, 10 ago 2020 (CEST)
Mi scuso, ero disorientato, le proprietà minime che frwikisource ha assegnato al sonetto sono gravemente deficitarie, ma sono giuste: l'entità rappresentata da quel titolo è effettivamente l'istanza di un'edizione, non di un'opera. E' anti-intuitivo, ma è così. E anche qui da noi, ogni pagina ns0 deve essere collegata a un elemento edizione, perchè è un'edizione. --Alex brollo (disc.) 20:59, 10 ago 2020 (CEST)

Ancora su data di pubblicazione: opere postumeModifica

Dalla nota di Appressamento della morte vedo che è noto il periodo di composizione dell'opera (1816) ma che la pubblicazione è molto posteriore, e segue il fortunoso ritrovamento del testo, ritenuto disperso (1880). Quale delle due date usiamo come Anno di pubblicazione? --Alex brollo (disc.) 08:20, 9 ago 2020 (CEST)

Ehm... pubblicazione e composizione sono due cose diverse. Per anno di pubblicazione direi sicuramente 1880. Ad essere pignoli dovremmo avere il campo composizione da compilare se la data è nota... --Paperoastro (disc.) 15:33, 9 ago 2020 (CEST)
@Paperoastro: come da discussioni precedenti, "Anno di pubblicazione" abbiamo deciso che va inteso come "data di composizione". Ergo direi che va indicato 1816. La "data della prima edizione" è un'altra cosa, che finora non abbiamo deciso di indicare. A proposito: siamo d'accordo per rinominare "Anno di pubblicazione" in "Epoca di composizione"? Can da Lua (disc.) 09:42, 10 ago 2020 (CEST)
Interessante il fatto che in Indice:Leopardi - Paralipomeni della Batracomiomachia, Laterza, 1921.djvu è riportato, subito sotto il titolo di ciascuna opera, un anno, che dev'essere per forza l'epoca di composizione: vedi Pagina:Leopardi - Paralipomeni della Batracomiomachia, Laterza, 1921.djvu/43 per Appressamento della morte, prima pubblicazione 1880. Anche secondo me fra i due dati: prima pubblicazione e epoca di composizione, deve avere la precedenza, se disponibile, il secondo. Inquadra molto meglio l'opera nella biografia dell'autore. --Alex brollo (disc.) 12:24, 10 ago 2020 (CEST)
Esatto. Poi è chiaro che la situazione più comune è quella in cui l'autore termina di scrivere un testo e di lì a poco lo fa stampare; quindi in generale si può presumere che la data di composizione coincida con la "data della prima edizione", quindi in mancanza di altre informazioni usiamo quest'ultima. Nei casi documentati in cui differiscono, useremo invece la prima. Can da Lua (disc.) 15:16, 10 ago 2020 (CEST)
Io sarei d'accordo con la distinzione di Paperoastro. Composizione e pubblicazione possono essere separate anche da secoli. Mimidellaboheme (disc.) 17:58, 10 ago 2020 (CEST)
@Mimidellaboheme Per chiariemi un po' le idee (ma solo un po'...) ho riletto Aiuto:Wikidata e la sua pagina di discussione; ma erano tempi "antichi"; adesso c'è da leggere d:Wikidata:Wikiproject Book. E ci sono chissà quante altre discussioni nelle pagine di aiuto dei "progetti fratelli" di wikisource. Sta il fatto che il cuore della nostra attività sono le edizioni. SEnto la necessità di chiarirmi le idee (e registrare linee guida, che non ho ancora trovato) sulle edizioni che non sono relative a opere singole, ma a raccolte di opere; e magari a una definizione di "opera" che consideri anche le opere brevissime, fino all'epigramma, e a cose complesse come le "corone di sonetti" o le "tenzoni". Scusate se dico ovvietà per chiarirmi le idee, ma penso che una buona stryttura dati debba rispondere a due domande:
  1. i dati permettono di individuare in modo inequivoco gli "oggetti" che maneggiamo, e le loro proprietà?
  2. la struttura dei dati permette di interrogare il database in modo da ottenere la selezione di qualsiasi sottogruppo di oggetti che abbiano un insieme di proprietà interessante?
Per verificare il secondo requisito c'è una via maestra: imparare a usare il linguaggio delle "interrogazioni", le query, e scervellarsi per verificarle. SPARQL, a noi! Alex brollo (disc.) 07:01, 11 ago 2020 (CEST)
Io penso a wikisource come a una biblioteca e tendo ad attribuirle le caratteristiche di una biblioteca, ma forse non lo è perché deve rispondere all'esigenza di un progetto più ampio e più complesso. Questo per dire che la domanda mi pare difficile, anzi la risposta mi è difficile. Perché c'è un mare di cose che non so. Per opera, mi pare bene qui d:Wikidata:Wikiproject Book, opera letteraria è qualsiasi cosa scritta (dal bugiardino dei farmaci all'enciclopedia britannica e oltre). Detto questo per dare una risposta adeguata dovrei sapere che cosa, in questo contesto, posso intendere per dati, inequivoco, struttura dei dati... :-( ... quando contemplo la mia ignoranza mi viene da piangere. Forse ormai sono antica anch'io e il mondo corre sempre più in fretta, io sempre più piano. Per dire: "dati" intenderei tutto quello che adotto per descrivere l'opera e che può diventare un indizio per scovarla, "inequivoco" secondo me (è la mia opinione) è una condizione irrealizzabile, perché se è vero che un oggetto è uguale solo a se stesso è anche vero che un'infinità di oggetti si somigliano tanto da confondersi soprattutto se l'insieme degli indizi è limitato, eccetera. Sono sicura di non aver risposto, porta pazienza. Mimidellaboheme (disc.) 17:11, 11 ago 2020 (CEST)
@Mimidellaboheme Magari, che wikisource fosse solo una biblioteca.... Wikisource è allo stesso tempo tipografia, casa editrice e biblioteca. Poi dicono che è "facile" contribuire.... ;-) Gutenberg è una vera biblioteca, e la sua "tipografia e casa editrice" è totalmente separata: sta in Distributed Proofreaders. E in Distributed Proofreaders la funzione "editore" (scelta delle opere, veste editoriale) è totalmente separata dalla funzione "tipografia" (composizione del testo). Il povero contributore wikisourciano può, se vuole, fare tutte queste cose.

Alex brollo (disc.) 09:28, 12 ago 2020 (CEST)

Tech News: 2020-33Modifica

18:06, 10 ago 2020 (CEST)

Struttura Wikidata per Opere/EdizioniModifica

Dopo aver (fortunosamente) trovato questo elemento su Wikidata (un'edizione inglese delle Tragedie di Euripide) che mi ha aiutato a chiarirmi le idee sui vari livelli di descrizione delle edizioni con cui ci troviamo a operare tutti giorni (in particolare le edizioni di antologie e opera omnia in più volumi), ho elaborato la tabella che segue che sintetizza lo "scheletro" delle proprietà che reggono in piedi la "datafication" dei volumi cartacei e della loro conversione in edizioni digitali su Wikisource. L'ho applicata (rivedendo tutto il lavoro che avevo già fatto in precedenza) sull'edizione delle tragedie di Alfieri (collana Scrittori d'Italia Laterza) e mi sembra che funzioni.

Pagina su Wikisource Elemento su Wikidata
1. Edizione cartacea (opera in più volumi) Tragedie (Alfieri, Scrittori d'Italia) Q50822120
Vincolo Wikidata   (P527) consiste di   (P361) parte di
2. Edizione cartacea (volume singolo) Tragedie (Alfieri, 1946), Volume I Q96988818
Vincolo Wikidata   (P527) consiste di   (P1433) pubblicato in
3. Edizione su Wikisource Filippo (Alfieri, 1946) Q98148783
Vincolo Wikidata   (P629) edizione o traduzione di   (P747) edizione/i
4. Opera letteraria/documento Opera:Filippo Q3745063

Osservazioni:

  1. ad ogni livello (Ns su Source) c'è un corrispondente elemento in Wikidata. Non sempre è necessario essere così dettagliati: penso che nella maggioranza dei casi con gli elementi 2 e 3 della tabella descrivi l'edizione a sufficienza (cfr. per esempio l'elemento della Nota del curatore editoriale delle tragedie...);
  2. le proprietà Wikidata collegano gli elementi sia in entrambi i sensi;
  3. nulla vieta di "sminuzzare" un'opera (e/o relativa edizione) in elementi ancora più particellari utilizzando la proprietà (P527) consiste di (penso per esempio alle raccolte di rime di un autore in cui può essere utile creare un elemento in Wikisource per ogni singola poesia);
  4. seguendo questo schema, alla fine, si troverà sulla pagina dell'elemento Edizione cartacea (volume singolo) l'indice del volume con tanto di indicazione delle pagine di ogni singolo capitolo.
  5. tutto quanto scritto fin qui è frutto di mie considerazioni e di innumerevoli prove sbagliate (e relativi vicoli ciechi... ne sa qualcosa @Alex brollo XD): per cui se qualcuno più esperto nota degli errori per favore me li segnali! Grazie ;) --Cinnamologus 17:41, 11 ago 2020 (CEST)
@Cinnamologus Grazie, non è ancora tutto chiaro ma si fanno passi in avanti :-)
Sono perplesso su un punto: sono convinto assertore della necessità di definire bene le "relazioni inverse", che dovrebbero essere uniche; A figlio di B deve implicare che B è genitore di A. Nello schema sopra, l'inverso di "consiste di" è una volta "parte di" (che è la relazione inversa originale) e un'altra volta "pubblicato in". Perchè? --Alex brollo (disc.) 21:33, 11 ago 2020 (CEST)
Ho trovato (come mi aspettavo) una accesa discussione preliminare alla creazione della proprietà "pubblicato in", distinguendola dalla più semplice e generale proprietà "parte di". Ci sto riflettendo, ma siamo alla filosofia.... la mia impressione è che ci sia un problema: una query fondata su una delle due proprietà alternative ignorerà, temo, tutti i casi in cui è stata scelta l'altra, perchè dubito che il sistema "capisca" che una è sottoinsieme/sotttoclasse dell'altra. Si ripropone, in pratica, la discussione sulle categorie: se esiste solo una categorizzazione di dettaglio "sonetti" per un'opera, questa non comparirà nella categoria più estesa "poesie", men che meno nella categoria più ampia "opere letterarie". E ripiombiamo nella vecchia discussione da cui è nato {{ArgCat}} nella quale sono stati spremuti a fondo neuroni miei e altrui :-): Certo, basta "mettersi d'accordo", ma voi sapete che non è affatto facile, in wiki, fare in modo che tutti vengano a conoscenza, e usino, un "accordo". ;-) --Alex brollo (disc.) 08:53, 12 ago 2020 (CEST)
Continuo a pensare sulla relazione fra categorizzazione e assegnazione di una "tripletta" soggetto-proprietà-oggetto. Ho la sensazione che ogni categoria possa essere rappresentata da una tripletta (o meglio. da varie triplette, alcune delle quali "sottintese" perchè "umanamente intuitive", ma i sistemi informatici hanno scarsissimo "intuito umano"). Praticamente: adotto subito la P1433 (pubblicato in) dove mi sembra adatta, e provo a scrivere (appena se sarò capace) una query che usi sia P1433 che P361 (parte di). Sarà una nuova strage di neuroni :-) Alex brollo (disc.) 09:18, 12 ago 2020 (CEST)
Capisco le tue perplessità ma non saprei davvero come risponderti... Ho colto che "pubblicato in" è una sottoclasse di "parte di" e mi sembrava che potesse funzionare (anche in virtù del modello che ho trovato)... Però a questo punto ti chiedo: posso continuare a usare il mio schema quando inserisco i dati su Wikidata o faccio meno danni se uso "parte di" invece che "pubblicato in"? --Cinnamologus 10:36, 12 ago 2020 (CEST)
No, nessun danno, anzi; è una proprietà molto precisa, e la comunità wikidata ha deciso di crearla e di usarla (vedi [discussione|https://www.wikidata.org/wiki/Wikidata:Property_proposal/Archive/24#P1433]) proprio per collegare gli elementi di una raccolta di "opere" all'edizione (volume, nel nostro caso) che li contiene. Qui mi fermo, perchè il resto è ancora nebbia fitta. --Alex brollo (disc.) 22:00, 12 ago 2020 (CEST)
@Cinnamologus Dimenticavo: ti ringrazio moltissimo del tuo lavoro, e fino a prova contraria lo terrò come "modello ideale", che cercherò di applicare per Versi - Paralipomeni della Batracomiomachia (magari soprassedendo su qualche dettaglio). Ci sono delle ridondanze, che sono madri dell'incoerenza, e penso che infilerò apposta un errorino nei dati ridondanti (annotandomelo) per vedere se il sistema se ne accorge in automatico... ;-) Alex brollo (disc.) 22:32, 12 ago 2020 (CEST)
Di nulla @Alex brollo!! Grazie a te per tutti gli stimoli alla riflessione che mi hai dato sia qui al Bar che in privato! :D Cinnamologus (disc.) 12:05, 13 ago 2020 (CEST)

Contro WagnerModifica

Mi stavo cimentando nella rilettura di Contro Wagner, quando mi sono reso conto che a ogni pagina corrisponde una sezione (cioè trovo un <section begin=> a inizio pagina e un <section end=> a fine pagina). Essendo ancora abbastanza un novellino qui su Wikisource, non mi è chiara l'utilità di questa soluzione e, prima di metterci le mani sopra, ho preferito rivolgermi qui al bar per avere qualche delucidazione in merito, dato che non ho mai visto prima d'ora questa bizzarria.Mrcesare (disc.) 14:15, 12 ago 2020 (CEST)

Mettere in una pagina un'unica section che contiene tutto il testo della pagina è una scemenza, non so perché sia stato fatto ma non è assolutamente necessario. Le section normalmente servono quando c'è una parte del testo che non va trascluso, il comportamento normale del tag <pages è già quello di trascludere l'intera pagina senza bisogno di metterla dentro una section. Can da Lua (disc.) 16:41, 12 ago 2020 (CEST)
Ho controllato se in questo caso la scemenza non l'avevo fatta io. No. In realtà uno o due test li ho fatti senz'altro; il parametro onlysection di pages permette di transcludere una parte dell'opera (es. un capitolo) senza badare a from e to; basta che ciascuna pagina del capitolo sia inclusa in una section specifica. Per esempio, in un'opera di 500 pagine, se tutte le pagine del capitolo III sono "marcate" con una section="3", si può transcludere il capitolo 3 semplicemente con from="1" to="500" onlysection="3". Non credo sia nè raccomandato, nè efficiente; ma si può fare.
Nel caso specifico, visto che nel tag pages NON è stato usato onlysection, non si tratta di un test di questa strana cosa, e tutte le section che comprendono un'intera pagina dovrebbero poter essere rimosse tranquillamente. --Alex brollo (disc.) 23:41, 12 ago 2020 (CEST)

Wikidata: "parte di" e "pubblicato in"Modifica

Si tratta di una questione di cui Cinnamologus ha già parlato in un post precedente, con un esempio riguardante un caso complesso (collana di volumi) che sollevava però un problema fastidioso: la sottile differenza fra "parte di", d:Property:P361, e "pubblicato in", d:Property:P1433.

  1. "pubblicato in" è sottoclasse di "parte di", è più precisa, e il suo campo di applicazione è più limitato: la proprietà può essere applicata solo a opere (soggetto) per collegarle a edizioni.
  2. la proprietà inversa è comune a pubblicato in e a parte di: è consiste in, d:Property:P527.

Negli esempi collegati a pubblicato in, che quindi dovrebbero fare da riferimento, un esempio: la raccolta di racconti I sette messaggeri d:Q2375534, tipo edizione, contiene una serie di proprietà consiste in, d:Property:P527 che la collegano ai vari racconti individuali, es. Sette piani d:Q3478941, elemento di tipo narrativa a sua volta collegato con la raccolta I sette messaggeri attraverso una proprietà pubblicato in.

Provo a sistemare un pasticcio che ho fatto a suo tempo: Tragedie di Silvio Pellico (Le Monnier, 1883). --Alex brollo (disc.) 21:56, 13 ago 2020 (CEST)

Hai voglia.... ho aggiustato qualcosa, ma poco. Sono quasi più confuso di prima. :-( --Alex brollo (disc.) 22:54, 13 ago 2020 (CEST)
Il motivo della mia confusione: ai dati manca un "livello", manca il livello "Volume", perchè il "libro" che si chiama "Tragedie di Silvio Pellico (Le Monnier, 1883)" è suddiviso in tre volumi, e mancando questo livello non è possibile ricavare in quale volume si ritrovino le varie opere. Un errore che io ho fatto, e che invece @Cinnamologus ha schivato. Abbiate pazienza.... spero che queste riflessioni "online" portino alla fine qualcosa di buono.... e non aumentino, invece, la confusione mia e altrui. Vi tedierò ancora, qui, perchè le riflessioni si stanno estendendo.... e arrivo sempre a una conclusione: l'unico modo di chiarirsi veramente le idee è verificare se per ogni domanda riguardo l'incrocio di dati su opere, edizioni, autori è possibile costruire una query che fornisca una risposta corretta, e questo richiede che i dati per fornire una risposta corretta ci siano e siano "ben fatti". Non solo: le domande non dovrebbero essere formulate da chi "mastica wikidata", anzi, sarebbe bene che le domande venissero formulate da chi di wikidata non sa nulla, e che non ha la minima intenzione di imparare. Si cercano volontari fermamente intenzionati a non imparare nulla su wikidata. --Alex brollo (disc.) 08:17, 14 ago 2020 (CEST)
Ciao @Alex brollo, ho dato un'occhiata al lavoro che hai fatto su Tragedie di Silvio Pellico (Le Monnier, 1883) su Wikidata e ti segnalo alcune criticità:
  1. il libro di tragedie in questione non è composto da tre volumi ma è un volume singolo come si legge nella sua descrizione su OPAC. Non c'è quindi bisogno di aggiungere un livello superiore a quello già presente su Wikidata;
  2. nella sezione "consiste di" hai inserito i collegamenti alle pagine "Opera" delle singole tragedie. Facendo riferimento alla mia tabella hai collegato il livello 2 direttamente con il livello 4, bypassando il 3. Era lo stesso errore che facevo anch'io quando ci siamo scritti sulla mia pagina discussione... Solo dopo ho capito che il livello Ns0 qui su Wikisource si pone tra l'elemento "edizione" e l'elemento "opera";
  3. hai inserito tra le tragedie di Pellico il "Sir Tommaso Moro" di Munday e Chettle, scritto nel XVII sec. Ho visto che su Source c'è una pagina disambiguazione Tommaso Moro (Pellico) che però contiene due edizioni della stessa opera, non opere diverse con lo stesso nome. Mi risulta che su Wikidata non esista l'elemento "opera" per il Tommaso Moro di Pellico;
  4. non riesco a capire l'inserimento, nella sezione "consiste di", di questo elemento che rimanda a un'altra pagina di disambiguazione;
  5. essendo Tragedie di Silvio Pellico (Le Monnier, 1883) una raccolta di edizioni di tragedie, non va usata la proprietà "edizione o traduzione di" ma solo "consiste di" con i collegamenti alle singole edizioni contenute;
  6. Negli elementi "opera" si dovrebbe, invece, utilizzare la proprietà "edizione/i" ed evitare "pubblicato in" perché questo è il livello dell'opera letteraria "in sé", che andrebbe collegato solo con gli elementi "edizione".
Se può essere di aiuto posso revisionare queste pagine così si può vedere "praticamente" cosa intendo. Fammi sapere! Cinnamologus (disc.) 10:40, 28 ago 2020 (CEST)
@Cinnamologus Vai e grazie! Io sto tentando di raccogliere le idee in Utente:Alex brollo/Struttura wikidata, focalizzandomi sulla "lotta alla ridondanza" ("if you are repeating yourself, you are going wrong"). La proprietà "pubblicato in" è critica, ma più critica ancora è una definizione condivisa, e generale, di "opera". Trovo inoltre incomprensibile il fatto che "consiste in" sia suggerita come inversa di due proprietà differenti :-(
In pratica: sono ben lontano da avere le idee chiare. Se hai le sufficienti energie, ti raccomanderei di affrontare il duro caso delle raccolte di poesie. Io sto raccogliendo le forze per affrontare l'intrico delle Prose di Foscolo, sarà durissima. Alex brollo (disc.) 10:59, 28 ago 2020 (CEST)

Update Scrittori d'ItaliaModifica

Salto l'edizione 1940 di Sonetti burleschi (n. 88-89) che sarebbe un semplice duplicato dei due volumi del 1920; salto anche Puerili (Leopardi) (n. 91) che è già in una fase piuttosto avanzata (così non cado nella tentazione di adeguarlo al mio "stile" nella struttura e formattazione, che è costata sudore ad altri); arrivo a Scritti vari (Cuoco), in due volumi, che invece ristrutturerò abbastanza profondamente riunendoli in un unico testo ns0. --Alex brollo (disc.) 16:24, 16 ago 2020 (CEST)

Feedback requested: Ebook Export Improvement ProjectModifica

Note: This message is in English, but we encourage translation into other languages. Thank you!

Hello, everyone!

I am pleased to announce that the Community Tech team at WMF has posted our August update on the Wikisource Ebook Export Improvement project! This project came out of our 2020 Community Wishlist Survey, and it was the #1 wish voted on by survey participants.

So, what does this mean? In short, we want your feedback! Now that we have posted the August update, we want to know what you think. The update includes findings from our community consultation, results from two separate analyses conducted by the team (on improving WSExport reliability & font rendering support), and proposed next steps. It is our hope that people can read our analysis, share their feedback, and engage in a conversation with us on the talk page. Your feedback will be invaluable, and it will help determine the next steps of the project.

Thank you to everyone who has participated in the consultation so far! It's been a joy to explore how we can improve the ebook export experience. Now, we look forward to reading a new round of feedback on the project talk page!

-- IFried (WMF) (Product Manager, Community Tech)

Sent by User:SGill (WMF) using MediaWiki message delivery (disc.) 14:14, 17 ago 2020 (CEST)

Traduco quello che sono riuscito a capire: i piani alti si stanno finalmente occupando di WSExport, lo hanno spostato su un server più performante e dicono che adesso i malfunzionamenti avvengono più raramente. Stanno inoltre investigando per capire come migliorare l'epub/pdf prodotto, quindi se trovate degli epub che non si vedono bene, scrivetelo qui che glieli segnaliamo. Can da Lua (disc.) 10:19, 19 ago 2020 (CEST)

Tech News: 2020-34Modifica

22:41, 17 ago 2020 (CEST)

helpModifica

il tomo II de I promessi sposi è tutto al 75% tranne questa pagina https://it.wikisource.org/wiki/I_promessi_sposi_(Ferrario)/Capitolo_XXIV#pagename328 dove ho fatto qualche pasticcio che non so correggere. Grazie --Utoutouto (disc.) 21:17, 18 ago 2020 (CEST)

@Utoutouto Il problema stava nella figura...?
Io in genere ritaglio la figura escludendo la didascalia (che inserisco come testo nel parametro caption) di FI, ma mi sembra una finezza, e comunque questo (piccolo) problema riguarda anche le altre. --Alex brollo (disc.) 21:33, 19 ago 2020 (CEST)
Scusa, la figura non c'entra, non mi ero accorto che era già passato Candalua.... ;-) --Alex brollo (disc.) 21:37, 19 ago 2020 (CEST)

Ennesimo gadgetModifica

Ne ho fatto un altro, si chiama AutoreEdizioni. Come lascia presagire il fantasioso nome, agisce sulle pagine autore e mostra, per ciascun testo, l'edizione di provenienza, presa dall'Indice, con tanto di: curatore, città, editore, anno. Accendetelo da Preferenze > Accessori per provarlo. Non l'ho ancora attivato per tutti, ma mi sembra davvero un'informazione che non possiamo permetterci di non mostrare. Non funziona per i testi non proofread, ma se ristrutturassimo {{Infotesto}} con campi separati per Editore, città, ecc. si potrebbe estendere anche a quelli. Can da Lua (disc.) 16:29, 19 ago 2020 (CEST)

Vado ad attivare.... :-) --Alex brollo (disc.) 21:38, 19 ago 2020 (CEST)
  •   :-) Io lo metterei subito attivo per default. --Alex brollo (disc.) 21:50, 19 ago 2020 (CEST)

Stranezza multiprogettoModifica

Se guardate la:Liber:Ariosto, Ludovico – Lirica, 1924 – BEIC 1740033.djvu vedrete che i link a Canzoni e a Canzone I in Sommario sono "link blu", ma non puntano a pagine lawikisource: puntano alle pagine itwikisource. Ottenere questo effetto è di una semplicità disarmante: basta aggiungere :it: come prefisso nel parametro nome di Indice sommario. E' una stupidaggine o un uovo di Colombo? -Si sta pochi secondi a farlo anche sugli altri link a pagine ns0 che stanno su itwikisource... ma aspetto. -Alex brollo (disc.) 22:33, 19 ago 2020 (CEST)

Non lo sapevi? non è mica una novità... Se noti, in effetti quei link non sono dello stesso blu ma leggermente più chiari. Comunque puoi farlo anche con {{Testo}} usando il paramentro "lingua" Can da Lua (disc.) 14:30, 24 ago 2020 (CEST)
No, non lo sapevo e stento a riconoscere la differenza di colore. Segnalo però che in tl|Testo il parametro lingua fallisce al momento in caso di link relativi; vediamo se è possibile sistemare il codice. --Alex brollo (disc.) 17:16, 24 ago 2020 (CEST)
E' un secolo che non guardo il codice.... non mi piace, è elaborato parte con codice template, parte in Lua, il che complica parecchio le cose. Preferisco "derelativizzare" i link e tanti saluti. --Alex brollo (disc.) 17:30, 24 ago 2020 (CEST)

Wikisource e WikidataModifica

Intervengo con questo lungo post (portate pazienza!) su varie questioni di cui si è discusso qui al Bar recentemente in diverse occasioni, ma non in maniera organica. Ho raccolto le mie idee in una proposta, o visione, di come potrebbero essere organizzate le informazioni qui su Wikisource e su come inserirle su Wikidata. Mi scuso se riprendo argomenti già discussi e approvati, ma sentivo la necessità di fare una proposta organica.

1 - WikisourceModifica

Prima di addentrarci nell'uso di Wikidata, secondo me dovremo avere chiaro prima quale struttura dare ai testi che abbiamo qui e poi utilizzare quello che offre Wikidata. La distinzione opere / edizioni mi pare un ottimo punto di partenza. Per come sono organizzate le informazioni su Wikidata, dovremo utilizzare di più il namespace Opera.

Riprendo un concetto da una discussione qui sopra sull'uso delle date. Secondo me sia la data (o il periodo) di composizione dell'opera che la data dell'edizione sono fondamentali per capire cosa stiamo leggendo. Sono d'accordo a classificare le edizioni per data (o periodo) di composizione, ma in parallelo propongo di creare delle categorie anche per le edizioni (tipo Categoria:edizioni del 1845), in questo modo diamo dignità ad entrambe le informazioni, distinguendole.

Per quanto riguarda le disambigue, secondo me l'unico modo per non confonderci è quello di disambiguare per data di edizione esplicitandolo: tipo Iliade (edizione del 1544), così è chiaro ed univoco a cosa si riferisce la data e la disambigua.

Poco sopra si discuteva della possibilità di mettere nel namespace principale anche singoli sonetti o poesie tratte da raccolte. Non ho capito se è un'eccezione o questa pratica può essere estesa anche a libri con racconti brevi o raccolte di articoli scientifici e/o saggi. Come si comportano le Wikisource di altre lingue?

Rovisterò certamente su enwikisource e frwikisource. --Alex brollo (disc.) 17:08, 24 ago 2020 (CEST)

2 - WikidataModifica

Su Wikidata vengono create entità separate sia per l'opera che per le singole edizioni, collegandole opportunamente fra loro. Mi pare che sia la naturale trasposizione dell'organizzazione che è adottata qui su Wikisource. La voce nel namespace:Opera dovrebbe essere collegata all'entità su Wikidata corrispondente all'opera, in modo da collegarla alle voci su Wikipedia che la descrivono e ai progetti Wikisource di altre lingue che la trattano.

Le singole edizioni dovrebbero avere soltanto due link a progetti Wikimedia: uno alla corrispondente pagina nel namespace principale di Wikisource e uno al testo a fronte su Commons (se presente). Questo schema ha, secondo me, due eccezioni: testi multilingua che stanno su più progetti Wikisource, ed edizioni che per vari motivi hanno una loro voce su Wikipedia e che quindi avranno anche quel link.

Questo schema tuttavia comporta il coraggio di raddoppiare le entità su Wikidata di tutti i testi di cui abbiamo una singola edizione (un'entità per l'opera e un'entità per l'edizione) e creare per tutti una voce nel namespace:Opera.

Per quanto riguarda le proprietà di Wikidata inverse, confermo che Wikidata non ha un meccanismo automatico di completamento, ma segnala, con il sistema dei vincoli, la mancanza della corrispondenza: se nell'entità Tizio è affermato che Tizio è figlio di Caio, ma nell'entità Caio non viene riportato che è padre di Tizio, sull'entità Tizio questa mancanza viene segnalata.


3 - Proprietà di WikidataModifica

Rispondo a questa domanda di @Alex brollo: secondo me è rischioso proporre proprietà ridondanti. Potrebbero approvartela, ma magari fra qualche anno qualcuno la mette in cancellazione perché somigliante ad altre. Negli ultimi anni sono intervenuto in almeno due tentativi di cancellazione di proprietà del progetto Astronomia perché somiglianti a proprietà più generali... Prima di proporre nuove proprietà dobbiamo aver ben chiaro quali fra quelle esistenti possono essere utilizzate e, se non adatte, quali sono le differenze che ne richiedono una nuova. Molto spesso le differenze riguardano vincoli di controllo o altri aspetti. Questo deve essere ben chiaro per evitare cancellazioni future con spostamenti massivi delle informazioni ad altre proprietà.

--Paperoastro (disc.) 12:52, 24 ago 2020 (CEST)

Devo essermi espresso male.... mai, mai e poi mai proporrei una nuova propietà, non sono mica matto! Prima dovrei studiarmi in ogni dettaglio tutte le caratteristiche di tutte le proprietà esistenti!
Riformulo la domanda con un esempio pratico su opere/edizioni. Ammettiamo che si attribuisca una proprietà "autore" sia a un item edizione, che all'item opera corrispondente e collegato all'edizione. Wikidata si accorgerebbe di un'eventuale disallineamento dei dati? La soluzione "relazionale" sarebbe: assegnare un campo autore solo alla tabella opera; ma la libertà concessa dalla struttura wikidata è immensa. Il che ha pro e contro. --Alex brollo (disc.) 13:57, 24 ago 2020 (CEST)
@Alex brollo Ho guardato i vincoli automatici della proprietà "autore". Non sono previsti controlli automatici per il disallineamento fra l'autore dell'opera e dell'edizione. Penso che l'unica possibilità sia quella di fare una query per il controllo del disallineamento... --Paperoastro (disc.) 15:09, 24 ago 2020 (CEST)
Ahi. Non la vedo bene. :-( --Alex brollo (disc.) 17:03, 24 ago 2020 (CEST)

Tech News: 2020-35Modifica

19:59, 24 ago 2020 (CEST)

@Candalua Immancabilmente, emergono problemi; in sidebar, gli "Strumenti per la rilettura" hanno perso il loro stile e adesso compaiono con un font enorme. Aspettiamo che sistemino o dobbiamo sistemare noi? Per sistemare basta aggiungere una classe vector-menu-portal alla div #p-regex. Alex brollo (disc.) 18:50, 27 ago 2020 (CEST)
@Alex brollo: la cosa migliore sarebbe caricare i link seguendo queste istruzioni, come fatto per il CropTool. Can da Lua (disc.) 19:55, 27 ago 2020 (CEST)

Il perchè di questo "errore OCR"Modifica

Il sistema mi propone, come OCR di una pagina che contiene una poesia forse di Ariosto, questo errore:

240
APPENDICE PRIMA
IOO
105
I IO
”5
120
125
130
*35
empie d’orror, e grida ad alta voce:
— Perché m’avete abbandonata, o dèi?
perché da l’alto atroce
mio mal, da l’alte mie ruine e crolli
fuggite? Ah! dove sei
ascoso, o almo Sole,
che veder mi solei
...

La sequenza dei numeri (spesso mal interpretati, ma questo è un comune difetto di riconoscimento OCR, niente di strano) è la colonna dei numeri verso, stranamente "staccata" dalle righe dei versi. Se a qualcuno interessa capire come questo fastidioso errore nasce, vado avanti; se gli interessati conoscono già la risposta, mi fermo qui. --Alex brollo (disc.) 09:14, 25 ago 2020 (CEST)

@Alex brollo No, non conosco la risposta, è una cosa difficile? Mimidellaboheme (disc.) 15:10, 26 ago 2020 (CEST)
Dipende dal fatto che i migliori programmi OCR cercano innaizitutto di "capire" la struttura in blocchi del testo, e in questi casi "sbagliano", immaginando di vedere una tabella; e quindi dividono il testo in "colonne" prima di scendere a livello di riconoscimento delle righe, delle parole, dei caratteri. Poi, estraendo come puro testo il risultato, le colonne vengono riprodotte di seguito, a partire da sinistra, senza affiancarle.
Può essere un disastro soprattutto nelle opere teatrali in versi, dove tutti i personaggi sono staccati dalla loro battuta. Se si tratta di poche pagine pazienza; ma se sono decine o centinaia di pagine.... vi ricordo che ho gli strumenti per risistemare le cose. Per chi di voi ha la fortuna di possedere un ABBYY FineReader personale, la cosa si può sistemare prima di eseguire l'interpretazione del testo: il riconoscimento automatico della struttura del testo può essere corretta manualmente. Alex brollo (disc.) 15:32, 26 ago 2020 (CEST)

Template globaliModifica

Segnalo che è partito da un po' questo progetto: https://dibabel.toolforge.org/ che permette di creare dei template "globali", ospitati su mediawiki.org, che vengono poi "distribuiti" su tutti i progetti che lo desiderano (e in teoria vengono anche tenuti aggiornati, cioè se uno cambia il template "centrale" su mediawiki.org la modifica viene applicata ai corrispondenti template "locali" sui singoli progetti). Ovviamente da un lato è figo perché permette di non doversi creare localmente ciascun template, ma di prendere template già fatti da altri magari più bravi di noi, sui quali ci sarà (si spera) una manutenzione continua; dall'altro lato chiaramente lo svantaggio è che si lega ad altre persone, che magari modificano il template in modi che a noi non vanno bene e spaccano tutto. Questo detto, penso valga la pena investigare i template globali già presenti, potremmo trovarci cose utili. Can da Lua (disc.) 12:09, 25 ago 2020 (CEST)

L'idea è ottima, mi verrebbe da dire "meglio tardi che mai". Vado a vedere.... --Alex brollo (disc.) 18:06, 25 ago 2020 (CEST)
Due feedback uno buono, uno cattivo.
Il buono: i template possono essere filtrati per progetto e quelli per wikisource sono per ora pochissimi.
Il cattivo: 'mazza che cosa difficile..... :-( ma me lo immaginavo. --Alex brollo (disc.) 18:18, 25 ago 2020 (CEST)
Questa soluzione è stata chiamata significativamente "the poor man's version", ovvero: dato che la soluzione "vera", integrata con Mediawiki, non è mai arrivata, qualcuno preso dalla frustrazione ha deciso per il "fai da te che fai per tre". A quanto ho capito è ancora in fase di sperimentazione, per questo non è stata ancora pubblicizzata, e di conseguenza i template presenti sono ancora pochi. Can da Lua (disc.) 09:31, 26 ago 2020 (CEST)

Important: maintenance operation on September 1stModifica

Trizek (WMF) (talk) 15:49, 26 ago 2020 (CEST)

Ariosto... Ariosto...Modifica

Bene o male considero conclusi i lavori (SAL 25% "formattato") su Lirica (Ariosto), interessante per problemi tecnici, di noia mortale per i contenuti "amorosi" (gli unici versi che mi hanno dato una certa emozione.... sono apocrifi, attribuibili forse a Amanio).

Fra le altre cose, c'erano molte poesie in latino, che sono state trascritte su la.wikisource. Mi sembra che i link funzionino bene. ma potrebbero essere migliorati. Se vi va provate a navigare un po'.

Foscolo... a noi due. :-) --Alex brollo (disc.) 15:26, 29 ago 2020 (CEST)

Ultime lettere di Iacopo Ortis, collana Scrittori d'Italia: aiuto!Modifica

Sono fortemente imbarazzato da Ultime lettere di Iacopo Ortis, parte di Prose (Foscolo), nei due indici: Volume I e Volume II. La difficoltà è la struttura da dare a ns0. Qualcuno può aiutarmi a trovare due buoni nomi per la "prima versione" 1799 (dichiarata apocrifa da Foscolo) e per la "seconda versione" 1802, tenendo conto che nel nome dovrebbe essere anche fatto riferimento all'edizione Laterza per disambiguare? O è meglio una pagina unica ns0, con due sottopagine Prima versione (1798) e Seconda versione (1802)?

Secondo problema, le Notizie bibliografiche, pubblicate nell'edizione di Zurigo del 1816 [16], che forse richiederebbero una pagina ns0 indipendente.

Quasi quasi mi dedico, per ora, alla pura rilettura e formattazione.... ;-) --Alex brollo (disc.) 23:38, 29 ago 2020 (CEST)

La nebbia si dipana, anche grazie al fatto che l'edizione Marsigli del 1799, in due volumi, è su Google books: qui e qui. La strana pagina Pagina:Foscolo, Ugo – Prose, Vol. I, 1912 – BEIC 1822978.djvu/149 è il frontespizio del secondo volume, "Parte seconda"; genera molta confusione il fatto che invece manca il frontespizio del primo volume della stessa edizione, "Parte prima". Le scansioni sono di "qualità Google", però..... una tentazione di caricarle l'avrei :-)
@OrbiliusMagister, Candalua Per diminuire l'imbarazzo di un eventuale lettore della nostra trascrizione in ns0, senza aggiungere annotazioni originali, io farei due cose:
  • userei il titolo "Vera storia di due amanti infelici ovvero Ultime lettere di Iacopo Ortis", suddividendolo in "Parte prima" e "Parte seconda", per la "Prima versione"; --Alex brollo (disc.) 09:40, 31 ago 2020 (CEST)
  • userei invece il titolo "Ultime lettere di Iacopo Ortis (1912)" per la "Seconda versione". --Alex brollo (disc.) 09:54, 31 ago 2020 (CEST)
Credo che questo sia il caso di usare la pagina Opera:Ultime lettere di Iacopo Ortis in cui possiamo descrivere in ordine cronologico tutto quello che possiamo porre in ns0 con i titoli che ci paiono più adatti. Io userei come disambiguazione sia un eventuale titolo differente sia a parità di titolo l'anno di pubblicazione, quello dell'editore è un dato che lascerei facoltativo come ulteriore livello a parità di titolo e di anno o nel caso la pubblicazione si dipani su più anni. - εΔω 11:02, 31 ago 2020 (CEST)
Quindi passo alla proposta operativa con i titoli presenti e futuri:
Direi proprio di sì. Anche il primo testo cambierà titolo: la pagina Ultime lettere di Jacopo Ortis diventerà un rinvio alla pagina in nsOpera. - εΔω 14:50, 31 ago 2020 (CEST)

Gazzetta musicale dall'Archivio RicordiModifica

 
Gazzetta Musicale di Milano n.1, 1842

Ciao a tutti, Archivio Ricordi ha intenzione di caricare circa 150 volumi di raccolte delle sue riviste musicali. Qui a lato ne vedete un primo esempio, il primo numero della Gazzetta Musicale di Milano del 1842 (di cui caricheremo tutti i 70 volumi). La scansione come vedete è stata effettuata con 2 pagine affiancate unite in una unica immagine: spero non sia un grosso problema. Se c'è qualcuno a cui piace la musica (classica, operistica), ci sarebbe utile una mano, a cominciare dalle cose più semplici (es. i file pdf vanno convertiti?). Suggerirei di creare una pagina per il progetto (come già fatto per Wikisource:Scrittori d'Italia). Grazie in anticipo. --Marco Chemello (WMIT) (disc.) 10:53, 31 ago 2020 (CEST)

@Alex brollo, per chi trascrive direi che la pagina singola sia un obbligo: già le pubblicazioni di queste gazzette sono ricolme di testo e la rilettura di ogni singola pagina è un'impresa non indifferente, mantenere due pagine affiancate raddoppia la difficoltà. Quanto alla distinzione tra pdf e djvu non vedo problemi se non quello della pre-elaborazione dello strato OCR da parte di Internet Archive o di Alex, a cui cedo la parola. - εΔω 11:05, 31 ago 2020 (CEST)
Confermo: la separazione delle pagine è assolutamente necessaria e deve precedere il caricamento su Internet Archive. Tecnicamente, spero si possa fare con briss, che NON modifica minimamente le immagini; gioca soltanto con le coordinate delle parti di immagine visualizzate. Tuttavia, nonostante la qualità delle immagini sia molto buona, siamo abbastanza vicini al limite per avere un buon OCR: vediamo. Intanto provo briss, e dopo "brissato" il primo file, vediamo se FineReader si lagna. @Marco Chemello (WMIT): se non hai mai usato briss, ti raccomando calsissimamente di scaricarlo subito e di provarlo a fondo in corpore vili. Alex brollo (disc.) 11:38, 31 ago 2020 (CEST)
@Marco Chemello (WMIT), OrbiliusMagister Allora: briss funziona, e ho separato le pagine; poi con pdfsam le ho leggermente riordinate, spostando in testa la copertina (importante: la prima pagina di un pdf, prima di trasportarlo in IA, deve essere una pagina "fronte"). Ho testato cosa dice ABBYY FineReader su alcune pagine; come immaginavo, l'interpretazione OCR è decente (non eccellente) per gli articoli con font "normale", è molto povera per i testi in carattere più piccolo. Se siete d'accordo io ricaricherei la versione pdf "splittata" su Commons, sostituendo la precedente a doppia facciata; la rilettura in wikisource sarà comunque difficile, perchè di norma le immagini a fronte sono comunque ridotte a 1024px di larghezza max, e anche ingrandendole con lo zoom temo che la risoluzione sia insoddisfacente, molto minore di quella delle immagini originali.
In breve si profila un lavoraccio.
Apriamo un'altra discussione nel bar di settembre o continuiamo qui? Alex brollo (disc.) 09:49, 1 set 2020 (CEST)
Meglio ricevere un cenno da Marco Chemello: riproponiamo la discussione. - εΔω 11:29, 1 set 2020 (CEST)
@Alex brollo Grazie mille! Ricarica pure la versione splittata. Poi @LutiV ti chiederà suggerimenti dettagliati per sistemare i prossimi file. Intanto ci piacerebbe iniziare a caricarne alcuni, e su questo impostare un'attività di rilettura da estendere prossimamente a un pubblico più vasto. Vedremo --Marco Chemello (WMIT) (disc.) 17:10, 1 set 2020 (CEST)
@Marco Chemello (WMIT) Bene. Dò una buona controllata alla sequenza delle pagine e ricarico. Il passo successivo sarebbe quello di caricare il pdf sistemato si IA e controllare la qualità dell'OCR prodotto. Segnalo che adesso IA Uploader carica anche file pdf; in questo caso sarebbe un peccato perdere qualcosa del dettaglio trasformando il file in djvu. Una volta che IA avrà prodotto l'OCR, lo confronteremo con quello che produce ABBYY FineReader in locale, e useremo il migliore dei due. Apro una discussione nel bar di settembre per continuare la discussione (ho un paio di suggerimenti da dare sul procedimento di scansione). Alex brollo (disc.) 09:46, 2 set 2020 (CEST)

Tech News: 2020-36Modifica

22:11, 31 ago 2020 (CEST)