Wikisource:Bar/Archivio/2016.11

Archivio delle discussioni del mese di novembre dell'anno 2016

Categoria: Archivio Bar 2016 Bar   Archivio    novembre 2016 




Zero width joiner modifica

Direttamente da un viaggio negli script indiani (che aimè sono sillabici) porto a casa questo (ci vuole un font "ricco", tipo Code2000, ditemi con quali font le legature si vedono):

  • ct, c‍t, fi, f‍i, ae, a‍e, OE, O‍E, AE, A‍E

Il carattere ‍ è il "zero width joiner" e forza la conversione di due lettere staccate nella loro legatura (in solo alcuni font). Utile per i fanatici della diplomazia.... Io ne ero totalmente ignaro, e voi? --Alex brollo (disc.) 07:53, 1 nov 2016 (CET)[rispondi]

Ne avevo sentito parlare a proposito di Unicode. Non so se possa creare problemi nella ricerca a tutto testo. A quanto ne so io va usato solo se la legatura è estetica (per esempio con fi, fl, ff, ffi, ffl ecc. o quando æ non è un carattere unico ma una variante stilistica di ae come in testi latini recenti).--Carnby (disc.) 22:48, 1 nov 2016 (CET)[rispondi]
Non credo ci siano problemi, per esempio la ricerca del testo "ct" del browser trova entrambe le rappresentazioni ct e c‍t. Ma giusto per farvi conoscere il frutto della nostra (nostra: non mia!) collaborazione it.source-bn.source, eccovi il mio nome utente translitterato in bengalese: অলেক্স ব্রোল্লো :-) --Alex brollo (disc.) 08:26, 2 nov 2016 (CET)[rispondi]

Gioco da tavolo di wikipedia modifica

Per informazione w:it:Wikipedia:Bar/Discussioni/Wikipedia: il gioco da tavolo di Almicione. Ovviamente se ne è parlato nei gg scorsi in WMI ma ho approfittato di una pubblicità su quotidiano nazionale (Fatto Quotidiano) del 30 ottobre per risegnalare all'ufficio legale di WMF. Lo scenario peggiore non è che sia illegale ma che qualcuno in WMF abbia autorizzato un conglomerato (trans)nazionale di quelli citati da Moroboshi a usare il marchio wiki così tomo tomo cacchio cacchio in tempo per i regali natalizi. Conosoliamoci che magari il prossimo anno capita con wikisource... Almicione ti pingo solo qui, ma ti cito da altre parti.--Alexmar983 (disc.) 08:31, 2 nov 2016 (CET)[rispondi]

@Alexmar983 Feedback (è spiacevole che una segnalazione cada nel vuoto....): è una differenza genetica fra sourciani e pediani, mi sembra che noi sourciani abbiamo un centesimo dell'interesse dei pediani per queste cose e queste discussioni.... nel mio caso personale: un decimillesimo. :-) --Alex brollo (disc.) 10:40, 4 nov 2016 (CET)[rispondi]
sai per me è più questione di forma, se davvero WMF ha dato il logo per questo tipo di marketing meglio si sappia. E no, non mi preoccupa non avere feedback. Del resto ho iniziato con voi ma lo ho segnalato in altre wiki, preferivo non fare distinzione. Fra l'altro non penso che ai wikipediani piaccia discutere così tanto di queste cose. Piace loro discutere di cose non attinenti l'enciclopedia, ma ce ne sono che danno loro più soddisfazione, anzi molti supportano de facto il concetto di "disvelare con calma" quindi il fatto che di una cosa del genere si parli poco secondo me loro non dispiace. Ricorda quando parlano poco di altre cose ;)--Alexmar983 (disc.) 11:54, 5 nov 2016 (CET)[rispondi]

Immagini estratte modifica

Ciao volevo inserire l'immagine in questa pagina https://it.wikisource.org/wiki/Pagina:Marinetti_-_Scatole_d%27amore_in_conserva,_1927.djvu/15 con il template FI ma non trovo l'immagine corrispondente tra le immagini estratte dal testo su Commons. Come devo fare per tagliarla e caricarla? Grazie! Sbubi (disc.) 14:40, 3 nov 2016 (CET)[rispondi]

Se non è ancora stata estratta, si estrae con CropTool! il caso di un'immagine usata come capolettera richiede un po' di parametri aggiuntivi a FI, una volta trovati le cose possono essere sistemate molto bene. L'immagine poi può essere migliorata scaricandola, sistemandola e ricaricandola; ma il codice su source può restare identico e la faticosa sistemazione dei metadati su Commons è praticamente azzerata. --Alex brollo (disc.) 15:49, 3 nov 2016 (CET)[rispondi]
@Alex brollo Ho usato Crop tool qui https://it.wikisource.org/wiki/Pagina:Marinetti_-_Scatole_d%27amore_in_conserva,_1927.djvu/20, ritagliando e poi inserendo l'immagine caricata su Commons. E' giusto? Siccome questi capolettera si ripetono simili, mi chiedevo se sia necessario ripetere Crop Tool su ogni pagina, anche se la stessa immagine è già su Commons ma ritagliata da altra pagina, o basti inserire l'immagine già presente. In teoria "filologicamente" non sarebbe corretto, ma non solo quali siano i criteri di WS. Grazie! Sbubi (disc.) 20:27, 8 nov 2016 (CET)[rispondi]
@Sbubi Perfetto. Io non starei tanto a risparmiare sulle immagini, Commons è grande: ripetiamo pure il caricamento anche per immagini (ragionevolmente) ripetute. Il bello è che una volta ritagliata, e inserita nella pagina, l'immagine può essere perfezionata senza rimettere mano al codice. --Alex brollo (disc.) 14:52, 17 nov 2016 (CET)[rispondi]
   @Alex brollo Grazie! Per i capolettera pero' mi sembrava di ripetere troppe volte la stessa immagine, guarda un po'... se no rifaccio i ritagli. Grazie! Sbubi (disc.) 15:09, 17 nov 2016 (CET)[rispondi]

FullScreenEditing di Sam Wilson == modifica

@Samwilson Ho provato il tool FullScreenEditing di Samwilson, funziona perfettamente anche da noi ed è compatibile con i miei accrocchi preferiti :-)

Per provarlo (finchè il link funziona: è in lavoro!) aggiungete al vostro common.js la seguente riga:

// test upload of FullScreenEditing.js
mw.loader.load('//en.wikisource.org/w/index.php?title=User:Samwilson/FullScreenEditing.js&action=raw&ctype=text/javascript');

Il tool nasconde reversibilmente da una pagina nsPagina in edit tutto ciò che non serve all'edit, ingrandendo di molto sia il box testo che il box immagine, con un semplice click su un pulsante aggiuntivo   che compare in toolbox sotto "Zoom/Altro". Attenzione: le "linguelle" pagina avanti, indietro ecc al momento non funzionano. E' compatibile con eis, livePreview, BAT, e altri. Con eis si sposa benissimo e i comandi eis per pagina indietro, avanti ecc. funzionano.

Thanks Sam! --Alex brollo (disc.) 17:02, 3 nov 2016 (CET)[rispondi]

@BarbaforcutaPS: FullScreenEditing oscura la sidebar. Purtroppo oscura, quindi, "Strumenti per la rilettura", anche se continuano a funzionare le hotkeys (tipo alt+7 ecc); è un problema; comunque anche così, visto che si può ritornare alla visualizzazione normale con un banale click, a qualcuno di voi potrebbe bastare. Per Barbaforcuta: come "scheletro" per una revisione del tuo tool potrebbe essere utilissimo; si tratterebbe solo di innestargli sopra i tool, senza preoccuparsi di altro. --Alex brollo (disc.) 08:44, 4 nov 2016 (CET)[rispondi]
Appena possibile gli darò un'occhiata.--Barbaforcuta (disc.) 13:23, 5 nov 2016 (CET)[rispondi]

WP non russa modifica

Ho notato qui che il tmpl:Autore non aggancia la voce in russo, che invece esiste. Che ho sbagliato? --Carlo M. (disc.) 17:27, 3 nov 2016 (CET)[rispondi]

In caso di assenza della biografia su Wikipedia in lingua italiana, il template autore linka la biografia solo di alcune lingue (che su due piedi non ricordo), erano state scelte e ordinate in fallback tempo fa da @Candalua in base al buon senso e alla situazione dell'epoca. Credo che, volendo, la lista delle lingue supportate in fallback si possa ampliare. --Accurimbono (disc) 09:10, 4 nov 2016 (CET)[rispondi]
@Carlomorino, Accurimbono Il fallback è il seguente (definito in Modulo:Common), se volete si può modificare: {'en', 'enwiki'}, {'fr', 'frwiki'}, {'de', 'dewiki'}, {'es', 'eswiki'}, {'pt', 'ptwiki'}, {'rm', 'rmwiki'}, {'ca', 'cawiki'}, {'pl', 'plwiki'}, {'sv', 'svwiki'}, {'vec', 'vecwiki'} Can da Lua (disc.) 09:56, 4 nov 2016 (CET)[rispondi]
@Accurimbono, Candalua personalmente un po' di russo lo capisco mentre mi sfuggono completamente svedese e polacco. Io aggiungerei russo e nederlandese e gli altri dialetti/lingue legati all'italiano (piemontese napoletano etc.). Grazie a Gran Can de la Lua per la spiegazione. --Carlo M. (disc.) 10:03, 4 nov 2016 (CET)[rispondi]
@Carlomorino, Accurimbono ho tolto svedese e polacco e aggiunto russo, nederlandese, greco, piemontese, lombardo, ligure, emiliano-romagnolo (qualunque cosa sia), friulano, napoletano, tarantino, sardo e siculo. Can da Lua (disc.) 16:24, 4 nov 2016 (CET)[rispondi]
@Accurimbono, Candalua dobbiamo essere stati cattivi (io e Reichel) ma il russo russa e non si sveglia. Dovrò scrivere la bio in qualche altra lingua --Carlo M. (disc.) 22:06, 6 nov 2016 (CET)[rispondi]
@Carlomorino, Accurimbono voi siete perfidi, ma io russo della grossa: mi ero dimenticato che per qualche strano motivo abbiamo un'altro fallback definito in Modulo:Interprogetto, ed era quest'ultimo che andava modificato. Can da Lua (disc.) 09:59, 7 nov 2016 (CET)[rispondi]
@Accurimbono, Candalua ho trovato un mss su uozap di Jacques (ma anche Jacob, Jakub etc.) che diceva di ringraziare il gran Can de la Lua per averlo salvato dall'anonimato. --Carlo nihil faciens. (disc.) 10:06, 7 nov 2016 (CET)[rispondi]

Doverosamente ringraziamo @Jaqen per aver caricato su IA Istituzioni di Diritto Romano, esattamente l'edizione che noi avevamo, il volume I è già al suo posto. Oltre 600 pagine nel solo volume I.... ma il diritto romano non stava tutto in XII tavole? :-(

Volume II già pronto, da caricare quanto prima. --Alex brollo (disc.) 15:39, 4 nov 2016 (CET)[rispondi]

Non dimentichiamo di ringraziare Eusebia, Susanna e in generale la Biblioteca comunale di Trento, che le scansioni le hanno fatte loro! :) --Jaqen (disc.) 23:13, 4 nov 2016 (CET)[rispondi]
@Jaqen, EusebiaP, Susan bibtnCerto! Un grande ringraziamento. Caricato anche il Vol. II; una versione djvu BN tanto per averla ottenuta maltrattando un po' le vostre scansioni. Non mi soddisfa, quando avrò un po' di tempo ci rimetterò mano, ma almeno l'opera è completa e tutta con il suo OCR. --Alex brollo (disc.) 00:22, 6 nov 2016 (CET)[rispondi]
PS: bisognerebbe sistemare bene i metadati dei due volumi su Commons, con lo "stile" usato per le altre opere caricate dalla Biblioteca di Trento.... ce la fate a metterci mano? --Alex brollo (disc.) 00:24, 6 nov 2016 (CET)[rispondi]
Signori, questo è un pezzo della storia di Wikisource che finalmente incontra il suo prossimo compimento: mi unisco ai ringraziamenti e speriamo che con calma si possa giungere alla trascrizione di ambo i volumi.
Ad @Alex brollo segnalo le seguenti parole di Doveri, poste alla fine del secondo volume:
 
«Non trattiamo nel Corso nostro della parte istorica delle Azioni e in generale della Procedura Civile Romana, perchè in realtà queste sono materie estranee all’insegnamento nostro, e perchè nel breve giro di un anno Accademico, è impossibile illustrare anche queste. [...] Ciò nonpertanto non ci ricuseremmo a pubblicare un breve Saggio di Procedura Romana, che potrebbe servire di Appendice a queste Istituzioni nostre, ogni qualvolta, i nostri Alunni ce ne manifestassero il desiderio.»
Non vedo mani alzate XD. - εΔω 07:12, 6 nov 2016 (CET)[rispondi]
Grazie a tutti voi! Da domani sistemiamo i metadati su Commons, grazie Alex --EusebiaP (disc.) 11:27, 6 nov 2016 (CET)[rispondi]

Correggere l'OCR di un djvu modifica

Il djvu è un formato sfortunato, ma solo per colpa della pigrizia di chi non lo usa a fondo. La differenza fondamentale con il pdf è che è fatto per essere esaminato a fondo, ed eventualmente modificato in modo illimitato; non è facile, ma è la cosa in sè che non è facile. Il pdf è fatto per NON essere modificato, nè per essere esaminato a fondo. Per farlo occorre "hackerizzarlo" e comunque la difficoltà è notevolissima.

Se l'estrazione del testo mappato del djvu è fatto per permettere la sua modifica e il suo ricaricamento dopo correzione... allora facciamolo!

In corso esperimenti su Verona illustrata di Maffei, edizione 1825-26; questo è il primo divu in cui molte centinaia di parole dello strato OCR sono state modificate e ricaricate (con un buon editor di testi, Notepad++): Indice:Maffei - Verona illustrata I, 1825.djvu. --Alex brollo (disc.) 10:09, 5 nov 2016 (CET)[rispondi]

Ci sono parecchie strategie per farlo, avrei bisogno di uno o più volontari che sappiano e possano far correre uno script python e che abbiano familiarità con un buon editor testi che gestisca utf-8, per farmi aiutare a scegliere, fra le varie possibilità, una non troppo complicata per utenti coraggiosi. Resterà una operazione delicata, ma vorrei evitare di essere l'unico a saper maneggiare l'orrendo accrocchio.... :-( --Alex brollo (disc.) 11:10, 5 nov 2016 (CET)[rispondi]
@Alex brolloSempre interessato, attendo tue :) Xavier121 00:54, 8 nov 2016 (CET)[rispondi]
Grazie a entrambi. Aubrey è riuscito a trascinarmi dentro il mondo di github.... sistemo lo script e poi ce lo pubblico. Ma prima lo pubblico qui su wikisource: deve essere chiaro e documentato che la fonte è questo progetto. --Alex brollo (disc.) 21:42, 10 nov 2016 (CET)[rispondi]
L'obiettivo è il seguente, bastano Python e djvuLibre. Scaricato un xxxx.djvu con il suo strato OCR, si lancia da console/da cmd:
python fixocr.py xxxx step1
Viene creato un file testo xxxx_fix.txt contiene l'elenco ordinato di tutte le parole diverse (ovviamente prese una sola volta!) del testo che si apre con un text editor e si correggono le parole errate (più astutamente che si può e che si sa). Si salva e poi si lancia:
python fixocr.py xxxx step2
Finito. Vi pare troppo complicato? Alex brollo (disc.) 22:22, 10 nov 2016 (CET)[rispondi]
Pronto, spara tutto con relativo file istruzioni txt su cartella condivia dropbox! :) Xavier121 22:28, 10 nov 2016 (CET)[rispondi]
Ho parlato troppo presto; dopo una serie continua di test su opere enormi lo script si è arenato sui test di ieri sera, probabilmente per piccole anomalie dello strato testo di qualche pagina. Mi tocca indagare un po' più a fondo. :-( --Alex brollo (disc.) 15:20, 11 nov 2016 (CET)[rispondi]

il testo da modificare è quello della pagina precedente modifica

1. In questa pagina https://it.wikisource.org/wiki/Pagina:Cuoco_-_Saggio_storico_sulla_rivoluzione_napoletana_del_1799,_Laterza,_1913.djvu/166 il testo da modificare è quello della pagina precedente. Qualcuno mi aiuta e poi magari mi spiega (se è roba facile) come si fa?

  Fatto, errore tecnico irrilevante, buon divertimento! Xavier121 19:29, 7 nov 2016 (CET)[rispondi]

2. Come faccio a rivedere tutti i miei interventi sul Bar? E' possibile?

@Utoutouto Un trucco rapido è quello di entrare nella tua pagina contributi, e selezionare di visualizzare solo il namespace Wikisource. Non sono proprio tutti, al massimo te ne restituisce solo 500 alla volta. Può essere che oltre che i contributi in bar ce ne siano anche in altre pagine del namespace Wikisource, ma in genere quelli in Bar sono largamente preponderanti.--Alex brollo (disc.) 23:48, 7 nov 2016 (CET)[rispondi]

Ciao a tutti e grazie --Utoutouto (disc.) 18:01, 7 nov 2016 (CET)[rispondi]

00:01, 8 nov 2016 (CET)

Spaziatura verticale con CropTool modifica

Ciao a tutti, me ne ero già accorto ma adesso ne ho la conferma. Inserendo le immagini con CropTool non è semplice creare la giusta spaziatura verticale. Qui ho provato con <br/> seguito da altrettanti Nuova Riga per avere un risultato mediocre. Stò sbagliando qualcosa o il tool fa a pugni con qualche template. --Stefano mariucci (disc.) 05:55, 8 nov 2016 (CET)[rispondi]

Se possibile bisognerebbe trovare sempre alternative al tag
. Usando il template {{FI}} si ottiene un ottimo controllo delle spaziature verticali sopra e sotto con i parametri aggiuntivi margin-top e margin-bottom; per la spaziatura delle righe di testo, sto usando esclusivamente il template {{Ct}} che è utilissimo in tutti i titoli, ma particolarmente utile nelle pagine di intestazione, utilizzando il parametro v= che permette di gestire molto finemente la spaziatura verticale fra le righe di testo. Lo stesso parametro v= è accettato anche da {{Rule}}. Mi ero sonoramente stufato di combattere con i br e con le righe vuote! --Alex brollo (disc.) 09:57, 9 nov 2016 (CET)[rispondi]
Grazie @Alex_brollo. Appena avrò un attivo approfondisco quanto mi hai indicato in merito. Intanto grazie delle info. ;) --Stefano mariucci (disc.) 12:43, 12 nov 2016 (CET)[rispondi]
Provato {{FI}}. Perfetto. Grazie @Alex_brollo. --Stefano mariucci (disc.) 11:33, 23 nov 2016 (CET)[rispondi]

Natural Language Processing e trascrizione dei testi modifica

Sono qui a chiedervi un parere. Wikimedia CH nel proprio piano annuale vorrebbe testare l'utilizzo del Natural Language Processing per migliorare la trascrizione dei testi mediante OCR. In parole povere i passaggi sono questi:

  • OCR dei testi secondo gli stumenti canonici;
  • Passaggio attraverso uno strumento di Natural Language Processing per migliorare il testo prodotto e fissare alcuni errori rilevanti;
  • Rilascio del testo rivisto da NLP.

Quindi tra l'OCR e il normale lavoro di rilettura dei testi ci sarebbe uno strato intermedio automatizzato che andrebbe a rilasciare un testo "ripulito" basandosi su regole sintattiche, su ricerche su diversi dizionari, e su errori ricorrenti.

Abbiamo fatto un test con uno strumento esistente al di fuori dei progetti Wikimedia che usi un database NLP su cui si è lavorato per oltre 10 anni e i risultati sono molto incoraggianti. In pratica si potrebbero correggere almeno il 60-70% degli errori di interpretazione derivati da OCR. I limiti dello NLP sono che non riuscirà mai a ottenere il 100% delle correzioni, ma già ottenere il 60% sarebbe un successo.

Natural Language Processing è un bel termine, ma se alla base non c'è un ottimo database di regole, è come non avere il cuore. In questo caso andremmo a utilizzare un database sviluppato da moltissimi anni e utilizzato in diverse progetti (esterni a Wikimedia).

Ritenete che uno strumento del genere possa esservi utile? Consideriamo che si tratta di un investimento di una certa rilevanza a livello di costi, ma se si potrebbe ridurre il lungo e laborioso lavoro di correzione dei testi, non sarebbe male. --Ilario (disc.) 16:47, 9 nov 2016 (CET)[rispondi]

Un esperimento interessante, ma in wikisource soffre dello stesso problema che si incontra quando si prova a applicare strumenti di normalizzazione ortografica che funzionano benissimo su wikipedia ai testi di wikisource; su wikisource (in diversi gradi da progetto a progetto) ogni opera ha la sua propria ortografia che va rispettata. Mi rendo conto che il NLP lavora su un'altro piano rispetto a quello puramente ortografico (ho infilato apposta un errore ortografico che è tale solo oggi, non lo era nei testi più vecchi...) ma temo che la natura del problema rimanga lo stesso. Da quanto ho visto, la qualità dell'OCR è influenzata in modo formidabile dalla qualità dell'immagine; il numero di errori che può essere evitato lavorando sulla qualità dell'immagine penso sia di gran lunga superiore. Seguiamo l'esperimento comunque! Alex brollo (disc.) 23:10, 9 nov 2016 (CET)[rispondi]
Alex dice una cosa molto importante: per una quantità molto rilevante di testi le correzioni sarebbero probabilmente scorrette. Di fatto, se i database non sono almeno divisi per secoli, potrebbe rivelarsi abbastanza inutile... Bisognerebbe fare delle serie prove per calcolare il rapporto costi-benefici. Aubrey (disc.) 17:15, 10 nov 2016 (CET)[rispondi]
Concordo. Per fare un lavoro davvero fatto bene, ci vuole intanto una scansione di qualità (e già qui spesso siamo fregati), e poi ci vuole non solo un database di regole coi contropappafichi (sto rileggendo Salgari, perdonate...), che tenga conto delle convenzioni orto- e tipo-grafiche di ogni epoca paese lingua e magari editore e autore, ma anche la possibilità per chi lo usa di dire di volta in volta al sistema quale convenzione usare (pretendere che il sistema lo capisca da solo credo sia un po' troppo). Comunque vedendo gli errori OCR più comuni, in realtà non è detto che serva la Luna: già un OCR che sia impostato su "italiano" e conosca un po' di vocabolario aulico potrebbe costituire un miglioramento rispetto a ciò che spesso ci troviamo di fronte; a patto che non peggiori le cose credendo di far bene, cioè che non corregga cose che non sono scorrette ma solo desuete. Can da Lua (disc.) 17:54, 10 nov 2016 (CET)[rispondi]
bella fregatura, la maggioranza dei testi sono liberi in quanto vecchi, argo desueti, ergo non inquadrabili in uno strumento generalista. Esempio più semplice: correggerebbe mi sa tutti i "perchè" scritti con l'accento al contrario. Non so proprio come poter sfruttare qui questa bella cosa...--Alexmar983 (disc.) 06:41, 11 nov 2016 (CET)[rispondi]
La bellezza di questo srumento è che il database NLP è configurabile, quindi aiuta ad ignorare errori ortografici frequenti. La prova è stata fatta su un testo di Giambattista Marino, la persona che ha creato il database è un docente di italiano che ha creato il database su testi antichi. Infatti è stato il mio dubbio, ma anche per questo abbiamo pensato ad una fase di test prima di capire se continuare o se abbandonare il progetto. La questione del testo scannerizzato in altissima qualità è proprio risolvibile con NLP. --Ilario (disc.) 12:19, 11 nov 2016 (CET)[rispondi]
@Ilario La cosa, a questo punto, si fa molto interessante! Come potrei vedere l'applicazione in funzione? Alex brollo (disc.) 15:39, 15 nov 2016 (CET)[rispondi]
Grazie @Alex brollo sono contento che non ci sia un giudizio completamente negativo. Era mio interesse capire se aveva senso, il progetto sarà nel 2017 e sicuramente manderò qui degli aggiornamenti e coinvolgerò le persone interessate. L'esperienza della persona che ha proposto il progetto è molto rilevente secondo me e quello che ho potuto vedere dei suoi passati esperimenti mi fanno credere che potrebbe aiutarci molto. L'esperimento è stato fatto con un prototipo che girava stand-alone su un PC desktop, sicuramente il primo passo sarà quello di mettere questo prototipo on line. --Ilario (disc.) 13:03, 16 nov 2016 (CET)[rispondi]
Se @Ilario dici che i problemi che abbiamo sollevato sono risolti, il giudizio credo diventi positivo per tutti. Facci sapere come va e di cosa hai bisogno :-) Aubrey (disc.) 14:47, 16 nov 2016 (CET)[rispondi]

Caricamento testo da Internet archive modifica

Ciao! Dovremmo caricare un testo da internet archive per una esercitazione che ci sarà a Torino, in occasione del festival del Pubblico Dominio il 30/11/2016. Il testo è https://archive.org/details/VinoDiFreisa1795 Potete aiutarci? Grazie x il CoBis, Elena ed Emanuela

  Fatto --Xavier121 16:39, 10 nov 2016 (CET)[rispondi]

Autori con doppia nazionalità modifica

Secondo i tedeschi Arnold Busson (Arnold Busson) è sia tedesco che austriaco. Ovviamente non è l'unico, né il primo che mi sia capitato. Non si potrebbe implementare qualcosa tipo "naturalizzato" o similia. --Carlo M. (disc.) 18:51, 10 nov 2016 (CET)[rispondi]

Vedi anche la discussione di marzo 2015. --Accurimbono (disc) 09:08, 11 nov 2016 (CET)[rispondi]
Avrà provveduto? --Carlo M. (disc.) 09:56, 11 nov 2016 (CET)[rispondi]

Intanto su meta... modifica

Sono appena passato sulla sezione wikisource sul wishlist survey di meta in corso adesso. Non ho visto ancora nessuno di voi in giro, se mi fate sapere quali proposte sono interessanti lieto di dare il mio supporto. Vi metterei il link ma mi sa che per errore non l'ho copiato, ma penso ce la fate a trovarlo da soli, c'è un bannerone su quasi ogni wiki.--Alexmar983 (disc.) 06:43, 11 nov 2016 (CET)[rispondi]

  Fatto: ecco la mia proposta. Vediamo se bussando anche a questa porta ce la facciamo. - εΔω 08:54, 15 nov 2016 (CET)[rispondi]

Sapevatelo....? Collaborazione it-source - bn.source modifica

It.source è senza confini: c'è il nostro zampino in questa pagina, per esempio: bn:পাতা:Márk Likhita Susamácár.djvu/১১, e la collaborazione non riguarda il testo in alfabeto latino, ma quella in scrittura bengalese. Posso assicurarvi che il contributore è un analfabeta bengalese eppure, miracoli di mediawiki, ha contribuito ugualmente.... :-) --Alex brollo (disc.) 16:11, 11 nov 2016 (CET)[rispondi]

Domanda modifica

come mai uno scrittore come herman hesse,autore del celeberrimo libro intitolato SIDDHARTA non e' presente nei vostri elenchi. videsimone

Non è l'unico autore che manca.... :-)
Di regola, mancano tutti gli autori la cui opera è ancora coperta da copyright. Degli altri, più contributori siamo e meno ne mancheranno.... se vuoi venire a darci una mano.... :-) --Alex brollo (disc.) 22:15, 11 nov 2016 (CET)[rispondi]
Concordo. L'unione fa la forza.... e la forza fa aumentare i testi in WS. --Stefano mariucci (disc.) 12:41, 12 nov 2016 (CET)[rispondi]

Nuova collaborazione: Scipione Maffei modifica

Cari amici,

Ho il piacere di presentarvi in anteprima una nuova collaborazione che coinvolge WikiMedia Italia e la scuola in cui insegno.

Questa iniziativa si inserisce nella logica dell'obbligo di Alternanza Scuola-Lavoro (ASL) per gli studenti degli ultimi tre anni di scuola secondaria di Secondo grado: il progetto propone quattro sottoprogetti coinvolgenti sia Wikipedia che Wikisource in cui gli studenti scriveranno voci e trascriveranno testi guidati da esperti di Wikimedia Italia (tra cui il sottoscritto).

I progetti saranno presentati ufficialmente il 15 novembre dal WikiMedia evangelist Federico Leva.

Wikisource è implicata in un'idea ambiziosa: l'elaborazione dei cinque volumi della Verona illustrata di Scipione Maffei di cui al momento sono stati i primi tre. Il progetto su Wikisource partirà a gennaio e si svilupperà per un paio di mesi in un totale di quindici ore. A breve porrò ulteriori dettagli in Wikisource:Collaborazioni/Wiki-Maffei.

Si tratta della prima esperienza di ASL coinvolgente WikiMedia Italia e sta già facendo scuola: auspico un riscontro positivo perché in tal caso

  • potremmo trovare che qualche studente diventi collaboratore per suo intresse e non per obbligo scolastico;
  • il progetto potrà essere rilanciato con modalità ancora più interessanti;
  • ...avendoci messo la faccia personalmente non farei una figuraccia ignominiosa (sono psicologicamente preparato alla prospettiva che tutti gli studenti saranno dediti a Wikipedia e basta, ma ammetto che mi spiacerebbe molto).

Cosa ci è chiesto come comunità? Niente di diverso dalla routine: grazie alla impagabile disponibilità di @Alex brollo l'allestimento dei djvu procede bene e io mi occuperò dell'allestimento delle pagine indice e delle transclusioni, ma nei prossimi mesi arriveranno utenti nuovi che metteranno mano per la prima volta qui su source e sarebbe carino sfoderare la ormai leggendaria accoglienza wikisourciana fatta di silenziose correzioni o gentili messaggi in pagina di discussione ^_^: anche questo potrebbe contribuire a invogliare gli utenti a rimanere.

Stay tuned. - εΔω 11:07, 13 nov 2016 (CET)[rispondi]

Cambio in corsa (pant pant): colto un messaggio telepatico di Xavier121 (che non avevo letto) abbiamo cambiato fonte al volo, e modificato la struttura degli Indici; la prossima versione deriverà dalle immagini OPAL e la prima parte, divisa in due "volumi" in cui la numerazione pagine è continua, è stata fusa in un unico Indice: Indice:Maffei - Verona illustrata I-II, 1825.djvu. Alex brollo (disc.) 08:31, 15 nov 2016 (CET)[rispondi]

Idea per i livelli di nsPagina modifica

Da una discussione in atto su wikisource-l un'idea immediatamente realizzabile: associare ai normali livelli canonici una serie di flags, ognuno dei quali rappresenta la necessità di fare una certa azione prima di portare la pagina a SAL 75% - level 3.

Mi spiego: nel momento in cui viene caricato l'OCR il testo grezzo va sottoposto a vari trattamenti:

  1. rilettura e correzione del puro testo
  2. formattazione
  3. inserimento immagini se ce ne sono
  4. correzione di lingue esotiche (greco, ebraico...)
  5. inserimento AutoreCitato e TestoCitato
  6. (altro?)

Avessimo i flags, con un paio di click descriveremmo esattamente lo stato della pagina permettendo anche di categorizzarla molto finemente per quanto riguarda i lavori da fare; sarebbero perfettamente evidenti anche combinazioni inusuali come "pagina formattata ma non riletta" :-)

Non solo: il livello sarebbe determinato automaticamente come logica conseguenza delle cose che ancora devono essere fatte. Ovviamente non tutte le pagine richiedono alcuni passaggi, quindi alcuni flag potrebbero essere azzerati al primo sguardo: è chiaro che se una pagina non contiene immagini, non richiede il loro inserimento; e se una pagina è vuota, cliccando level 0 tutti i flag devono azzerarsi.

Che ne dite? Comunque tranqui, non proverò qui.... proverò su la.source. --Alex brollo (disc.) 16:09, 13 nov 2016 (CET)[rispondi]

ah mi sembra ottimo. Inoltre più scomponi il lavoro in piccoli passaggi, più è facile per utenti sporadici dedicarsi a aspetti specifici con profitto.--Alexmar983 (disc.) 11:00, 14 nov 2016 (CET)[rispondi]
Uno screenshot di come potrebbe venire:
 
Altri check immaginabili? Ovviamente finchè c'è flaggato un solo check il SAL 75% sarebbe oscurato. Un click sul SAL 0% flagga tutto (non c'è niente da fare). Vedo che fra le ipotesi più frequenti manca il greco da controllare. --Alex brollo (disc.) 16:25, 14 nov 2016 (CET)[rispondi]
Adesso, vi propongo una riflessione sulle regole per tradurre automaticamente i flags in SAL. Notate che è registrabile anche uno "stato" "OCR bruto": tutto flaggato. Io proporrei:
  • tutto flaggato, meno la rilettura: SAL 25%
  • flaggate solo azioni "specialistiche" (tabelle, greco): SAL 50% (corrisponde abbastanza bene a "pagine problematiche", in effetti lo sono)
  • tutto sflaggato: SAL 75%
I valori dei flags potrebbero essere memorizzati in un template standard, aggiunto automaticamente alla pagina e aggiornato il momento di un click su qualsiasi checkbox; al momento del caricamento pagina, i suoi parametri potrebbero essere decodificati e i checkbox ri-flaggati. Il template produrrebbe le opportune categorie. Mettendolo in una posizione "nascosta", tipo in footer, non darebbe alcun fastidio. --Alex brollo (disc.) 08:22, 15 nov 2016 (CET)[rispondi]
Esempio in pratica del template: Pagina:Bandello - Novelle, Laterza 1911, III.djvu/281, in footer. La pagina non ha nulla di strano, va solo formattata, i parametri di {{level}} sono tutti 0 meno che il secondo che è 1, l'unica categoria generata è "Pagine da formattare". Ovvio che il template non è fatto per essere corretto a mano..... Alex brollo (disc.) 09:42, 15 nov 2016 (CET)[rispondi]

Per favore reimposta la tua password modifica

Abbiamo riscontrato la compromissione di alcuni account dotati di privilegi da parte di terzi non identificati e non autorizzati.

I membri della comunità stanno lavorando assieme ai membri di vari team della fondazione per risolvere il problema.

Nel frattempo chiediamo a tutti di rivedere le password dei propri account wiki. Se sei consapevole di aver scelto una password debole o se hai riutilizzato una password che usi altrove cambiala.

Scegli password forti -- lunghe almeno otto caratteri, contenenti lettere, numeri e segni di punteggiatura. Joe Sutherland (discussione) / MediaWiki message delivery (disc.) 00:43, 14 nov 2016 (CET)[rispondi]

Un consiglio modifica

Da oltre due settimane la mia connessione ha problemi a caricare piattaforme wiki, e questo si esaspera quando ci sono interazioni con commons. In altri termini posso ancora caricare una pagina commons, ma se carico una pagina wikipedia o wikisource le immagini arrivano alle calende greche.

In breve non posso più rileggere nulla qui. Salvo rileggere il testo se ci sono errori evidenti, e comunque nel dubbio non sarebbe corretto correggerli se non posso verificare il testo originale.

Quindi a meno che non vogliate che aleggi solo al bar, che mi consigliate di fare? Cos'altro c'è oltre a rileggere di utile da fare?--Alexmar983 (disc.) 11:05, 14 nov 2016 (CET)[rispondi]

Non aleggiare: vedi di risolvere il problema della tua connessione..... magari cambiando gestore :-) (ovviamente fatte le verifiche e le diagnosi del caso). --Alex brollo (disc.) 12:30, 14 nov 2016 (CET)[rispondi]
Non posso, è l'Università che gestisce qui e casa mia la connessione. Ed è comparso un imbuto maggiore di caricamento su cui non ho alcuna influenza. Come ho detto sulle pagine effettive di testo va bene, e alla fine anche commons ancora ci lavoro, ma quando si tratta di transcludere da commons è lentissimo. Temo che dalla Cina non potrò rileggere più nulla se continua così. Io bazzico davvero tante piattaforme, lo farei comunque di passare se la connessione lo permette, e non mi dispiace fare qualcosa, anche molto disparata, quando ci passo. Semplicemente non conosco source con una tale profondità da trovarla qui al momento...--Alexmar983 (disc.) 14:13, 14 nov 2016 (CET)[rispondi]

Wikisource:Ricorrenze/15 novembre modifica

Pages like Wikisource:Ricorrenze/15 novembre are currently not linked with Wikidata. As I plan to link slovene pages (sl:Wikivir:15. november) I think it would be ok to link italian as well. Which Wikidata item is in your opinion proper to be linked with: d:Q2982 or d:Q5666397? --Janezdrilc (disc.) 17:11, 14 nov 2016 (CET)[rispondi]

Janezdrilc thanks for asking, always a nice thig to do. To me the best page is the second one, the first one is about the date of the 15th of November, not a selection for the main page. I also ping some it-N wikidata sysop: User:Epìdosis, User:ValterVB what do you think?--Alexmar983 (disc.) 06:04, 15 nov 2016 (CET)[rispondi]
Clearly the second. --Epìdosis 07:35, 15 nov 2016 (CET)[rispondi]
D:Q5666397 is for template, probably the correct item to use is D:Q2982 or we must create a new item . --ValterVB (disc.) 08:36, 15 nov 2016 (CET)[rispondi]
The first is a date, the second a template. Therefore, we need a new dedicated item. --Accurimbono (disc) 09:11, 15 nov 2016 (CET)[rispondi]
It can be also a template but it's not a template in all languages. I think that the property is therefore also slightly wrong. Non-content pages can be crosslinked in a flexible way, such as Wikipedia and Help namespaces that are often merged, see d:Q4592334 or d:Q151637. I specifically asked at the village pump months ago. In this case in some projects is a Wikipedia namespace, in other ones a template, but basically it's the content the main aspect to consider. Outside ns0, we usually don't split items that reunite different namespaces if they address the same concept. At least not yet. I'm not saying I totally agree but it's clearly the most useful thing for a user to find all the pages dedicated to "stuff related to the specific date that the wiki have and shows on first page" all together, as it is for a description of rules on a certain topic.--Alexmar983 (disc.) 13:28, 15 nov 2016 (CET)[rispondi]
I think creating a new item would get even more confussion. I try to consider two main ideas of our Wikisource pages (it and sl):
  • If we consider pages just as templates for selected anniversaries for the Main Page, then in my opinion is better to chose the second item (Q5666397).
  • If we consider pages as collections of all anniversaries, that are "incidentally" shown at the same time on the Main Page, it would be better to chose the first item (Q2982).
In case of slovene pages I understand them more the second way. --Janezdrilc (disc.) 15:46, 15 nov 2016 (CET)[rispondi]
The first Item not at all: it is a DATE (NS0, i.e. a content page), not an help page.
IMO: If template pages and help pages have been connected to the same WD item, they shall be splitted in 2 different items (one for Template NS and another for Help NS) to avoid further confusion. --Accurimbono (disc) 16:52, 15 nov 2016 (CET)[rispondi]
Just asking: What do you think about Wikiquote links in the first item? q:sk:Deň:15. november (Deň means Day) is an example of content page with it's own namespace, similar to Croatian Wikipedia that uses special namespace "Dodatak" (meaning Appendix) for all the lists. Deň namespace at the same time serves as a template for the Main Page. Besides q:en:November 15 and q:pt:15 de Novembro don't bring births and deaths of that day but sellected quotes which seems to be more proper for the second item - if they wouldn't be in the Article namespace. --Janezdrilc (disc.) 15:28, 16 nov 2016 (CET)[rispondi]
I don't think that at the moment wikidata requires such level of purism, why splitting this item and not other ones I could cite? Wikidata made a choice of being practical for the reader and the user, as far I understood, hence not all namespace have to be separated outside ns0. Maybe they will one day but it's a slow process and in the meantime our focus should be on the user, what it's best for him/her, as far as I understood. I think that we can go for a wider discussion here, just to be sure. Janezdrilc what about discussing it at wikidata village pump? Let's move there and study the issue with an overall perspective, for all these similar items. What do you think? --Alexmar983 (disc.) 09:53, 17 nov 2016 (CET)[rispondi]
Well said, Alexmar983. Anyway, I don' think necessary to make a big deal discussion from this topic, although it is an interesting issue. It was just meant to be an easy "poll" to see what kind of linking would be more proper in your eyes. Since you more prefer the second item (except ValterVB), I agree to link our pages with that one. Ok, let's do it this way. Thank you all for help. --Janezdrilc (disc.) 14:42, 17 nov 2016 (CET)[rispondi]

20:17, 14 nov 2016 (CET)

Novità dall'Alto Adige modifica

Alcune notizie dall'Alto Adige che riguardano soprattutto il mondo ladino

Convenzione con l'Università di Bolzano/Bressanone Wikimedia sta concludendo una convenzione con l'Università di Bolzano/Bressanone. Il prof. Videsott direttore della sezione in lingua ladina della facoltà di Scienze della Formazione oltre a formalizzare ufficialmente l'autorizzazione all'utilizzo delle trascrizioni corrette manualmente sia nella versione con la grafia originale sia con la grafia moderna della lingua ladina, mette a disposizione i testi .pdf da lui utilizzati per l'OCR . Buona parte dei testi sono già stati caricati, se si vuole anche mettere a fronte il .pdf, basta chiederlo e poi necessita tanto olio di gomito.
Collaborazione con la Biblioteca Claudia Augusta di Bolzano Nell'ambito della partecipazione al bando Interreg Italia-Svizzera una parte del progetto prevede la valorizzazione delle leggende e saghe ladine. Se si risulterà vincitori del bando è prevista la possibilità che la Biblioteca Claudia Augusta di Bolzano, seguendo l'esempio dell'esperienza fatta alla Biblioteca Comunale di Trento abbia un Wikipediano in residenza che completi la trascrizione su Wikisource delle opere di Jan Batista Alton
Progetto biblioteca scolastica digitale nelle località ladine Con il sovrintendente alle scuole nelle località ladine è allo studio la realizzazione di una biblioteca digitale scolastica plurilingue (lingua ladina, lingua italiana, lingua tedesca, lingue straniere) con ebook in formato epub tratti da wikisource.

Carne al fuoco ce n'è tanta, fin troppa forse; faccio sapere se ci saranno ulteriori novità.Mizar (ζ Ursae Maioris) (disc.) 18:17, 16 nov 2016 (CET)[rispondi]

Sono in github modifica

Dopo alcune vigorose sollecitazioni sono dentro github e ho il mio primo "repository", dove ho esposto al pubblico ludibrio la mia ultima creatura: OCRfix.py (ovviamente prima l'ho pubblicata qui in casa: Progetto:Bot/Programmi in Python per i bot/OCRfix.py). @Aubrey adesso devi spiegarmi come fare le cose per bene (in particolare come "agganciarlo" al gruppo wikisource dentro github). Ho capito forse il 1% di come github funziona, ma il primo passo è fatto.... chiunque mi possa e voglia aiutare, in qualsiasi modo, è benvenuto.

@Xavier121 Lo strato testo djvu prodotto da FineReader 11 è abbastanza bizzarro.... troverò il modo di ricondurlo alla ragionevolezza :-) --Alex brollo (disc.) 16:51, 17 nov 2016 (CET)[rispondi]

Ci sto provando, sai, a capire come funzionano le organizations su GitHub... Non ho ancora capito. Aubrey (disc.) 17:47, 17 nov 2016 (CET)[rispondi]
Prova a vedere se adesso riesci a mettere tu il tuo repo dentro l'organizzazione: ti ho reso owner, forse basta. Aubrey (disc.) 17:53, 17 nov 2016 (CET)[rispondi]
@Aubrey Ah. Ok, vedrò, grazie. Strano: qualcuno mi aveva detto che github è facile... vedo che è facile come wikisource.... ;-) --Alex brollo (disc.) 12:20, 18 nov 2016 (CET)[rispondi]
Bhè, github per alcune cose è facile: carichi file e cartelle, di fatto (non è invece facile git, ma non serve). Le organization sono una roba che non conosco. Aubrey (disc.) 17:03, 18 nov 2016 (CET)[rispondi]

quanti libri? modifica

Ho avviato una collaborazione con la Biblioteca delle Oblate di Firenze che prevede, tra le altre cose, la creazione di link dal loro catalogo ai testi presenti in Wikisource; per organizzare il lavoro hanno necessità di sapere quante sono i libri presenti in Wikisource. Esiste su Wikisource un meccanismo come su Wikipedia che consente da andare dal libro al catalogo online? Grazie --Susanna Giaccai (disc.) 09:12, 19 nov 2016 (CET)[rispondi]

@Accurimbono, --Xavier121 14:59, 19 nov 2016 (CET)[rispondi]
Non ho capito bene la domanda e non saprei proprio.
Collegamenti con siti esterni si possono fare solo con link. Quale sarebbe il "mecccanisimo su Wikipedia"? Si può avere un esempio per capire meglio? Grazie, ciao, --Accurimbono (disc) 17:39, 19 nov 2016 (CET)[rispondi]
Scusa il ritardo @Accurimbono, Il meccanismo di Wikipedia che collega la citazione del libro attraverso il numero ISBN al record relativi nell'OPAC prescelto, sta dentro il Template:Cita libro e fa si che cliccando sul numero ISBN si vada alla pagina Fonti librarie in cui l'utete più scegliere OPAC della sua rete bibliotecaria e vedere in quale biblioteca si trova il libro. Spero di essere stata abbastanza chiara. Ciao --Susanna Giaccai (disc.) 13:55, 21 nov 2016 (CET)[rispondi]
L'abbiamo fatto con i testi trentini presenti su Wikisource, ma appunto attraverso link: c'è una sezione nella nostra pagina progetto [12] se vuoi dare un'occhiata --EusebiaP (disc.) 18:03, 19 nov 2016 (CET)[rispondi]
Nella pagina Speciale:Statistiche leggo che le pagine di Indici sono 1.411; ne posso dedurre che i libri in Wikisource sono 1.411?

Wishlist 2016 modifica

Ho aggiunto un paio di idee alla Wishlist, per lo più sono cose che abbiamo già realizzato qui ma che mi pare giusto far conoscere in modo che siano rese "serie"; una cosa nuova invece è la proposta di aggiungere qualche tool al magnifico CropTool di Danmichaelo, in modo da poter ritoccare le immagini ritagliate prima del caricamento su Commons. --Alex brollo (disc.) 11:21, 19 nov 2016 (CET)[rispondi]

Visual Editor modifica

Volevo ricordare a tutti e anche a me stesso che il Visual Editor ha una funzione secondo me utilissima anche per gli utenti esperti, che solitamente ne stanno alla larga: poter incollare da Word o ODT, mantenendo la formattazione. Se non erro, fa qualcosa anche con le note. Lo trovo molto utile quando partiamo da testi già digitali, che non hanno bisogno di essere trascritti. Di fatto, si apre una pagina e si incolla, capitolo per capitolo. Aubrey (disc.) 21:44, 19 nov 2016 (CET)[rispondi]

Spetta un momento. Tu stai dicendo che incollando un testo word .... la formattazione viene convertita in markup wiki da Visual Editor? ...--Alex brollo (disc.) 22:40, 19 nov 2016 (CET)[rispondi]
Si. Tutto grazie a Parsoid, che è il parser che fa avanti e indietro fra HTML e codice wiki. Aubrey (disc.) 10:03, 20 nov 2016 (CET)[rispondi]
In questo caso bisogna provare cosa succede a importare l'OCR formattato di FineReader. Chissà! --Alex brollo (disc.) 10:11, 20 nov 2016 (CET)[rispondi]
Prova a vedere, io non l'ho mai fatto, è certamente interessante. E adesso lo puoi fare anche per Pagina. Aubrey (disc.) 10:20, 20 nov 2016 (CET)[rispondi]

Compleanno alle porte modifica

Cari amici,

il tredicesimo compleanno di Wikisource è alle porte. Grazie a @Xavier121 la pagina apposità è praticamente già pronta, ma vorrei che discutessimo qui ciò che va puntualizzato rispetto alle questioni emerse gli anni scorsi per integrare o modificare il ergolamento. comincio io: abbiamo tre giorni, usiamoli bene.

Arbitri giocatori? modifica

da Discussioni Wikisource:Dodicesimo compleanno di Wikisource:

 
«Per l'anno prossimo ripensiamo all'ambiguità del doppio ruolo di partecipanti-arbitri assunto dagli amministratori nel concorso, propongo dunque che gli amministratori non siano inclusi nel conteggio e nell'estrazione finale.»
(- εΔω 08:33, 8 dic 2015 (CET))
 
«In realtà, è facile tirarsi fuori dal concorso: ... Basta che mi fate una lista di chi si tira fuori, e poi quando estrarrò i vincitori li togliamo e riestraiamo nel caso vincano...»
(Aubrey (disc.) 09:53, 8 dic 2015 (CET))
  1. Io chiedo che gli amministratori e in generale arbitri del concorso (Cioè Aubrey e chi si occupa delle statistiche) non partecipino al concorso? Questo implica l'esclusione dal conteggio delle loro modifiche, ma ovviamente non esclude il loro lavoro di controllo dell'operato dei partecipanti...
  2. L'alternativa di Aubrey è che, invece di escludere automaticamente le categorie sopraelencate, chi chiede di essere escluso dalle statistiche si iscriva in una lista l’utente così che si abbiano admin partecipanti e admin non partecipanti al concorso.
In assenza di discussione scelgo il silenzio-assenso: dichiaro definita la prima ipotesi: noi admin svolgiamo lavoro di controllo e dunque non possiamo creare conflitto di interessi, dunque non entriamo nelle statistiche del concorso.

Giuria esterna da WMIT modifica

Il concorso è sponsorizzato da Wikimedia Italia, no? È opportuno che chi decreti il vincitore provenga dal direttivo WMI e sia nominato prima dell'inizio del concorso. Sto sbagliando? Che ne dite?

se volete, scrivere a qualcuno del direttivo. @CristianCantoro è quello che ha disegnato il sistema per cntare le statistiche, @Sannita ogni tanto bazzica qui. Solitamente facevo io perchè ero entrambi, e loro non so se hanno tempo ma si può chiedere. Fra l'alto, dobbiamo chiedere se sponsorizzano anche quest'anno (non dovrebbe essere un problema). Aubrey (disc.) 10:18, 20 nov 2016 (CET)[rispondi]
Bene bravo ecc., ma non possiamo far partire il concorso senza essere sicuri di cosa ci sia in palio. Il tempo stringe e la pagina di feedback testimonia che il premio in palio è una molla motivante non da poco! - εΔω 17:42, 20 nov 2016 (CET)[rispondi]
Scrivo al direttivo, ma puoi scrivere anche tu, in tanti siete soci WMI. Cmq sono sicuro che accettano Aubrey (disc.) 19:08, 20 nov 2016 (CET)[rispondi]
Io sono per confermarlo ogni anno, tanto la spesa è bassissima e la resa è molto alta, mi sembra sia il perfetto caso di scuola di "squadra che vince non si cambia". :)
Sulla giuria, io posso dare la mia disponibilità e vedo pure se riesco a ottenere la disponibilità di @Atropine come back-up. Vedo pure se @CristianCantoro mi fa un breve tutorial su come funziona il suo script. --Sannita - L'admin (a piede) libero 12:34, 21 nov 2016 (CET)[rispondi]
  Fatto Aggiudicato! - εΔω 16:21, 24 nov 2016 (CET)[rispondi]
Lo script è su GitHub. Aubrey aveva qualche problema di connessione che non so se ha risolto, io riuscivo a farlo girare senza problemi. --CristianCantoro (disc.) 14:26, 7 dic 2016 (CET)[rispondi]

Regola dei due minuti modifica

Sunteggiando da Discussioni_Wikisource:Decimo_compleanno_di_Wikisource#Regola_dei_due_minuti: come ci regoliamo slle riletture molto molto veloci?

secondo me dovremmo usare le riletture molto veloci come "campanello d'allarme", e riguardare bene (coi diff) quelle pagine che sono state rilette così. In base a quello vediamo se la gente si comporta bene o meno. Aubrey (disc.) 10:08, 20 nov 2016 (CET)[rispondi]
Ci sono personalmente molte pagine che leggo velocemente, che sono spesso singoli sonetti o pagine di libri del Ventennio, con un font assolutamente gigantesco.
Ovvio, leggere in due minuti una pagina dello Zibaldone è quasi follia, ma non sempre due minuti sono un segnale di allerta: spesso ho letto interi paragrafi in dieci minuti, con sei o sette pagine ciascuno. Shinitas (disc.) 17:04, 20 nov 2016 (CET)[rispondi]
@Shinitas, hai decisamente lo sguardo acuto del rilettore esperto: anche se non sei un arbitro — ma non so per quanto ancora ;-) — e anche se scommetto che ti getterai a pesce a rileggere, aiutaci a tener d'occhio le ultime modifiche per scovare eventuali niubbi fubbi...
Vogliamo essere bastardi? A insindacabile giudizio della cricca degli amministratori chi effettua una rilettura sotto i due minuti di pagine "normali" e viene beccato a lasciare più di un tot di errori (facciamo cinque?), viene squalificato dal concorso, che dite? - εΔω
Concordo con la proposta di Edo. --Accurimbono (disc) 18:01, 20 nov 2016 (CET)[rispondi]
5 errori nella stessa pagina o in generale? Cmq concordo nel giudizio degli amministratori, come sempre fatto. Aubrey (disc.) 19:13, 20 nov 2016 (CET)[rispondi]
Nella stessa pagina. È un margine piuttosto generoso infatti il principio è che se in una pagina ci sono meno di cinque errori la rilettura può anche scorrere effettivamente veloce, ma se la rilettura scorre veloce e a causa di ciò scappano cinque errori presenti in tale pagina il problema non sono gli errori ma la rilettura: in fondo quando una pagina passa a SAL 100% è meno probabile che venga ulteriormente riletta e dunque è il caso di non accumulare aspettative disattese. Ne sappiamo qualcosa io e Omino di carta che abbiamo praticamente trovato la prima parte delle Rime di Cino ds Pistoia ufficialmente validata e in realtà tutta da controllare. - εΔω 21:41, 20 nov 2016 (CET)[rispondi]
Cinque errori nella stessa pagina mi sembrano tanti, a meno che non siano cose minutissime e di formattazione. Se uno lascia 2-3 errori per pagina, in più pagine, vuol dire che non sta rileggendo. Sceglieremo dei testi relativamente semplici... Aubrey (disc.) 23:10, 20 nov 2016 (CET)[rispondi]
Se nessuno si oppone allora facciamo TRE errori (ovviamente il controllo scatta quando si incappa in situazioni sospette) - εΔω 14:02, 23 nov 2016 (CET)[rispondi]

Definizione di "formattare" modifica

 
«Per rilettura, s'intende il passaggio di una pagina da SAL 75% a SAL 100%, secondo le regole di Wikisource.
Per formattazione, s'intende il passaggio di una pagina da SAL 50% a SAL 75%, secondo le regole di Wikisource
(Regolamento del concorso 2015)

Se questo testo valesse anche oggi un utente non avrebbe motivo di prendere in considerazione

  • link rossi (a meno di non essere in grado di portare una pagina dal niente a SAL 75%)
  • pagina al 25% (a meno che non sia in grado di saltare il passaggio del SAL 50%)

In pratica

  • se estendiamo la regola rispetto a quanto scritto sopra includendo i due casi scritti qui sopra andiamo ad avvantaggiare gli utenti esperti su quelli inesperti, oppure andiamo ad incoraggiare gli utenti inesperti a porre pagine direttamente al 75% senza badare alla formattazione (è accaduto, lo sappiamo).
  • Se manteniamo il testo come l'anno scorso è opportuno limitare a un minimo minimo o meglio ad escludere gli indici con link rossi (ad es. questo) o con stragrande maggioranza di pagina al 25% (ad es. le novelle di Bandello).

Insomma, manteniamo o cambiamo? - εΔω 08:34, 21 nov 2016 (CET)[rispondi]

Per me il testo sopra può essere cambiato autorizzando anche il passaggio 25% > 75%, dato che tendenzialmente ci siamo adeguati alla convenzione internazionale di avere il 50% come problematico.
Oppure, possiamo pensare di dare 1(2?) punti per chi mette un testo da link rosso al 50%: dico da link rosso invece che dal 25% perchè spesso i nostri 25% sono testi completi (se l'OCR è decente è spesso così) ma non formattati nè controllati. Sono aperto a vari cambi e idee, personalmente. Aubrey (disc.) 14:39, 21 nov 2016 (CET)[rispondi]
Tutti i testi scelti per l'inzio della manifestazione saranno minimo al 25% (alcuni devono essere ancora ripassati). Concordo con Aubrey sulla modifica del regolamento: inserire 25-50% - 75% = formattazione! Xavier121 16:45, 21 nov 2016 (CET)[rispondi]
Di fatto spesso i 50% sono pagine problematiche difficili da formattare, un 25%-75% è spesso più facile di un 50%-75%. --Cruccone (disc.) 13:45, 22 nov 2016 (CET)[rispondi]
Certo, ma ad esempio ho trovato casi come questo in cui una pagina è considerata riletta e controllata anche se priva di parte del testo.
Insomma, non mi sento di generalizzare questo processo senza almeno un assaggio intermedi di formattazione. εΔω 15:25, 22 nov 2016 (CET)[rispondi]
@OrbiliusMagister, Aubrey Allora dividiamo la formattazione? 25%-50% = 2pt, 50%-75% = 3pt? --Xavier121 18:28, 22 nov 2016 (CET)[rispondi]
Per me va bene. Ribadisco il mio rimpianto per l'esiguo numero di utenti attivi nella nostra comunità; stringiamci a coorte per controllare i passaggi di formattazione. εΔω 19:17, 22 nov 2016 (CET)[rispondi]
Mi viene il dubbio che non possiamo cambiare questa cosa così facilmente, bisogna vedere se il "contatore" di punti potrebbe gestire facilmente questa modifica. @Alex brollo, Candalua, e tutti gli altri che sanno programmare: la parte dello script che conta è questa. Secondo voi può essere modificata? Aubrey (disc.) 11:46, 23 nov 2016 (CET)[rispondi]

Concorso collaterale? modifica

La Collaborazioni/Biblioteca universitaria Alessandrina aveva proposto un concorso parallelo al Compleanno di Wikisource. @EusebiaP, @Aubrey, sono previste iniziative simili quest'anno?

da parte mia, no. Aubrey (disc.) 10:07, 20 nov 2016 (CET)[rispondi]
Sarebbe bello, ma non ce la facciamo in tempo questa volta. Troppe cose che si accavallano. --Sannita - L'admin (a piede) libero 12:35, 21 nov 2016 (CET)[rispondi]
Scusate, non avevo visto questo messaggio. In ogni caso avrei fatto fatica a seguire questa cosa come biblioteca, anche se abbiamo il nostro manoscritto in rilettura; organizzare un concorso parallelo sarebbe stato impossibile per me in questo particolare periodo --EusebiaP (disc.) 09:59, 28 nov 2016 (CET)[rispondi]
Nessun problema. Piuttosto, notavo una certa attività attorno a due libri non inclusi nel concorso, precisamente questo e questo: ottimo! Ne sai qualcosa? - εΔω 15:41, 28 nov 2016 (CET)[rispondi]
Per Il Trentino ne sa qualcosa @Jaqen, per l'Artusi non so! --EusebiaP (disc.) 20:58, 28 nov 2016 (CET)[rispondi]
Sul Trentino ho fatto lavorare io i partecipanti a questo corso! --Jaqen (disc.) 10:15, 29 nov 2016 (CET)[rispondi]

Partenza modifica

Ragazzi, si parte stasera. Manca ancora:

  • l'elenco dei libri, da mettere qui.   Fatto
  • anticipare ai wikipediani di preparare il banner. (ci riesci tu, @Sannita?)
  • decidere il discorso del sal 50% o meno, come da discussione qui sopra. Ricordandosi che bisognerà cambiare lo script per contare bene (cosa che qualcuno deve fare, io non so se sono in grado).   Fatto prima parte (Script?)
  • altre cose che non mi ricordo   Fatto  :) --Xavier

121 12:15, 23 nov 2016 (CET)[rispondi]

modifica

Ho chiesto a MLOL di partecipare mettendo a disposizione 3 abbonamenti annuali di MLOL Plus, da 10 euro l'uno. POtrebbe essere, se a voi va bene, un premio in più per i 3 vincitori: l'abbonamente permette di comprare e prendere in prestito Ebook. Se a voi va bene, proseguo. Aubrey (disc.) 12:23, 23 nov 2016 (CET)[rispondi]

  Fatto inserisco nel concorso. - εΔω 16:21, 24 nov 2016 (CET)[rispondi]

Suggerimenti modifica

Tanto per rimarcare la differenza fra la nostra e la altrui competitività propongo di aggiungere in un angolo del regolamento la seguente raccomandazione: "Nel corso della competizione suggerire è permesso, anzi: è fortemente raccomandato" --Alex brollo (disc.) 16:36, 25 nov 2016 (CET)[rispondi]

Piccolo principe modifica

Oggi ho fatto due caricamenti importanti: Il piccolo principe e Lo strano caso del dottor Jekyll e del signor Hyde. Sono due "donazioni" da parte di un traduttore: soprattutto per il primo, gradirei se qualcuno potesse rivederlo e magari ingrandire le immagini, se il caso, e vedere se ci sono errori. Penso e spero che saranno due testi molto letti. Aubrey (disc.) 19:15, 20 nov 2016 (CET)[rispondi]

Ho aspettato qualche giorno, strano che nessuno abbia ancora messo mano al Piccolo principe, uno di quei testi che potrebbero essere letti e riletti ogni giorno prima di andare a dormire, molto più utile di qualsiasi preghiera o mantra. @Aubrey Nel secondo capitolo inizia ad esserci scarsa accuratezza nel testo e non da parte tua, ma originariamente presente nell'ebook da cui lo hai tratto. Lo rileggo con piacere, i disegni li lascerei così. --Naamar (disc.) 12:44, 26 nov 2016 (CET)[rispondi]
@Naamar Il testo è in CC-BY-SA, e se la comunità è d'accordo, trattandosi di una traduzione in un certo senso "ufficiosa", per me si può anche correggere qui e là. Di fatto la Wikisource italiana, per decisione nostra, non accetta traduzioni fatte direttamente da noi, ma personalmente non ho grossi ostacoli ideologici a questo. Aubrey (disc.) 14:21, 26 nov 2016 (CET)[rispondi]
Correggere spazi, apostrofi e altri errori di battitura mi sembra normale pratica su Wikisource, non c'è testo a fronte per cui non uso {{Ec}}. Se invece il traduttore traduce "tout le monde" come "tutto il mondo", ovvio che non lo correggo. Comunque hai ragione, vista "l'ufficiosità" della traduzione in alcuni casi potrebbe essere difficile sapere come comportarsi, ma in questi casi si può sempre decidere di lasciare il testo com'è. --Naamar (disc.) 14:49, 26 nov 2016 (CET)[rispondi]
I dubbi peirciani li risolvo da me, ma se ho un dubbio cartesiano, un errore interpretabile come refuso ma irrisolvibile perché aperto a diverse possibilità per cui l'intervento inciderebbe di fatto su scelte che spettano al traduttore, che si fa?
«È il mondo intero che non ha più amico.» amici o un amico --Naamar (disc.) 17:35, 26 nov 2016 (CET)[rispondi]
In quel caso, se riuscissi a trovare la fonte originale puoi secondo me decidere autonomamente. Non ha senso scomodare il traduttore per ogni errore... Aubrey (disc.) 17:54, 26 nov 2016 (CET)[rispondi]
Per cui, come dicevo sopra, posso decidere autonomamente di lasciare il cartesiano refuso com'è, il SAL è comunque al 75% quindi Wikisource non attesta la migliore qualità di alcunché, e il traduttore si scomoderà se avrà interesse a farlo. --Naamar (disc.) 19:34, 26 nov 2016 (CET)[rispondi]
Sono arrivata al capitolo nove. Un errore di traduzione, o svista o come volete chiamarlo, presente nella "storica" edizione Bompiani, se quel che si trova in rete corrisponde ad essa, è stato riproposto dal nostro donatore: in fondo al capitolo il racconto improvvisamente passa dalla terza alla prima persona. Onestamente a me, come si suol dire, cascano le braccia. Se avrò voglia di rileggere il Piccolo principe lo rileggerò in lingua originale come ho fatto con Candide e con Walden, entrambi su Wikisource. Lo scrivo perché penso che simili scelte potrebbero non essere minoritarie, "statisticamente", per le lingue più diffuse. --Naamar (disc.) 22:07, 1 dic 2016 (CET)[rispondi]
Aggiungo: li ho collegati al loro item su Wikidata, in modo che possano essere direttamente richiamati dal template interprogetto su Wikipedia, che è appunto collegato con Wikidata. Questo vul dire che se noi colleghiamo in Wikidata i nostri testi, automaticamente vanno su WIkipedia (ovviamente, se il template Interprogetto è presente, cosa che però al momento è quasi sicura). Insomma, un altro motivo per spingerci, dopo il compleanno, a riprendere in mano il discorso. Aubrey (disc.) 19:44, 20 nov 2016 (CET)[rispondi]
(ovviamente collegati "male", cioè all'item unico "opera", non a quello edizione che andrebbe creato. Per questo motivo, andrebbe cambiato il template interprogetto su Wikipedia. A suo tempo. Aubrey (disc.) 10:14, 21 nov 2016 (CET)[rispondi]

16:33, 21 nov 2016 (CET)

Una grossa sfida.... modifica

Indice:Grammatica Sanscrita - Giovanni Flechia.djvu Quando l'ho visto ho strabuzzato gli occhi.... poi ho visto chi ha caricato l'indice: è il nostro collega sourciano @Bodhisattwa di bn.source, che avete conosciuto all'ultimo raduno.

Che dire? Qualcosa farò, mi sembra dovuto; non ho speranze eccessive che l'opera possa essere portata a termine.... sarebbe un miracolo.... ma chissà. Perlomeno, se Bodhisattwa la seguirà un poco, avrà la possibilità di vedere meglio it.source da dentro; e noi avremo la possibilità preziosa di sentire un punto di vista nuovo e stimolante. --Alex brollo (disc.) 22:02, 21 nov 2016 (CET)[rispondi]

Andrebbe rifatta l'elaborazione del djvu: diverse pagine in sanscrito sgranano, si fatica a comprendere i segni! Questa cosa affascina anche me, se vuoi posso dare il mio contributo su file, immagini, indice e sommario. --Xavier121 23:03, 21 nov 2016 (CET)[rispondi]
Ormai siamo "sincronizzati", Xavier, già fatto.... purtroppo in questo caso si sarebbe dovuto scansionare a maggior risoluzione e soprattutto senza applicare la compressione jpg alle scansioni; tuttavia ripartendo dai file pdf di Ruggeri la grafica migliora abbastanza. Ricaricherò. PS: per i testi indiani, MediaWiki ha organizzato un qualche tool per l'OCR da Google. Vediamo se @Bodhisattwa ci stupisce con effetti speciali :-) --Alex brollo (disc.) 08:38, 22 nov 2016 (CET)[rispondi]
NOn posso promettere granché, ma finché si tratta di italiano e greco posso provare. In effetti il sanscrito, lingua misteriosa che costituisce il trattino d'unione nella parola indo-europeo titilla l'attenzione da anni. - εΔω 08:55, 22 nov 2016 (CET)[rispondi]
Djvu sistemato (rifatto ex novo alla miglior qualità grafica possibile dai pdf OPAL), adesso si ragiona. Ci sono contributi di @Bodhisattwa nelle prime pagine trascritte: questo significa che non ci abbandonerà al nostro destino. (Thanks Bodhisattwa!). Abbiamo l'occasione di imparare moltissimo, tutti; e io di creare qualche tool per permetterci di scrivere in sanscrito senza impazzire.... Ipotizzo un tool che ci permetta di scrivere in sanscrito translitterato in caratteri latini, e che traduca in caratteri sanscriti. Una seconda alternativa sarebbe quella di creare/di recuperare una tastiera virtuale sanscrita; le due soluzioni non si escludono a vicenda. --Alex brollo (disc.) 08:21, 23 nov 2016 (CET)[rispondi]
Intanto devo modificare diacrici.... anche i diacritici correlati ai caratteri "nostrani" vedo che richiedono un po' di olio di gomito. Alex brollo (disc.) 12:23, 23 nov 2016 (CET)[rispondi]

Qualcuno mi incolla bene due PDF per ottenere un DjVu? modifica

Salve! Anche se non so bene quando, vorrei trascrivere su WS il seguente libro reperibile su Archive.org: [21]. E' tratto da Google Books, e come molti suoi compagni soffre di pagine mancanti ed altre ripetute. La sorpresa è che qualcun altro ha scansionato alcune pagine del libro, incluse quelle mancanti su Google Books: [22]. Qualcuno potrebbe quindi effettuare lo sporco lavoro di produrre un DjVu impacchettato come segue?

  • le prime pagine dovranno provenire dal secondo link, fino a quella che riporta una dedica a grandi lettere a "GIO. CAMILLO BILOTTA" (è meglio prenderle tutte da lì, perché anche fra quelle presenti nel primo link molte sono tagliate ai lati)
  • le pagine da quella successiva (che inizia con "suoi gloriosi principij") fino a pag. 65 dovranno essere tratte dal primo link
  • purtroppo il primo link, dopo pag. 65, ripete di nuovo tutte le pagine da 56 a 65 che andranno, quindi, rimosse
  • infine si potrà proseguire con le pagine dal primo link, fino all'ultima.

Sono sicuro che incontrerò la vostra disponibilità, quindi grazie anticipate!--Decan (disc.) 22:16, 21 nov 2016 (CET)[rispondi]

Scaricati i due pdf (quello originale di Google, e quello di Altavilla historia), posso farlo, ma il file Google (e il file IA che da quello deriva) è bruttino assai.... :-( --Alex brollo (disc.) 22:46, 21 nov 2016 (CET)[rispondi]
L'alternativa è quella di comprare il libro da qualche casa editrice farlocca che lo ha scansito e vende le ristampe fatte male a peso d'oro. Io mi accontenterei così.--Decan (disc.) 23:20, 21 nov 2016 (CET)[rispondi]
@Decan Djvu "ristrutturato" pronto, ottenuto con FineReader dai pdf Altavilla e dalle immagini _jp2 di IA. Se mi mandi una tua mail, ti "invito" nella cartella dropbox dove sta; ma se hai ancora un po' di pazienza, prima di caricarlo vorrei vedere quanto può essere sistemato l'OCR con un'applicazione in fase di test. Il nome dell'Indice potrebbe essere, abbreviando, Indice:Piperno - Noce di Benevento.djvu: ti va? --Alex brollo (disc.) 08:23, 22 nov 2016 (CET)[rispondi]
@Decan tutto tuo: Indice:Piperno - Della superstitiosa noce di Benevento.djvu Alex brollo (disc.) 00:12, 26 nov 2016 (CET)[rispondi]
@Alex brollo Grazie!! Ci lavoro appena possibile!--Decan (disc.) 10:13, 26 nov 2016 (CET)[rispondi]
Dimenticavo: il libro include un capitolo in latino, che poi in realtà era la versione originaria del libro che poi fu ampliata. Andrà mica trascritto su la.wikisource? E se lo faccio, dopo come "tengo insieme" le due parti?--Decan (disc.) 13:14, 26 nov 2016 (CET)[rispondi]
@Decan In teoria andrebbe messo su la.source, in pratica la.source è quasi abbandonato.... tanto vale IMHO trascriverlo direttamente qui. E' uno dei tanti motivi che mi fanno ritenere che la divisione di wikisource in progetti linguistici diversii, che stanno diventando sempre più diversi, sia stata una pessima idea.... ma è stata discussa e confermata "democraticamente", adesso non si può più rimediare. Alex brollo (disc.) 16:32, 27 nov 2016 (CET)[rispondi]
@Alex brollo Capisco :( Grazie!--Decan (disc.) 16:35, 27 nov 2016 (CET)[rispondi]
In realtà, si potrebbe ridiscutere... Ma gestire un progetto internazionale è molto diverso che gestirne uno da soli. Tecnologicamente e logicamente, avete ragione, è molto più semplice e lineare. Ma a livello di comunità, bisognerebbe parlare in inglese, parlare con comunità diverse linguisticamente e cultiralmente... Inoltre, io proporrei inizialmente una Wikisource unica per "linguaggi con alfabeto latino e LTR (left to right), anche solo. Il multilinguismo vero, che dà pari dignità ad ogni lingua, è un incubo a livello software. Aubrey (disc.) 17:19, 27 nov 2016 (CET)[rispondi]

──────────────────────────────────────────────────────────────────────────────────────────────────── @Decan, Aubrey Dai, allarghiamoci un pochino: facciamo "linguaggi indoeuropei" così ci sta dentro anche il gruppo indiano :-). Comunque la diaspora non è finita: ho collaborato a lungo con la nascente wikisource napoletana, ospitata nell'incubatore zoppicante mul.source, ma l'ho fatto con tristezza.... e venendone fuori con il fermissimo convincimento che è stata una cattiva idea. Ok: alfabeto latino e LTR mi andrebbe bene. Ma parlarne temo sia tempo perso. Forse la soluzione sarà la transclusione transprogetto; se fatta bene dovrebbe permettere di condividere anche i template. Oppure... semplicemente montare la proofread extension anche su Commons, permettendo (non obbligando) di lavorare sui djvu/pdf direttamente là... perchè no? Alex brollo (disc.) 17:36, 27 nov 2016 (CET)[rispondi]

Secondo voi la Bibliografia a fine testo è parte integrante dell'opera o possiamo considerarla SAL0? Nel primo caso l'opera potrebbe considerarsi ultimata altrimenti possiamo fare in rollback della pagina indice (dove avevo considerato in indice anche la Bibliografia). --Stefano mariucci (disc.) 11:50, 22 nov 2016 (CET)[rispondi]

Aimè, fa certamente parte dell'opera. I dubbi riguardano parti di libri che costituiscono cataloghi/pubblicità di altre opere dello stesso editore; ma questa è la bibliografia riguardante l'opera stessa. --Alex brollo (disc.) 14:09, 22 nov 2016 (CET)[rispondi]
L'ho scoperto scrivendo la mia tesi di laurea: quello che conta di più e che risparmia un sacco di lavoro in archivio a chi effettui ricerca è la bibliografia di coloro che la ricerca l'hanno compiuta prima; in pratica in una tesi di laurea spesso la parte che ha più probabilità di essere letta da qualcuno veramente interessato è proprio la bibliografia. Questo spiega la mia modifica all'indice. - εΔω 14:47, 22 nov 2016 (CET)[rispondi]
Ho provveduto a ripristinare le pagine portate a SAL0 e di conseguenza l'Indice ed il Sommario. Non mi resta altro che digitalizzare l'interessantissimo elenco della bibliografia. Grazie a tutti per la bella notizia. --Stefano mariucci (disc.) 20:16, 22 nov 2016 (CET)[rispondi]

Problema font modifica

Nel testo Indice:Grammatica Sanscrita - Giovanni Flechia.djvu si ripropone un problema già emerso nei testi ladini; alcuni diacritici non "vengono bene" con il font di default, georgia, esempio: ǵ viene visualizzato correttamente con il sans serif qui, ma appare come ǵ in nsPagina. Non ricordo se al proposito avevamo preso una qualche decisione. Cosa facciamo?

PS: ho aggiornato diacritici, inserendo anche il diacritico per questo effetto: m̐. In monospace (box di edit) si vede benissimo, con il sans serif molto meno bene. --Alex brollo (disc.) 09:11, 24 nov 2016 (CET)[rispondi]

Pausa dal compleanno modifica

Nelle pause dei lavori per il compleanno di wikisource vorrei soddisfare alcune curiosità sulle lingue indiane e sugli script indiani, approfittando del fatto che fra i nostri contributori c'è Bodhisattwa.

Scrivo in inglese (maccheronico) perchè le domande sono rivolte a lui.

@Bodhisattwa Some questions for you about indic languages and scripts, I guess that it.source community, with few if any exception, doesn't know anything about.

  • I found that indic scripts differ a lot, even if there's a common structure. Do indic languages differ as differ their scripts?
  • How many indic readers understand different indic scripts/languages?
  • Which is the most used indic->roman transliteration standard in indic region?
  • How many indic readers can use (read(write) comfortably roman transliteration of their language?

--Alex brollo (disc.) 09:38, 25 nov 2016 (CET)[rispondi]

@Alex brollo
  • Yes, Indic languages differ a lot. South Indian languages like Tamil, Telugu, Malayalam, Kannada etc. are completely different from each other and from North Indian languages like Hindi, Punjabi, Bengali etc. Although the north Indian languages are different from each other but also have a lot of similarities.
  • Almost all Indians understand at least 3 languages, i.e. his/her mother language, Hindi and English, although very few people from South India understands Hindi.
  • I dont know of any such standard transliteration process (Indic>Roman), although there are few from roman>Devanagari standards, which we have already discussed in Bengali Wikisource. For other Indic languages, I have to check.
  • I think, almost all Indic netizens can write/read Roman transliteration of their languages. This is because, for a long time, there were no Indic keyboards for both mobile/desktop users and people had no other option but to use Roman scripts, even nowadays, a lot of people were not aware of Indic keyboards and still use Roman scripts. -- Bodhisattwa (disc.) 07:38, 26 nov 2016 (CET)[rispondi]
@Bodhisattwa Thanks! Alex brollo (disc.) 16:28, 27 nov 2016 (CET)[rispondi]

Documento interprogetto per WMI modifica

Bentrovati. @Mizardellorsa ha segnalato su Wikiversità che il 10 dicembre a Trento interverrà all'assemblea di Wikimedia Italia, che discuterà, tra l'altro, del Piano strategico pluriennale. Crediamo che tutti i progetti debbano poter far pervenire le loro idee e richieste a WMI; per questo stiamo elaborando una bozza di documento congiunto (discussione), che comprenda anche comunicazioni distinte da parte dei singoli progetti. La vostra partecipazione ci farebbe molto piacere. Visti i tempi molto stretti, vi chiederei di informare quegli utenti che potessero essere interessati. --pegasovagante (la mi dica) 13:01, 25 nov 2016 (CET)[rispondi]

Stressando OCRfix.py modifica

Ho raccolto l'invito a sistemare i file sorgente di Indice:Piperno - Della superstitiosa noce di Benevento.djvu e ne ho approfittato per stressare al massimo OCRfix.py. Il risultato è così così; siamo sempre su un OCR "al limite", con moltissime correzioni da fare; tuttavia il risultato, se date un'occhiata, ha qualcosa di interessante: ad esempio la scelta del "proprietario" del file è stata quella di espandere alcune abbreviature, di convertire le s lunghe (rese invariabilmente come f dall'OCR) in s normali, e di cponvertire gli & in et, ed in effetti un buon numero di caratteri è stato sistemato. Aspetto il vostro parere, ma voi non aspettatevi "'o miracolo". --Alex brollo bis (disc.) 00:03, 26 nov 2016 (CET)[rispondi]

Nome con una spaziatura diversa dal resto del testo modifica

Questa pagina https://it.wikisource.org/wiki/Pagina:Cuoco_-_Saggio_storico_sulla_rivoluzione_napoletana_del_1799,_Laterza,_1913.djvu/218 contiene un nome con una spaziatura diversa dal resto del testo, esiste un template per questo caso? Saluti --Utoutouto (disc.) 12:45, 27 nov 2016 (CET)[rispondi]

  Fatto usare {{Type|f=em|l=px|w=em|}} --Xavier121 15:08, 27 nov 2016 (CET)[rispondi]

Liberatoria eredi Fochi modifica

Vi informo che in settimana @Ruthven ha rapidamente approvato la richiesta OTRS degli eredi di Franco Fochi. Prima ancora mesi fa @Laurentius aveva manifestato che io ricordi (e mi smentisca altrimenti) silenzio assenso anche lui sul testo che vi avevo sviluppato a cavallo fra primavera e estate e riportato in Wikisource:Bar/Archivio/2016.08#Liberatoria_per_wikisource. Intendo che a Lau gli avevo scritto in merito ma non aveva contestato nulla di specifico. Trattandosi degli operatori OTRS più attivo il primo e fra i più anziani il secondo penso si possa confermare che il testo da me proposto per eredi di autore italiano sia abbastanza solido.

Che dite lo lasciamo bene in qualche linea guida invece che in un archivio del bar? Come ho detto in passato, la citazione di opere da eredi è uno dei modi che abbiamo per svecchiare una parte del nostro fondo bibliotecario, l'altro è di fatto la cessione di viventi. Ci sono migliaia di testi di accademici ben fatti ma privi di valore commerciale che sono cedibile, è una cosa che noi possiamo fare con maggiore efficienza di altri archivi.

Fra l'altro ci sono quanti altri casi in passato? Mi piacerebbe scriverne un sunto. Ne vedrebbe un articolo carino per promuovere wikisource.

Venendo alla ciccia, penso che durante le vacanze forse ce la faccia a incontrare Fochi e decidere quale dei tre libri iniziare a scansionare. Avrò molto da chiedere, mi sa che punterò a @Alex brollo per capirci qualcosa, e non avendo uno scanner agevole in Cina in ufficio mi sa che non potrò fare tutto il lavoro prima della mia partenza. Insomma potrebbe volerci qualche mese, ma prometto che lo faccio. Lo sapete sono su dieci piattaforme diverse, per forza di cosa punto al lungo periodo.

I testi sono:

  • "Piccoli scrittori", ultima edizione nel 1963 da parte delle Edizioni Scolastiche Mondadori.
  • "Pisa e il suo verde piano", ultima edizione nel 1961 da parte della SEI.
  • "Pedalare e vedere", ultima edizione nel 1958 da parte del Centro Turistico Giovanile.

Hanno poi tolto il quarto che inizialmente volevano cedere, "lingua in rivoluzione" che forse era il più pregevole e non lo dico con sarcasmo, anzi buon per loro se magari riusciranno a dargli una seconda vita editoriale.

Io credo di partire probabilmente da quello più breve o meno sfasciato, ma se avete altre indicazioni, per me va bene tutto. Non ho ancora l'originale di nessuno in mano, per ovvi motivi essendo in Cina. "Piccoli scrittori", se dovessi sceglierne uno a livello tematico, potrebbe essere interessante anche per wikiversity, e quindi un po' mi tenta.--Alexmar983 (disc.) 18:05, 27 nov 2016 (CET)[rispondi]

@Alexmar983 Nel caso di opere relativamente recenti, "liberate" ma non nate digitali, è probabile che giacciano parecchi esemplari che non hanno una prospettiva di utilizzo se non quella del macero. In questi casi (e solo in questi casi) la scansione più efficiente è la cosiddetta "scansione distruttiva": un taglio netto al dorso, e diventano pagine singole che possono essere passate in blocco a una fotocopiatrice digitale chiedendo i file (tiff, 300dpi) invece che le stampe. Ovvio che su incunaboli non lo farei :-). Facci un pensiero, se intendi sviluppare questo filone. Alex brollo (disc.) 18:30, 27 nov 2016 (CET)[rispondi]
interessante. Non so se i Fochi abbiano uno scatolone di invenduti a casa loro, non credo, ma se capitasse in futuro lo posso tenere a mente. Si potrebbe scrivere anche questo in una scheda di aiuto qui su ws. Anche se certo è ancora più comodo raccattare cosa è già scansionato, me ne rendo conto che siamo ben lungi da aver finito quel filone.--Alexmar983 (disc.) 18:49, 27 nov 2016 (CET)[rispondi]