Apri il menu principale

Wikisource:Bar/Archivio/2006.10

Opere letterarie senza fonte - Riportiamo la legalità :o)Modifica

Torredibabele sta continuando l'elencazione delle opere letterarie senza fonte nella pagina Utente:Torredibabele/Sandbox Wikisource:Fonti_mancanti. Per quel che riguarda le opere inserite da IP, per i quali è impossibile contattare il contributore, credo sia arrivato il momento di prendere una decisione netta che ci riporti nella legalità. Non essendo indicata la fonte, ci è impossibile procedere nel percorso della qualità e ci troviamo ad avere opere ferme al 25%.

Per questo motivo invito gli interessati a ricercare nei Siti autorevoli i testi in questione così da cancellare le versioni attuali e sostituirle con quelle trovate. La cancellazione, anche se radicale è un procedimento importante per ripartire con un testo nuovo e corretto.

Se concordate possiamo procedere. -- iPorkscrivimi 07:26, 1 ott 2006 (UTC)

Aggiornamento: ho creato il template {{Da cancellare per mancanza di fonte}} così possiamo segnalare i testi sui quali effettuare in tempi brevi una ricerca ed in caso di mancanza di riscontri, cancellarli. Ho pensato ad un periodo di controllo di 7 giorni. Naturalmente discutiamone e via con le modifiche. -- iPorkscrivimi 17:09, 1 ott 2006 (UTC)
Concordo completamente. Se anche gli altri sono daccordo, posso iniziare io ad inserire {{Da cancellare per mancanza di fonte}} e/o tentare di trovare la fonte per i testi di anonimi e senza fonte... --Qualc1 18:04, 1 ott 2006 (UTC)
Ho creato una pagina apposita per la lista su Wikisource:Fonti_mancanti. Torredibabele 07:38, 5 ott 2006 (UTC)

https://books.google.com/Modifica

Il sito https://books.google.com/ può essere considerato come fonte attendibile, visto che non fa altro che presentare pagine originali scannerizzate? Molte opere non sono protette da copyright (per la precisione, generalmente sono quelle trovate con ricerca "full view"). Ho appena visto che esiste una versione in italiano su https://books.google.it ; il grande vantaggio che deriverebbe dal servirsi di google è che non ci sarebbe bisogno, per effettuare una rilettura, di cercare una fonte cartacea, in quanto i file di google sono scannerizzazioni della fonte cartacea stessa. Torredibabele 17:06, 1 ott 2006 (UTC)

Direi proprio di si con l'attenzione a cercare solo tra i libri in visione integrale ricordandoci sempre del diritto d'autore. -- iPorkscrivimi 17:10, 1 ott 2006 (UTC)
  • +1 Colgo l'occasione per inserire il sito tra i siti autorevoli se già non c'è

Voci correlate --> Altri progettiModifica

Per omologarci allo standard di Wikipedia potremmo modificare le sezioni ===== Voci correlate ===== in ===== Altri progetti ===== quando è presente il link verso Wikipedia. La logica è quella di differenziare i collegamenti interni (ad altri testi di Source) da quelli esterni (verso appunto gli altri progetti).

Detto questo mi viene un pensiero: e se invece di Voci correlate, quando presentiamo link verso altri testi, non scrivessimo Testi correlati? A naso mi pare più corretto. Cosa ne dite? -- iPorkscrivimi 10:07, 3 ott 2006 (UTC)

Testi commentatiModifica

Sul consiglio del Magister ho fatto una proposta qui. -- PietroDn 16:36, 3 ott 2006 (UTC)

Eh eh! Provate a cliccare sui link qui! -- PietroDn 15:54, 8 ott 2006 (UTC)

Freccette scomparseModifica

Da qualche tempo non visualizzo più le freccette vicino agli interwiki.

Succede anche a voi o è un mio personale problema di visualizzazione?

Grazie. --Accurimbono 17:30, 3 ott 2006 (UTC)

È un problema noto. Dipende molto probabilmente dal programma usato che dovrà essere aggiornato presto. -- iPorkscrivimi 20:11, 3 ott 2006 (UTC)
Grazie iPork! Sei informato e gentile come sempre. Ciao, --Accurimbono 07:43, 4 ott 2006 (UTC)
Problema risolto, almeno credo :o) Vi ricordo di svuotare la cache del browser. -- iPorkscrivimi 07:36, 10 ott 2006 (UTC)
Grazie, ho modificato il Monobook.js anche su la.source. Ciao, --Accurimbono 07:41, 10 ott 2006 (UTC)

PropostaModifica

Cari amici, vorrei proporre un piccolo progetto, che penso potrebbe apportare un miglioramento alla nostra già prestigiosa Wikisource, e potrebbe già usufruire della scoperta di books.google.it. Perchè non inseriamo, come pagina correlata ad un opera, una sezione che contenga il testo scannerizzato? Per testi brevi, la fatica sarebbe minima, giusto l'upload dell'immagine, e per i testi lunghi si valuterebbe di volta in volta se ne vale la pensa. Ciò permetterebbe due significativi miglioramenti:

  • Rilettura: si avrebbe il testo cartaceo disponibile per una rilettura, quindi diretto passaggio a SAL 101%.
    • Pro
      • velocizza il passaggio da SAL 75% a SAL 101%, saltando l'ibrido 100%.
    • Contro
  • Inserimento: se vi fosse un deposito comune in cui inserire scannerizzazioni e/o foto, si avrebbe perennemente materiale pronto per i formattatori più volenterosi.
    • Pro
      • Permette all'utente volenteroso di applicarsi su un testo, senza che esso perda tempo a cercare il testo da formattare. Non tutti conoscono i siti giusti nè magari hanno preferenze (non che ci siano capitati molti casi del genere, ma cerco di pensare al futuro). Inoltre non tutti possiedono adeguati programmi OCR (come il sottoscritto), o anche lo scanner. In questa maniera si verrebbe incontro a queste esigenze.
    • Contro
      • Si potrebbe avere un aumento sconsiderato di files, rubando memoria nei server.

Queste le prime cose che mi vengono in mente, aggiungete, modificate e dite la vostra. La mia idea dovrebbe essere chiara, e spero anche i miglioramenti che potrebbe apportare. Se non ci sono problemi legali,ovviamente... Fatevi sentire. (firmo adesso :)) Aubrey McFato 12:12, 4 ott 2006 (UTC)

Una ottima idea che già circolava nell'aria e che tu hai giustamente messo nero su bianco :o) Approfondiamo il discorso del copyright e per me possiamo iniziare con un testo così da definre insieme subito le regole per questa iniziativa. Ad esempio dovremmo dare degli standard tecnici (risoluzione, dimensioni, etc.) e formali (come presentare le immagini, ad esempio con il comando che crea una galleria o altro). -- iPorkscrivimi 10:03, 4 ott 2006 (UTC)
Dal punto di vista legale nessun problema. Se il testo è di pubblico dominio potete scannerizzare quanto vi pare idem se è un documento non elegibile nel copyright (vedi testi di natura normativa). In entrambi i casi state attenti a non mantenere la stessa formattazione della fonte alla quale avete attinto, perchè il "come si propone un testo", può essere soggetto a copyright.--Senpaiottolo 10:19, 4 ott 2006 (UTC)

Per passare dalle parole alla pratica invito chi dispone della versione scannerizzata di qualche testo ad inviarmela via posta elettronica così faccio alcune prove. Inoltre dire che potremmo discuterne in questa pagina per definire come procedere. -- iPorkscrivimi 06:35, 5 ott 2006 (UTC)

Anche a me sembra un ottima idea inserire le immagini dei testi scannerizzati; Volevo anche invitarvi a fare un salto sulla wikisource in francese per vedere un esempio di come altre source utilizzano le immagini (visto che i Francesi sono quelli che ne hanno di più, ben 21493) --Qualc1 07:10, 5 ott 2006 (UTC)

Orbilius è vivo e lotta con voiModifica

Cari amici,

come dice il vecchio adagio, La fortuna è cieca, ma la sfiga ci vede benissimo... e ti segue!

Da poco guarito dall'ulcera corneale mi trovai con computer defunto, e con un MacBook Pro nuovo fiammante predisposto però solo per connessioni veloci. Sono pertanto in attesa dell'attivazione dell'ADSL e sto scrivendo dal posto di lavoro dove le mie incursioni in rete non possono essere troppo smaccatamente "Wiki"... aggiungo infine che dopo la precedente batosta all'occhio ho diminuito l'uso del PC anche per ragioni spero comprensibili. Ma il cuore mi porta a leggere di straforo le ultime modifiche di Source, e a gioire dell'evoluzione che stiamo intraprendendo. Al raduno di Verona ho perorato la causa del nostro progetto con grande apprezzamento (vedasi post di Pietrodn poco sopra). Appoggio totalmente la ripulitura del sito. Appena possibile regolarizzerò Leopardi, Parini e i testi di cui possiedo fonti autorevoli. Offline sto invece approntando diverso materiale (galateo, Filocolo, e qualcos'altro). Infine mi dichiaro fautore fervido della scannerizzazione di libri antichi, vera chicca di questo progetto, che a mia volta sto preparando a partire da fotocopie di libri presi in prestito quest'estate: è mia intenzione disporre un "reparto" (portale, progetto o quant'altro) di classici latini e graci in traduzione italiana. Portate pazienza se non sono in attività online (e se in futuro non sarò pervasivo come ero precedentemente): sto arrivando. Vi leggo con affetto. - εΔω 08:31, 5 ott 2006 (UTC)

Gaudeamus igitur! Rimettiti presto, sia fisicamente che tecnicamente. Intanto ti teniamo caldo un bel po' di amato lavoro sporco ^____^ -- iPorkscrivimi 08:44, 5 ott 2006 (UTC)
Inboccallupo! Il lavoro off-line di scansione e trascrizione (ex novo) di libri antichi è a mio parere il più importante di tutti. Perchè dopo aver copincollato tutti gli e-text presenti sul web si dovrà fare opera di ricerca in biblioteca! A presto! --Accurimbono 10:02, 5 ott 2006 (UTC)
Mi accodo agli auguri, questo nuovo lavoro e spero che questo nuovo lavoro di scannerizzazione possa riposare i tuoi occhi ma permetterti lo stesso il tuo contributo fondamentale a Source ;) D'altronde penso che tu sia quello con le fonti migliori, giusto? A presto, torna che ci manchi. --Aubrey 10:20, 5 ott 2006 (UTC)
Bentornato! Mi aggiungo anch'io agli altri... rimettiti presto! Torredibabele 19:51, 5 ott 2006 (UTC)
E io che non sapevo nemmeno che tu avessi passato questo guaio! Sono imperdonabile. Rimettiti in fretta, frettissima.--84.222.1.128 15:33, 9 ott 2006 (UTC)
Ero io, mi sono dimenticata di fare il log in.--Paola 15:39, 9 ott 2006 (UTC)

Qualc1 amministratoreModifica

Gaudeamus igitur! Qualc1 è stato eletto amministratore. Buon lavoro sporco!!! ^__^ -- iPorkscrivimi 06:56, 10 ott 2006 (UTC)

Gaudeo sopratutto io :-))   Grazie mille a chi mi ha votato! Corro subito a lavorare.... --Qualc1 07:56, 10 ott 2006 (UTC)
Evviva!! Buon lavoro, che qua non manca mai e per fortuna procede alla grande! Cheppercaso hai voglia di Rime da formattare? --85.34.90.170 09:42, 10 ott 2006 (UTC) (indovinato?)

Testi in cancellazione per mancanza di fonteModifica

Avviso che i testi elencati qui hanno ancora una settimana di vita su Source. Se non troveremo versioni con fonte attendibili verranno cancellati, quindi mettiamoci sotto con il lavoro sporco :o) -- iPorkscrivimi 05:45, 11 ott 2006 (UTC)

Ho provato a cercare le fonti dei testi letterari, ma non ne ho trovate per nessuna di quelli rimasti in elenco; Qualcuno (Fabrizio Fiorita?) che si destreggia meglio tra i testi del Progetto Diritto può controllare quelli relativi a tale progetto? --Qualc1 09:30, 13 ott 2006 (UTC)
Per Parini, Leopardi, stilnovisti ed affini non ho problemi a trovare fonti affidabili, il problema è l'impossibilità di collegarmi da casa dove ho la fonte cartacea davanti allo schermo (grrr, che rabbia l'impotenza informatica). Comunque non mi fascio la testa più di tanto: i testi cancellati possono essere ripristinati e sistemati, ergo cancella pure lasciando il link rosso sulla pagina di segnalazione. Semmai ricordo che la cancellazione di una pagina non include automaticamente la cancellazione delle rispettive discussione (che qui su Source sono quasi sempre presenti con template vari), dunque ricordiamoci di non lasciare "pagine di discussione orfane" a seguito di cancellazioni. - εΔω

Logo wikisource localizzatoModifica

Salve, una domanda tecnica: un utente (Zanimum) ha caricato su la.source tre loghi localizzati (con la scritta latina Vicifons al posto dell'inglese Wikisource). Link ad uno dei loghi Qualcuno sa se è possibile (e se è opportuno) sostituire il logo con la versione localizzata, come fanno ad esempio i cinesi?

Grazie, Ciao, --Accurimbono 08:43, 13 ott 2006 (UTC)

Devi parlarne sul bar della Source mamma, ovvero qui. -- iPorkscrivimi 11:23, 13 ott 2006 (UTC)

Proposta di policyModifica

Situazione attuale:

Ci sono alcuni caratteri di punteggiatura interscambiabili e quasi equivalenti; attualmente non c'è una policy su quale forma usare. Ecco i caratteri in questione:
apostrofo ( ' ) ( )
lineetta ( Template:Unicode ) ( ) ( ) ( )
tratto d'unione ( - ) ( Template:Unicode )
punti di sospensione ( ) ( ... )
Quasi sempre sono usati ' per l'apostrofo, - per il tratto/lineetta, ... per i puntini di sospensione; solo in pochi testi sono usati gli altri. In teoria, non sempre i più usati su source sono i più corretti (Per esempio l'apostrofo che usiamo solitamente è quello scorretto, come potete vedere da pedia).

Proposta:

  • Per i testi da inserire, come vale per qualsiasi carattere, i "caratteri speciali" si lasciano uguali a quelli sulla fonte (così si è fatto fino ad ora nella maggioranza dei casi).
  • Per i testi già inseriti, in alcuni (es: Le avventure di Pinocchio, i sonetti di Cecco Angiolieri) sono stati sostituiti i "caratteri speciali" peggiori che erano sulla fonte, con il corrispondente migliore. Chi controlla un testo di questo tipo (es: lo stesso Le avventure di Pinocchio) deve considerare la sostituzione della punteggiatura come una modifica "illecita" dell'originale e ripristinare quella originale oppure accettarlo in quanto miglioramento, anche se rende la pagina diversa dalla fonte e diversale dalla maggior parte delle altre pagine su source?  Personalmente sostengo la prima opzione.
  • Nei due punti precedenti ho dato per sottointeso che non si voglia sostituire i caratteri più utilizzati-peggiori con i meno utilizzati-migliori: vorrebbe dire aggiustare ~17000 pagine

--Qualc1 09:29, 13 ott 2006 (UTC)

Sono di corsa e segnalo due cose:
  1. qualsiasi strada si decida, non temiamo le 17000 da sistemare perchè il nostro fine è fare il massimo e abbiamo i bot per questi lavori
  2. usando lo script che trovate sulla mia pagina utente è possibile avere il comando formatta che sostituisce i caratteri errati. Ora, una volta decisa una linea per source, possiamo usare quel comando modificandolo in base a ciò che vogliamo.
-- iPorkscrivimi 11:26, 13 ott 2006 (UTC)
Celerrime: nei testi sono possibilista (finora mi sono attenuto alla regola "Pediana" di accenti virgolette e trattini "ambidestri". Certo che nei titoli l'uso di segni non facilmente raggiungibili da tastiera (vedi mio intervento sulla pagina Autore:Francesco Dall'Ongaro) non è secondario, e a malincuore rimango alfiere dei simboli "ambidestri". --εΔω 14:40, 13 ott 2006 (UTC)
IMHO: io sono per la sostituzione dell'apostrofo con il carattere corretto ( ).
Si potrebbe fare un Festival dell __ apostrofo, ovviamente è un lavoraccio da smaltire con i BOT... visto il numero di pagine da controllare.
In fondo lo scopo di Wikisource è quello di dare delle fonti e queste dovrebbero essere le più corrette possibili, anche negli apostrofi.
Per quando riguarda Wikipedia invece è diverso, lì il problema è di editazione e l'ambiguità del carattere risulta ammissibile, invece su Wikisource un testo una volta inserito, corretto, rivisto, alla fine rimane stabile per "sempre" mentre un articolo di enciclopedia è per sua natura dinamico.
Inoltre vi faccio osservare che i francesi, che in fatto di caratteri speciali se ne intendono, o meglio hanno molto da fare, mi sembra utilizzino il carattere per l'apostrofo corretto (ad es: fr:Thomas d’Aquin).
Ciao, --Accurimbono 10:27, 14 ott 2006 (UTC)
Pensavo di lasciare le ~*mila pagine con l'apostrofo vecchio perché consideravo la sostituzione come da fare "a mano"; se è fattibile con un bot (cioè praticamente tutti i _'_ con trasformabili in __ senza il controllo umano) non sono minimamente un problema ~*mila pagine, e sarei daccordissimo anch'io con la sostituzione. Lo stesso vale per qualsiasi carattere... --Qualc1 09:44, 15 ott 2006 (UTC)
Di corsa ancora, purtroppo... non è facilissimo perché l'uso degli apostrofi doppi e tripli per definire corsivi e grassetti impedisce di agire "alla cieca". Semmai si può pensare a una serie di sostituzioni standard come "*l'*", "*n'*" e vedere se riusciamo a individuare tutte le ricorrenze dove porre gli apostrofi uncinati. Infine, anche tenendo conto della stabilità caratteristica di Source, fino al raggiungimento del 101% i testi sono comunque passibili di interventi anche pesanti (ho in mente le opere di Pascoli prive a tutt'oggi delle istruttivissime note linguistiche dell'autore sui termini dialettali o arcaici da lui utilizzati). Si dovrebbe agire dunque solo "a bocce ferme", cioè con testi completi e bloccati. Magari sono paranoico ma l'idea continua a non convincermi del tutto. Dal punto di vista filologico sono pienamente favorevole all'uniformazione degli accenti alla fonte da cui provengono (però ad esempio Liberliber mette tutti gli accenti come su Pedia incurante della fonte da cui trae i testi: come facciamo noi a sapere com'erano in origine?), ma mi vien da pensare che il rapporto fatica-guadagno non giustifichi l'operazione. Intanto continuo a rimuginarci... (riuscirò un giorno a collegarmi da casa?) Mi piacerebbe sentire qualche altro letterofilo... - εΔω 11:39, 17 ott 2006 (UTC)
Io delego la mia opinione a chi ne sa più di me, sia dal versante filologico che informatico. Non ho le competenze per capire se ne vale la pena. Mi stupisce che il buon Edo non sia molto d'accordo. Anch'io aspetto le opinioni dei letterofili. Aubrey McFato 16:59, 19 ott 2006 (UTC)
mmm... semplice schizofrenia tra l'informatico (standard-usabilità-scalabilità) e il filologo (rispetto assoluto per la fonte-adesione alle convenzioni italiane-controllo delle fonti). Il classico caso in cui se si vuole utilizzare un solo criterio si finisce per divenire dei "talebani" o dell'una o dell'altra anima... sono in un infinite loop da cui non esco. Credo che dovrò ricorrere a esempi, ma nelle condizioni in cui sono non posso.. εΔω 15:57, 20 ott 2006 (UTC)

Non per mettere troppa carne al fuoco, però...Modifica

  • Come procede la faccenda delle scannerizzazioni? (io sono il primo a non aver scannerizzato niente, premetto)
  • Perchè non istituire, anche da noi, i Festival della Qualità? Penso che le proposte potrebbero essere varie. Da quelli per Autore, per data (magari in concomitanza con Pedia, Quote, la.source), a quelli di puro lavoro sporco.
  • Nella Biblioteca Civica di Modena abbiamo postazioni online gratuite che permettono di navigare solo in un numero selezionato di siti (mostre, siti utili, ecc.); oggi ho chiacchierato con un dipendente e forse ci sarà la possibilità di mettere una postazione anche per Enciclopedie,Biblioteche digitali, Archivi, ecc.

Ovviamente gli ho parlato di Pedia e di noi. Mi ha chiesto di stilare una lista di siti che potrebbero essere indicati per questa funzione,e ovviamente lo faccio volentieri. Chiedo aiuto anche a voi, che siete navigatori esperti e più informati (è ovvio che se la proposta passa in Comune, si starà attentissimi ad essere sicuri dal punto di vista legale). Io già volo con la fantasia, ma se la cosa passasse, potrebbe essere un buon modello per altre biblioteche, e forse è un buon modo bottom up per iniziare a fare veramente rete... Comunque, vi ringrazio se avrete voglia di aiutarmi. PS: è ovvio che farò una pubblicità sfegatata al nostro progetto...;) Aubrey McFato 17:14, 19 ott 2006 (UTC)

Bell'idea!
Penso che la lista dei siti autorevoli che utilizziamo qui su it.sorce sia già un buon punto di partenza.
Se ti interessano anche siti che trattano di testi in latino fammi sapere e te ne metto qualcuno.
Ciao, --Accurimbono 09:23, 20 ott 2006 (UTC)
Io un libello l'ho gia preparato (immagini + OCR), e appena si raggiunge un consenso su formati, dimensioni e risoluzione delle immagini posso procedere a operazioni più mastodintiche. Caro Francesco, dsappi che si tratta proprio di Sallustio tradotto da Alfieri, quindi ti tengo in cuore (come il progetto di un portale della letteratura classica...) ad meliora tempora, o come scrisse uno studente alla lavagna, de OK satis... εΔω 16:01, 20 ott 2006 (UTC)

Wikisource.itModifica

Il dominio wikisource.it non è ancora stato registrato. Che ne dite di registrarlo e usarlo come redirect a Wikisource? Altrimenti potrebbe fare la fine di wikipedia.it, wikinews.it e wikibooks.it. Mushroom 14:04, 20 ott 2006 (UTC)

Politica sulle riletture: chiarimentoModifica

Ho notato che google libri possiede molti dei testi di opere al 75% o al 100% (potete trovare un esempio al solito Utente:Torredibabele/Sandbox). La cosa potrebbe esserci utile per portare le opere al mitico SAL edizioni wikisource. Tuttavia, spesso e volentieri (sempre, a dir la verità), le versioni di google (ma anche i testi cartacei che ho a casa) non corrispondono a quella della fonte. A questo punto mi chiedo:

  1. E' logico e possibile, al fine di portare un testo al livello SAL Edizioni Wikisource, rileggere il testo con una fonte diversa da quella indicata nella pagina di discussione?
  2. A risposta affermativa alla 1), se si trovassero delle discordanze fra la versione cartacea/google libri e quella del testo su wikisource, si dovrebbe correggere il testo in modo che rispecchi la versione cartacea/google libri?
  3. A risposta affermativa alla 2), nella pagina di discussione si dovrebbe perlomeno indicare le nuove edizione e fonte, se non sostituirle del tutto al posto delle vecchie, oppure no?
  4. A risposta affermativa alle precedenti domande, una sola rilettura, se effettuata con fonte cartacea/google libri diversa da quella del testo già presente, è sufficiente? In fondo errori nella modifica del testo possono sempre essere commessi, specie se le differenze sono piuttosto vaste. Quindi forse servirebbe un wikisourciano che modifichi alla versione googlelibri e un altro che controlli, nella filosofia del controlli incrociati. Torredibabele 15:06, 22 ott 2006 (UTC)
La logica del SAL è semplice, assegnamo ad ogni testo una fonte chiara e riscontrabile. Se poi le fonti sono diverse, ad esempio diversi curatori -> testo diverso, pubblichiamo più versioni dello stesso testo dando ai lettori la possibilità di leggerle e scoprirne le differenze (ottime per futuri testi di books, tra parentesi). Usiamo le pagine di disambiguazione ed il gioco è fatto. iPork sloggato e per di più su un windows con tastiera americana... --151.54.5.171 19:03, 22 ott 2006 (UTC)
I riscontri da Google sono preziosissimi, e permetterebbero di ottenere un riscontro comune. Ma sono utili solo usando i controlli incrociati di cui sopra. Per chi vuole le lectiones alternative basterebbe copiare offline un testo preesistente, rileggerlo operandovi i cambiamenti presenti nella fonte di Google e pubblicarlo come "doppione alternativo"... ma a quel punto se il testo preesistente ha una fonte riscontrabile (i famosi siti autorevoli) perché non passare al 100% il testo preesistente invece di avere un doppione. Io sarei per una logica di ridondanza riguardo a testi la cui fonte non è riscontrabile o la cui edizione su Google è oggettivamente più autorevole.
Piuttosto, GoogleBooks è invece una miniera inestimabile di testi anichi introvabili altrove e da valorizzare in forma ricercabile e affidabile qui su source. L'OCR di Google sarà stupendo, ma il nostro wikicontrollo incrociato è piummeglio. Orbilius sloggato dalla SALa professori

libro di cucinaModifica

Su https://www.pellegrinoartusi.it/la_cucina_artusiana.htm è possibile scaricare uno dei primi ricettari italiani, io non sono pratico di wikisource ma qualcuno più esperto non dovrebbe lasciarsi scappare questa pietra miliare. Batoh su wikipedia 84.222.31.179 11:49, 23 ott 2006 (UTC)

Su Liberliber è ampiamente disponibile anche in html... dato l'enorme numero di pagine che originerebbe una tale opera lo vedo con interesse (yum yum) e tremore... forse qualcuno potrebbe considerare il mass loading... Er clandestino der colleggio doccenti.

2 questioncine da uno un po' nuovoModifica

Ho dato una letta nei siti autorevoli, e ho visto che manca readme.it. Questo sito ha un assortimento impressionante di opere, e per quel che mi riguarda non ho mai trovato un errore. Non so se questa motivazione euristica abbia un gran valore, ma volevo segnalarvelo.

Ho dato una letta anche a "Cosa pubblicare", e mi ha lasciato stupefatto che non ci sia una politica sul coordinamento dei libri con gli altri progetti a licenza libera, come il progetto Gutenberg: a me non costerebbe niente (vedi bot) fare un upload in massa di tutti i contenuti del progetto Gutenberg in italiano, ma... è quello che vogliamo, creare doppioni? Non conviene astenersi dal pubblicare opere già pubblicate sotto licenza libera? sia ben chiaro che sogno il giorno in cui Gutenberg e simili saranno progetti della Wikipedia foundation :-)

--Toobaz 06:42, 25 ott 2006 (UTC)

  • Da un occhiata veloce mi sembra che readme.it non sia usabile come fonte perché non segnala l'edizione da cui sono tratti i loro testi (che noi invece consideriamo essenziale); inoltre non ho trovato pagine in cui spiegano qual'è la modalità di inserimento-controllo dei testi e anche per le singole opere non hanno un "sal"... (Comunque gli solo dato un occhiata veloce...)
  • Anche se non vogliamo essere solo una copia di altri siti, stiamo inserendo molti testi già pubblicati altrove in formato elettronico e con licenze libere. Per quanto riguarda l' inserimento massivo di testi provenienti da Gutemberg, liberLiber e simili, mi sto già occupando con un bot di fare qualcosa di simile (Dai un occhiata all'elenco qui o agli edit di Un1c0s bot). Comunque penso che sia quasi impossibile fare un bot capace di trasferire in modo sufficientemente buono tutto il contenuto del sito X a wikisource. Il mio bot si limita a prendere il file contente un opera, spezzettarlo in capitoli o poesie, formattarle secondo i nostri standard e uploadare il risultato; ha il problema "irrisolvibile" che per ogni opera è da configurare in modo diverso o bisogna perfino riscrivere pezzi delle sue funzioni...
    Se vuoi contribuire anche col tuo bot al trasferimento massivo, ne sarei felice; C'è tanto lavoro per tutti ;)

--Qualc1 09:15, 25 ott 2006 (UTC)

In effetti il tempo (lo sviluppo delle tecnologie e il raffronto con le altre Source) sta chiarendo la roadmap per il nostro progetto: inizialmente ci stiamo appoggiando ad altri siti, ma ritengo che il nostro scopo non sia quello di divenire il "mirror di altri siti" (anzi, spero che questa attività sia destinata a passare in progressivo secondo piano). I nostri testi vengono da altri siti quando ci sia il sensato vantaggio da questa operazione, ad esempio i testi di Liberliber sono spessissimo in formato zippato e dunque poco maneggevoli online, i canti popolari possono essere presentati in più versioni provenienti da altri siti, i documenti giuridici sono consultabili a pagamento o difficilmente... insomma ci siamo capiti. Ma sempre più si presenta la possibilità di presentare testi antichi in formato imagine e testuale via OCR. Google ci ha preceduti (ma non ne sono sicurissimo) di poco con una mirabile caterva di testi antichi che potremo mungere per presentare in un formato testuale migliore dell'OCR di Google (che basandosi sul gran numero di pagine più che sulla qualità del riconoscimento ottico dei caratteri è assai migliorabile da noi), e noi a nostra volta possiamo "liberare dagli scaffali di biblioteca" tutti quei volumi che attendono solo di essere scannerizzati e inseriti, quelli che le grandi antologie letterarie rinnegano finché non vengono utili come fonti da citare o conoscere (vi confesso che GoogleBooks mi sta stupendo in tal senso), fino a creare un vero sito di prelibatezze che altri siti ci contenderanno e useranno. Spero di aver chiarito la posizione del nostro operato in questo momento che posso definire "di transizione". Certo che finché non abbiamo almeno un quorum decente di testi base con cui renderci visibili nei motori di ricerca non abbiamo molte possibilità e dunque, al momento, ben vengano i caricamenti massicci da altri siti (lecitamente s'intende). La domanda che mi pongo in questi mesi è "quali testi ho cercato per la rete e ho trovato con difficoltà o in formati strani, o non ho proprio trovato?" Oppure "Quali testi possono essere utili agli altri progetti Wikimedia? Questo penso sia un criterio interessante di intervento (ad esempio il buon Pellegrino Artusi può interessare chi si sta occupando del Ricettario su WikiBooks....) Lo sloggato.
  • Il sito lo conosco anch'io, ma da quel che ho capito è soltanto un mirror, nel senso che copia testi da altri, e non ci sono info su Fonte ed Edizione. ::Nè, come sottolinea Qualc1, sulle politiche editoriali, il controllo, ecc.
  • Mi permetto di esporre nuovamente all'attenzione di tutti questa pagina.
E'da completare, migliorare e rendere indipendente dalla mia sandbox. E poi tutti i bottattori del mondo potranno sbizzarrirsi.
E credo sarebbe bello se veramente Qualc1 riuscisse ad uploadare una versione base del suo bot, così lo regaliamo per il suo compleanno ad Edo ;)
Scherzi a parte, credo che il discorso di formattare testi lunghi sia un ostacolo non da poco, uno dei motivi principali per cui Wikisource ha tanti nuovi utenti poco attivi.

Riuscire ad automatizzare forse aiuterebbe. Comunque parliamone. Aubrey McFato 11:24, 25 ott 2006 (UTC)

Quoto totalmente (non nel senso che lo pensavo anch'io, ma nel senso che approvo) Orbilius. Per il resto, grazie dell'introduzione all'argomento... che - penso - andrebbe integrata in "Cosa pubblicare", o comunque in qualche pagina ufficiale (cioé, se vi fidate lo faccio io).
Per quel che riguarda il bot, in effetti sono stato un po' esagerato, non è una cosa semplice, ma se l'ho presentata come tale è stato perché non pensavo ai libri, ma, ad esempio, ai testi di brani presenti su cpdl, che con semplici utility richiamate da scripts possono essere estratti (dal pdf o da lilypond) e formattati, e in cui l'apporto dell'utente sarebbe minimo (il titolo e poco più). Ma mi rendo conto che anche in quel caso non avremmo garanzie sufficienti sull'affidabilità dei testi, dato che cpdl non fa alcun controllo. --Toobaz 16:59, 25 ott 2006 (UTC)
P.S: mi sono chiesto anch'io tante volte da dove readme prenda i libri, ma ritengo improbabile che li copii semplicemente, perché sennò avrebbe perlomeno quelli di liberliber, il che non è...

De reditu suoModifica

Cari amici,

Sono tornato! Magari qualcuno dirà che non sono mai veramente mancato e che questo non è un forum, ma l'ultimo mese e mezzo dal punto di vista wiki stato un calvario. Adesso la connessione ADSL da casa mi funziona così posso finalmente agire

  • da casa e non da intruso in terra straniera
  • dotato di un lussuoso portatile AppleMacBook Pro dalla tastiera felpata e dalle prestazioni entusiasmanti, monitor 15.4" a risoluzione 1440x900, che non sarà il massimo massimo ma è un gran passo avanti rispetto al passato
  • dotato di scanner e di programa OCR con cui sto sperimentando in stile piccolo chimico.

L'ultimo passo da compiere riguarda il browser (adesso che mi connetto sto tenendo aperto in contemporanea Safari e Opera, mentre da windows rimango legato a Firefox). Dovrò decidermi, ma questo è tutto un altro discorso -effettivamente da forum-, insomma una quisquilia.

Ovviamente la lontananza dalla rete mi ha ridimensionato non poco la percezione del mondo, riportandomi un po' più alla ragione, e dunque credo che non dedicherò alla connessione tutto il tempo che dedicai quest'estate, ma l'affrancamento dalla schiavitù dei 56k mi apre nuove prospettive nel campo del download e del lavoro sporco... ragazzi sono tornato.

P.S. Non so se vi state rendendo conto del mostruoso lavoro del nostro Fabrizio. Data la sua indubbia esperienza nel progetto Diritto e la sua enorme progressione d'impegno senza schiamazzi sto concependo un pensiero molto interessante... bisognerà che gliene scriva. - εΔω 08:11, 27 ott 2006 (UTC)

Bentornato prof e buon lavoro! PS: Sono curioso di conoscere cosa ti frulla in testa relativamente al diritto. PPS: Fabrizio è sempre più spaventoso ^___^ ---- iPorkscrivimi 12:00, 30 ott 2006 (UTC)

2 fonti cartacee....incompleteModifica

Google libri mi sta facendo disperare!

Sto iniziando ad inserire (chissà, forse per vocazione professionale!) la voce Elementi di economia pubblica del Beccaria, il problema è che mi sono accorto solo ora, a capitolo I quasi ultimato, che la mia fonte cartacea di googlelibri è mutila di qualche pagina. La mia fonte "alternativa" non è meglio, perché anche in essa mancano alcune pagine iniziali. Come fare a risolvere casi come questi? Io pensavo di usare una fonte sola, completare solo la parte mancante con la fonte alternativa, ed indicarlo nella fonte. Poi, una volta in possesso di una fonte completa, si uniformerà l'opera ad essa. Fatemi sapere. Torredibabele 09:24, 29 ott 2006 (UTC)

Ma vada per la contaminazione, ci mancherebbe altro, purché non sia considerato pratica legittima e l'operato di contaminazione sia documentato nei minimi particolari in infotesto con URL delle pagine incriminate, punti di sutura delle varie parti e quant'altro. In tal modo se qualcuno ha la fonte con la lacuna minore può intervenire efficacemente. Ho notato anch'io la mancanza o la brutta scannerizzazione di molte pagine (è un insegnamento: noi faremo meno ma meglio). Proporrei di utilizzare prioritariamente le fonti scaricabili che possano essere esaminate *prima* dell'opera di trascrizione.
La contaminazione di fonti è pratica da deprecare, mi raccomando! Ho scritto quanto sopra per rispetto dell'immane lavoro di Torredibabele, ma di per sé l'operazione più filologicamente corretta sarebbe la produzione di due testi distinti con segnalazione di lacuna [...] dove il testo è illeggibile! Vediamo di non ricadere in situazioni così - εΔω 06:55, 30 ott 2006 (UTC)
Sottoscrivo quanto detto dal Magister. Aggiungo poi che il problema delle eccezioni è la loro gestione, ma fino ad oggi abbiamo dimostrato di fare largo uso del buon senso.---- iPorkscrivimi 11:58, 30 ott 2006 (UTC)
Problema risolto (spero), visto che ho trovato, sempre su googlelibri, la stessa identica versione, completa (si spera) ma NON scaricabile (boh...chi ci capisce è bravo). Per tornare al ragionamento di prima, è chiaro che la contaminazione non è una strada da percorrere, come è chiaro che un testo "contaminato" non potrà mai salire oltre il 25% di SAL. Torredibabele 19:02, 30 ott 2006 (UTC)
Beh, se vogliamo essere formalisti, nel caso l'opera sia completa grazie a più contributi distinti ma le cui fonti siano ben segnalate, per quanto Frankensteiniano possa apparire si potrebbe mettere SAL 50%, vale a dire: «L'opera è completa e con fonti segnalate, ma è da riformattare dividendola in vari tronconi basati sulle rispettive fonti e da porre a SAL 25%. Una serie di rimandi renderebbe il puzzle completamente leggibile». Se ci legge qualcuno da Pedia ci prende per matti, ma in fondo questa è Wikisource, e sono orgoglioso di farne parte... - εΔω 20:16, 30 ott 2006 (UTC)