Wikisource:Bar/Archivio/2024.05

Archivio delle discussioni del mese di maggio dell'anno 2024

Categoria: Archivio Bar 2024 Bar   Archivio    maggio 2024 


Aiuto per caricamento e trascrizione di Struttura di un film

modifica

Ciao, come sapete quest'anno Wikimedia Italia sarà al Salone del Libro di Torino (9-13 maggio 2024) e proporrà rilettura su Wikisource di "Libri salvati" dai roghi nazisti del 1933. Tra questi autori vi è anche Isaak Babel, di cui, per questa occasione, abbiamo digitalizzato ex novo (in collaborazione con le Biblioteche civiche Torinesi) il testo Struttura di un film : sceneggiatura da Ambulanti Stelle che ora è su IA https://archive.org/details/babel-film-03/Babel%201%20film%20cop%20ant.jpg Chiedo un aiuto a chi abbia un po' di tempo per il caricamento su Wikisource e la trascrizione. Sono poche pagine (63 in totale) ed è davvero una novità in tutti i sensi. Grazie a tutti per l'aiuto che potrete dare. Oriana

Aiuto per caricamento e trascrizione di Nanà

modifica

Ciao, al Salone del Libro di Torino (9-13 maggio 2024) proporremo una rilettura su Wikisource che avrà come tema i "Libri salvati" dai roghi nazisti del 1933, in cui vennero bruciati i libri di autori non graditi al regime, la cui ricorrenza cade in quei giorni. Tra questi autore vi è Emile Zola e vorremmo proporre la rilettura di Nanà. Chiedo un aiuto a chi abbia un po' di tempo per la trascrizione di Indice:Zola_-_Nana_-_Pavia_-_1881.pdf per presentarlo al Salone, grazie mille! moz (disc.) 23:07, 2 mag 2024 (CEST)[rispondi]

@Elena moz C'è un problema nell'OCR incorporato nel pdf (quello che appare automaticamente all'apertura di una nuova pagina): i trattini delle parole spezzate non compaiono e i due frammenti della parola spezzata non si fondono (vanno riunite manualmente); il che rende la trascrizione più laboriosa. Indago. Alex brollo (disc.). 06:36, 3 mag 2024 (CEST)[rispondi]
@Alex brollo si può eventualmente lasciare questa parte alla rilettura finale? Sarebbe bello avere un certo numero di pagine almeno formattate,grazie ciao moz (disc.) 07:47, 3 mag 2024 (CEST)[rispondi]
@Elena moz No, a riunione delle parole spezzate è uno dei primi passi fondamentali della rilettura, automatizzato purchè i trattini esistano. Sentirò amici esperti in bar tecnico; il momento suggerireri di ottenere il testo con il tool Trascrivi il testo, che recupera i trattini. Intanto vedo se si può ovviare meglio. Alex brollo (disc.). 09:31, 3 mag 2024 (CEST)[rispondi]
@Elena moz Ma tu riesci a vedere le immagini delle pagine in nsPagina? :-(
Ho scaricato il testo e l'ho suddiviso in pagine dopo una serie di aggiustamenti, ma... non vedo le immagini. Purtroppo la qualità delle scansioni non è eccellente e la qualità dell'OCR ne risente parecchio; ma non carico il testo pre-elaborato se le immagini sono bloccate. Alex brollo (disc.). 12:40, 3 mag 2024 (CEST)[rispondi]
@Alex brollo per fortuna adesso le vedo di nuovo... erano sparite ma adesso le vedo nuovamente, puoi controllare anche tu? grazie moz (disc.) 12:51, 3 mag 2024 (CEST)[rispondi]
@Elena moz Sì, adesso le vedo. Carico una decina di pagine dalla 12 in poi; per favore, dimmi se il caricamento "aggiustato" procura qualche vantaggio, o se è meglio rinunciare ripiegando sul tool "Trascrivi il testo". Alex brollo (disc.). 14:09, 3 mag 2024 (CEST)[rispondi]
@Alex brollo mi pare che sulle parole che vanno a capo vada bene; ci sono tanti paragrafi 'spezzati' che non si uniscono con Strumenti per la rilettura. Però mi pare che così vada bene. Grazie per l'aiuto!... non resta che proseguire, ciao moz (disc.) 15:01, 3 mag 2024 (CEST)[rispondi]
@Elena moz Bene, proseguo con il caricamento. Nota bene: il tool Trascrivi il testo sovrascrive il testo presente sulla pagina, quindi può essere utilizzato per provare a sistemare una pagina particolarmente mal riuscita (e ce ne sono....). Alex brollo (disc.). 18:37, 3 mag 2024 (CEST)[rispondi]
grazie davvero! adesso vado a vedere l'altro,grazie ciao moz (disc.) 20:55, 4 mag 2024 (CEST)[rispondi]

Ancora Libri salvati da trascrivere: Il paradiso delle signore

modifica

ciao, ho caricato Indice:Zola - Il paradiso delle signore - 1936 - Mondadori.pdf , altro "libro salvato" dei roghi nazisti che vorremmo proporre in rilettura al Salone del Libro, grazie a chi vorrà contribuire alla trascrizione per portarlo al 75%. Si potrebbe proporre una maratona di rilettura online? ciao moz (disc.) 16:03, 3 mag 2024 (CEST)[rispondi]

Ciao a tutti, e ciao @Elena moz. Sto dando un'occhiata al libro Il paradiso delle signore e vedo due problemi: 1) le immagini, a parte la prima, non si vedono qui su Wikisource. 2) Più preoccupante, non so se il testo caricato sia in regola con Copyright. Sono andato sul testo caricato su IA e vedo che si tratta della V edizione pubblicata nel 1971. Chiedo ha persone più esperte di me, se questa edizione è attualmente utilizzabile qui su Wikisource. --Paperoastro (disc.) 17:32, 3 mag 2024 (CEST)[rispondi]
Direi proprio di sì. Entrambi i traduttori sono morti da più di 70 anni e l'edizione ha più di 20 anni. --Luigi62 (disc.) 18:56, 3 mag 2024 (CEST)[rispondi]
@Elena moz Hai dacitato su Commons il file IA ZolaParadisoDelleSignore.pdf o il file ZolaParadisoDelleSignore_text.pdf? Il primo non ha lo strato OCR, solo il secondo ce l'ha. Alex brollo (disc.). 19:25, 3 mag 2024 (CEST)[rispondi]
@Elena moz Quando avrai visto un po' a fondo il lavoro di "precaricamento" sull'altro libro di Zola, mi dirai se pensi che valga la pena di farlo anche su questo. Alex brollo (disc.). 22:42, 3 mag 2024 (CEST)[rispondi]
Grazie dei chiarimenti. Adesso è tutto a posto. --Paperoastro (disc.) 00:34, 4 mag 2024 (CEST)[rispondi]
ciao @Alex brollo ti chiedo pazienza ma non ho capito se devo ricaricare il file perché manca l'ocr; vedo alcune pagine al 75% ma se provo a farne altre non riesco perché non c'è ocr,non so bene cosa devo fare, ciao moz (disc.) 21:02, 4 mag 2024 (CEST)[rispondi]
@Elena moz Le sta rileggendo @Paperoastro; e nella pagina Discussioni indice troverai una bella relazione su come lo sta facendo. :-) La pagina Discussioni indice sta diventando il nostro "posto standard" per spiegare come stiamo lavorando e come proponiamo di superare le difficoltà specifiche caso per caso. Alex brollo (disc.). 21:36, 4 mag 2024 (CEST)[rispondi]
ah! ecco adesso ho letto, grazie davvero! @Alex brollo e @Paperoastro moz (disc.) 22:37, 4 mag 2024 (CEST)[rispondi]

Tech News: 2024-19

modifica

MediaWiki message delivery 18:44, 6 mag 2024 (CEST)[rispondi]

Autore citato

modifica

Mi è successa una cosa strana: avendo cliccato sul bottone {{AutCit}} per Montanelli Giuseppe, mi sono trovato il collegamento a un semisconosciuto Giuseppe Gori Montanelli anziché al più noto Giuseppe Montanelli. Ho notato anche che in alcuni casi invece di proporre un collegamento lo mette direttamente, anche quando non ci "azzecca".

Ci sono soluzioni?

--Carlo M. (disc.) 16:50, 8 mag 2024 (CEST)[rispondi]

@Carlomorino Mi sembra di ricordare che il motore di AutoreCitato lo fa, quando trova un'unica possibilità di scelta. Sono anni che non rileggo il codice, spero di capirlo ancora :-(, è una buona occasione per farlo. Alex brollo (disc.). 07:56, 9 mag 2024 (CEST)[rispondi]

10 min fa: Tommaso Corsi --> Tommaso Corsini. grrrr. --Carlo M. (disc.) 12:38, 2 giu 2024 (CEST)[rispondi]

Aiuto per caricamento e trascrizione di Struttura di un film

modifica

Aiuto per caricamento e trascrizione di Struttura di un film Ciao, come sapete quest'anno Wikimedia Italia sarà al Salone del Libro di Torino (9-13 maggio 2024) e proporrà rilettura su Wikisource di "Libri salvati" dai roghi nazisti del 1933. Tra questi autori vi è anche Isaak Babel, di cui, per questa occasione, abbiamo digitalizzato ex novo (in collaborazione con le Biblioteche civiche Torinesi) il testo Struttura di un film : sceneggiatura da Ambulanti Stelle che ora è su IA https://archive.org/details/babel-film-03/Babel%201%20film%20cop%20ant.jpg Chiedo un aiuto a chi abbia un po' di tempo per il caricamento su Wikisource e la trascrizione. Sono poche pagine (63 in totale) ed è davvero una novità in tutti i sensi. Grazie a tutti per l'aiuto che potrete dare. Oriana Oriana Bozzarelli (disc.) 20:47, 9 mag 2024 (CEST)[rispondi]

ciao, ho creato Indice:Babel - Struttura di un film - 1925.pdf ma mi dà errore nel page list, anche se ho lasciato solo il tag pagelist/ perché le pagine del pdf sono uguali a quelle del libro, senza pagine vuote, da 1 a 64. Non capisco dove sia l'errore, suggerimenti? grazie! moz (disc.) 23:47, 9 mag 2024 (CEST)[rispondi]

Modifica di Aiuto:Guida alla pubblicazione di un testo/Scegliere il testo

modifica

Posso proporre una possibile modifica di Aiuto:Guida alla pubblicazione di un testo/Scegliere il testo? Nella sezione "Scansione di un testo" è scritto: "numera i singoli file delle pagine ― partendo col n°001 dalla copertina ― mantenendone l'ordine e utilizzando 001, 002 (non solo 1, 2) per evitare scomode rinomine successive. Se poi sono più di 999 pagine usare tre zeri e dotarsi di panini, bibite e molto caffè.". C'è un programma semplice e completo da usare per queste azioni, il programma in questione è Advanced Renamer.

La modifica potrebbe essere questa: "Se poi sono più di 999 pagine usare tre zeri e dotarsi di Advanced Renamer, un programma per la rinomina dei file."

Qualche parere positivo o negativo? 93.47.36.240 18:07, 10 mag 2024 (CEST)[rispondi]

caro 93.47.36.240,
perché non scrivere con un nome utente? in tal modo riceveresti una notifica di questa risposta.
Di per sé la buona intenzione è lodevole, ma teniamo presente che se l'opzione che proponi è questa potrebbe storcere il naso a qualcuno per l'implicita pubblicità che presenta. Sicuramente esistono possibilità preinstallate in Linux, su ogni computer con macOS c'è un renamer preinstallato senza bisogno di procurarsene di "advanced", ecc.
In conclusione preferirei non privilegiare soluzioni proprietarie, parziali o divisive, se altri utenti non la pensino come me al limite lasciamole in una nota ma non direttamente nel testo. - εΔω 11:08, 12 mag 2024 (CEST)[rispondi]

Tech News: 2024-20

modifica

MediaWiki message delivery 01:58, 14 mag 2024 (CEST)[rispondi]

Sign up for the language community meeting on May 31st, 16:00 UTC

modifica

Hello all,

The next language community meeting is scheduled in a few weeks - May 31st at 16:00 UTC. If you're interested, you can sign up on this wiki page.

This is a participant-driven meeting, where we share language-specific updates related to various projects, collectively discuss technical issues related to language wikis, and work together to find possible solutions. For example, in the last meeting, the topics included the machine translation service (MinT) and the languages and models it currently supports, localization efforts from the Kiwix team, and technical challenges with numerical sorting in files used on Bengali Wikisource.

Do you have any ideas for topics to share technical updates related to your project? Any problems that you would like to bring for discussion during the meeting? Do you need interpretation support from English to another language? Please reach out to me at ssethi(__AT__)wikimedia.org and add agenda items to the document here.

We look forward to your participation!

MediaWiki message delivery 23:23, 14 mag 2024 (CEST)[rispondi]

Creazione pagina Indice

modifica

Buongiorno, ho inserito su Commons il testo digitalizzato "File:Prato - Appunti di giurisprudenza bancaria in Inghilterra - 1899.pdf" per poterlo pubblicare su wikisource. Avrei bisogno di aiuto per la creazione della pagina indice poiché la numerazione delle pagine è inusuale (i numeri sono attribuiti alle singole colonne). Sto lavorando al progetto GLAM https://it.wikipedia.org/wiki/Progetto:GLAM/Progetti/Biblioteca_di_economia_e_management_UniTo grazie molte, a presto Giulia06100 (disc.) 09:50, 15 mag 2024 (CEST)[rispondi]

@Giulia06100, inizia pure a creare l'indice lasciando stare i numeri delle pagine, quelli li possiamo sistemare dopo. Can da Lua (disc.) 09:56, 15 mag 2024 (CEST)[rispondi]
Grazie, ho creato l'indice! Un altro problema che si pone è la trascrizione delle colonne che vengono riportate in automatico una sotto l'altra e non affiancate. C'è per caso il modo di affiancarle? Come primo inserimento è abbastanza rognoso...
grazie mille! Giulia06100 (disc.) 10:26, 15 mag 2024 (CEST)[rispondi]
@Giulia06100: prova ad usare il bottone "Trascrivi il testo" che trovi in alto a destra, mi pare dia risultati piuttosto buoni. Successivamente premi Alt+7 per una prima sistemazione del testo (ad esempio ti riaggancia le parole che vanno a capo). Ti ho sistemato anche il sommario (non vanno create pagine col titolo "Frontespizio"), adesso sistemo anche i numeri di pagina. Can da Lua (disc.) 11:44, 15 mag 2024 (CEST)[rispondi]
Grazie mille. Anche io sto lavorando allo stesso progetto con Giulia06100 e altri colleghi. Grazie molte per le dritte e l'aiuto. 130.192.244.62 15:11, 15 mag 2024 (CEST)[rispondi]

Problemi con la creazione della pagine indice

modifica

Buongiorno, avrei bisogno di un aiuto. Ho inserito il testo digitalizzato su commons (https://commons.wikimedia.org/wiki/File:Prato_-_Fatti_e_dottrine_economiche_alla_vigilia_del_1848_-_1920.pdf( e sto cercando di creare la pagina indice su wikisource. Non riesco a capire perché compare il messaggio "Si è verificato il seguente errore analizzando l'elenco delle pagine: errore: intervallo non valido). Mi è successo anche con altri testi. Avete qualche suggerimento? (abbiamo provato sia a compilare l'indice in modo completo, sia a lasciarlo solo con l'indicazione di default - ma non funziona. grazie mille! Lisa16031977 (disc.) 14:56, 15 mag 2024 (CEST)[rispondi]

@Lisa16031977: è un bug da qualche tempo càpita sistematicamente con ogni nuovo indice. Si risolve andando prima sulla pagina di Commons e facendo "Purge" (dal menu in alto a destra), e poi facendo Purge anche sull'Indice. Can da Lua (disc.) 15:11, 15 mag 2024 (CEST)[rispondi]
Grazie mille! Ora ha funzionato! Lisa16031977 (disc.) 16:17, 15 mag 2024 (CEST)[rispondi]

Compilazione sommario

modifica

Buongiorno, non riesco a capire come mai nella compilazione del sommario le pagine inserite da me vengono poi pubblicate con una numerazione differente. Ho controllato di aver scritto giusto la pagelist e mi sembra corretta. Avete suggerimenti in merito? Il file è questo: https://it.wikisource.org/wiki/Indice:Prato_-_Risparmio_e_credito_in_Piemonte_nell%27avvento_dell%27economia_moderna_-_1927.pdf Grazie Silvia.Barraco1982 (disc.) 11:28, 16 mag 2024 (CEST)[rispondi]

@Silvia.Barraco1982 Mi sembra tutto regolare: viene visualizzato il numero della pagina del libro. C'è solo un piccolo equivoco: anche le pagine bianche hanno il loro numero pagina, che però non è stampato; quindi il pagelist può essere drasticamente semplificato, come ho fatto. Il fatto che siano vuote sarà evidente dal fatto che saranno colorate diversamente dalle altre (creo, per farti vedere l'effetto, la pagina 8).
Il testo, però, presenta un problema di formattazione: la presenza di note a lato. Non preoccuparti di rispettare la disposizione delle note a lato, in transclusione è bene che tutte risultino a destra del testo, quindi per tutte si può usare il template {{Annotazione a lato}}; guarda bene la documentazione del template, e soprattutto ricordati di aggiungere {{NMIS}} in testa a tutte le pagine ns0. Alex brollo (disc.). 11:55, 16 mag 2024 (CEST)[rispondi]
@Silvia.Barraco1982 Un esempio del codice per le annotazioni a lato: qui in nsPagina e qui in ns0, transclusione della pagina precedente. Alex brollo (disc.). 13:59, 16 mag 2024 (CEST)[rispondi]
Ok grazie. Però se io clicco al fondo dove c'è scritto sommario e clicco sulla pagina dei capitoli non corrispondono le pagine. Ad esempio il capitolo "Gli albori dello «spirito di risparmio»" non è a pagina 5 ma a pagina 9. A pagina 5 c'è l'indice e infatti mi rimanda all'indice. Silvia.Barraco1982 (disc.) 14:07, 16 mag 2024 (CEST)[rispondi]
Ho sistemato il sommario. Grazie dei suggerimenti in merito. Silvia.Barraco1982 (disc.) 14:49, 16 mag 2024 (CEST)[rispondi]

Nome della pagina nel namespace principale

modifica

@Silvia.Barraco1982, @Lisa16031977, @Giulia06100: un chiarimento sul campo "Nome della pagina nel namespace principale" delle pagine Indice. Qui ci va solo il titolo del testo, senza l'autore o l'anno (a meno che non ci siano già altri testi con lo stesso titolo). Quindi "Fatti e dottrine economiche alla vigilia del 1848" e non "Prato - Fatti e dottrine economiche alla vigilia del 1848 - 1920". Invece nel nome del file e quindi dell'indice, di solito consigliamo di mettere: "Autore - Titolo, Editore, Città, Anno.pdf", ma come avete fatto va comunque bene (l'importante è che il nome del file identifichi quell'edizione, quindi l'anno è fondamentale). Comunque cliccando sulla i vicino ai campi, o anche soffermandosi col mouse, vi compaiono le istruzioni con degli esempi. Can da Lua (disc.) 10:11, 17 mag 2024 (CEST)[rispondi]

Grazie molte del chiarimento! Nel frattempo ho caricato anche il "File:Prato - Censimenti e popolazione in Piemonte nei secoli XVI, XVII e XVIII - 1906.pdf" ma mi da problemi con la creazione di Indice e Sommario nonostante abbia dato più volte il comando "Purge". Lisa16031977 (disc.) 15:10, 17 mag 2024 (CEST)[rispondi]
@Lisa16031977: eh, attenzione: devi fare Purge prima su Commons e poi sull'indice (non sulla pagina del file qui su Wikisource): in pratica dall'indice clicchi primi sull'immagine di frontespizio, poi su "Vedi su Wikimedia Commons" in alto a destra, e poi lì troverai il bottone Purge o Purga. Poi torni sull'indice e lo fai anche lì. Purtroppo è un bug molto antipatico, spero lo risolvano abbastanza in fretta. Can da Lua (disc.) 15:51, 17 mag 2024 (CEST)[rispondi]
grazie, ho provato in tutti i modi ma su wikimedia Commons non trovo da nessuna parte il comando "purge", né in alto a destra né altrove, e nemmeno le colleghe lo trovano. Lo trovo solo sulla pagina indice di wikisource. grazie.. Lisa16031977 (disc.) 18:25, 20 mag 2024 (CEST)[rispondi]
@Lisa16031977, hai ragione, in Commons quel bottone va prima attivato andando in Preferenze>Accessori (o Gadgets), cerca quello che si chiama PagePurge, metti la spunta e salva. Purtroppo essendo una funzione che dovrebbe servire raramente, è un po' nascosta. Comunque al limite, se proprio non riuscite, chiedete qui al bar e lo fa qualcuno di noi. Vi consiglierei però di fare prima esperienza portando a conclusione le trascrizioni che avete già avviato, e poi caricare altri testi. Can da Lua (disc.) 23:52, 21 mag 2024 (CEST)[rispondi]
Grazie mille, con le tue istruzioni sono riuscita! Per ora abbiamo finito di caricare i testi. Ora ci dedichiamo alla trascrizione. Sicuramente vi chiederemo ancora aiuto! Grazie Lisa16031977 (disc.) 15:19, 22 mag 2024 (CEST)[rispondi]
Aggiungo anche @Giaccai dato che vedo lo stesso tipo di errore in Indice:Giovanni Botti, I boccali di Montelupo.djvu. Per favore sistema "Nome della pagina nel namespace principale" come indicato qui sopra, grazie. Can da Lua (disc.) 21:16, 18 mag 2024 (CEST)[rispondi]

Invitation to join May Wikisource Community Meeting

modifica

Hello fellow Wikisource enthusiasts!

We're excited to announce our upcoming Wikisource Community meeting, scheduled for 25 May 2024, 3 PM UTC (check your local time). As always, your participation is crucial to the success of our community discussions.

Similar to previous meetings, the agenda will be split into two segments. The first half will cover non-technical updates, such as events, conferences, proofread-a-thons, and collaborations. In the second half, we'll dive into technical updates and discussions, addressing key challenges faced by Wikisource communities.

Simply follow the link below to secure your spot and engage with fellow Wikisource enthusiasts:

Event Registration Page

Agenda Suggestions: Your input matters! Feel free to suggest any additional topics you'd like to see included in the agenda.

If you have any suggestions or would just prefer being added to the meeting the old way, simply drop a message on klawal-ctr@wikimedia.org.

Thank you for your continued dedication to Wikisource. We look forward to your active participation in our upcoming meeting.

Regards, KLawal-WMF, Sam Wilson (WMF), and Satdeep Gill (WMF)

Sent using MediaWiki message delivery (disc.) 13:34, 20 mag 2024 (CEST)[rispondi]

Tech News: 2024-21

modifica

MediaWiki message delivery 01:04, 21 mag 2024 (CEST)[rispondi]

Feedback invited on Procedure for Sibling Project Lifecycle

modifica
Puoi trovare questo messaggio tradotto in altre lingue su Meta-wiki. Aiutaci a tradurre nella tua lingua
 

Cari membri della comunità,

The Community Affairs Committee (CAC) of the Wikimedia Foundation Board of Trustees invites you to give feedback on a draft Procedure for Sibling Project Lifecycle. This draft Procedure outlines proposed steps and requirements for opening and closing Wikimedia Sibling Projects, and aims to ensure any newly approved projects are set up for success. This is separate from the procedures for opening or closing language versions of projects, which is handled by the Language Committee or closing projects policy.

Puoi trovare i dettagli su questa pagina, nonché le modalità per fornire il tuo feedback da oggi fino alla fine della giornata del 23 Giugno 2024, ovunque sulla Terra.

Puoi anche condividere informazioni a riguardo con le comunità di progetto interessate con cui lavori o che supporti, e puoi anche aiutarci a tradurre la procedura in più lingue, in modo che le persone possano partecipare alle discussioni nella propria lingua.

A nome del CAC,

RamzyM (WMF) 04:25, 22 mag 2024 (CEST)[rispondi]

Immagine con errore di battitura

modifica

Nell'immagine della Pagina:D'Urso - Guerra e malaria, Milano, 1918.djvu/6, a metà della prima riga, è scritto "Itaila", mentre nella trascrizione la parola è stata corretta in "Italia". La mia domanda è: le trascrizioni possono venire trascritte correttamente o devono essere uguali all'immagine? 93.47.37.69 11:34, 23 mag 2024 (CEST)[rispondi]

Ciao, @93.47.37.69. In sede di trascrizione, manteniamo quanto scritto nell'immagine. Tuttavia, in casi di errori conclamati e chiari come questo, usiamo il template {{Ec}} che permette di mantenere la versione originale con l'errore nella pagina, ma in trasclusione la versione con la correzione. --Paperoastro (disc.) 12:26, 23 mag 2024 (CEST)[rispondi]
IN questo singolo caso è evidentissimo un errore tipografico, dunque nessun oibezione a trascrivere {{Ec|Itaila|Italia}}: in tal modo nella trascrizione della pagina compare l'errore mentre nella sua transclusione questo apparirà la forma corretta. εΔω 14:28, 25 mag 2024 (CEST)[rispondi]

Cosa fare se manca l'OCR alle scansioni

modifica

In questi giorni ho contribuito a portare a SAL75%      il paradiso delle signore    di Émile Zola (1883), traduzione dal francese di Ferdinando Martini, Guido Mazzoni (1936). La particolarità di questo testo è che il file che è stato caricato su Commons era senza OCR. Usando gli strumenti "OCR di Google" o "trascrivi il testo", è possibile avere l'OCR con uno degli strumenti messi a disposizione da Wikimedia: Tesseract, Google, Transkribus. A seconda delle scansioni e del testo, è più adatto uno o l'altro di questi strumenti. Ad esempio per il Paradiso delle signore ho trovato adatto lo strumento di Google, che funziona anche su pagine "storte" e riconosce gli accenti "rovesci". In testi più antichi, come il      Saggio meteorologico    di Giuseppe Toaldo (1797), sto trovando molto utile Tesseract, impostando la lingua italiano-old che riconosce molto bene le "f" che sono "s".

Infine, per portare questi testi a SAL75%, uso in sequenza alcuni dei nostri strumenti di rilettura: Elimina riga 1 (se serve), Aggiusta paragrafi, PostOCR, Unisci linee. Una rapida occhiata al testo per eventuali discrepanze e corsivi, permette di portare rapidamente le pagine a SAL75% anche senza OCR nativo. Paperoastro (disc.) 12:53, 23 mag 2024 (CEST)[rispondi]

@Paperoastro Esatto. Aggiungo: usando Opzioni avanzate, si può ottenere l'OCR di aree specifiche della pagina, il che salva la vita quando l'OCR stenta a riconoscere bene i testi in più colonne. Si avvicina il momento in cui l'OCR incorporato nei file sarà inutile, e già adesso l'OCR al volo spesso è molto migliore di quello integrato. Alex brollo (disc.). 10:52, 25 mag 2024 (CEST)[rispondi]
Grazie a questo potente strumento sto riprendendo in considerazione testi "disperanti" come Il rapimento d'Elena e altre opere il cui OCR era precedentemente inservibile. Il riconoscimnento di testi sei-settecenteschi, accoppiato allo strumento "F o S?" ( ) rende la trascrizione molto più attuabile.
Aggiungo inoltre che lo stesso strumento permette di trascrivere i testi di file senza alcuno strato OCR come Vangeli apocrifi distinguendo con impressionante precisione italiano, latino e greco! εΔω 14:24, 25 mag 2024 (CEST)[rispondi]

L'ultima... anzi, l’ùltima frontiera

modifica

Se qualche anima pia volesse sperimentare i nuovi strumenti sulle opere di Carlo Dossi potrebbe realmente fare la differenza: l'autore ha sperimentato una sua ortografia personale unica, non prevedibile con regex e spesso ignorata dagli strumenti OCR. - εΔω 14:49, 25 mag 2024 (CEST)[rispondi]

Segnalazione

modifica

Ciao a tutti, entro in punta di piedi nella biblioteca, per segnalarvi che qui vi sono richieste di trasferimento risalenti al 2010 XD Il consenso per trasferirle c'è, sta a voi decidere se volete quei testi oppure no (in tal caso andranno cancellati). Friniate (disc.) 22:37, 25 mag 2024 (CEST)[rispondi]

Sapete una novità? Mi sa che negli ultimi anni sto diventando più cinico. Mi preparo a trasferire qui tutti i testi, dopodiché li sottoporrò al giudizio della comunità: se sono da cancellare (mancanza di fonte, del tutto in un'altra lingua, traduzioni originali, testi senza riscontro cartaceo ecc.) li cancelliamo dopo una settimana, altrimenti li lascerò come stanno. ci sono alcuni testi che possono stare ma che richiedono ricerca di fonte o formattazione, ma in effetti prima vediamo cosa resta e poi ci pensiamo. Negli ultimi anni è anche aumentata la comunità e ci possono essere utenti disposti a integrare nella nostra interfaccia dei testi provenienti da Pedia. Reggetevi forte! εΔω 08:27, 26 mag 2024 (CEST)[rispondi]
@Friniate: Quei testi non li abbiamo mai importati perché nella richiesta di trasferimento non è mai indicata la fonte, nonostante la pagina indichi chiaramente che è obbligatoria. Se volete trasferirli, il modo migliore è caricarli qui ex novo, e questo lo può fare chiunque, non serve un amministratore. La pagina dei trasferimenti io la chiuderei proprio, non ho mai capito perché vi ostiniate a usarla XD @OrbiliusMagister: se il tuo obiettivo è togliere di mezzo queste richieste, procedi pure, ma per me, se non trovi una fonte, è una perdita di tempo. Can da Lua (disc.) 09:39, 26 mag 2024 (CEST)[rispondi]
Il bicchiere è mezzo pieno e mezzo vuoto. Nelle pagine di servizio di Pedia i link alle politiche di inclusione su source ci sono ma sono o ignorati o non compresi. Non sto a sindacare.
La pagina di trasferimento è vista "di là" come un deposito in attesa di ripulitura, "di qua" è praticamente ignorata. Io l'ho seguita per un paio di anni, ma dopo un po' di tentativi non mi sono più smazzato la faccenda. Il fatto è che posso importare i testi, ma non sono l'unico che può spiegare ai Pediani cosa va o non va per trasferire o meno quelle pagine.
A questo punto decido che trasferisco tutto qui, ma non in ns0, bensì in una pagina speciale Wikisource:Testi importati da Wikipedia, dove a differenza di Pedia possiamo usare le nostre consuetudini, politiche e linee guida così da essere essere spicci e decisi. εΔω 10:35, 26 mag 2024 (CEST)[rispondi]
@Candalua le fonti sono nelle pagine specifiche (almeno in alcune, non le ho controllate tutte), chiaramente non stanno nella richiesta di trasferimento che è solo una pagina di servizio... Per altri progetti è utile, se per voi non lo è aprite pure una discussione su pedia per farvi togliere da quella pagina, che volete che vi dica, ma stare a far marcire lì dei testi in eterna attesa non mi sembra sta gran soluzione... Friniate (disc.) 12:24, 26 mag 2024 (CEST)[rispondi]
  Fatto
Ho importato qui tutti i testi segnalati, in modo da non avere più un backlog scandaloso. Essi sono a disposizione per l'esame di ciascun utente come sottopagine di Wikisource:Testi importati da Wikipedia. Come previsto alcuni sono praticamente da cancellazione immediata, quelli con fonte indicata ora cercando una fonte proofread, ora adattandoli alla nostra interfaccia, possono stare anche se la loro fonte non sia importabile qui. Evidentemente non possono stare a marcire an che da noi. Sotto ciasucno ho messo un mio commento, ma gradirei che altri commentassero e legittimassero la prosecuzione dei lavori o ne chiedessero la rimozione. εΔω 16:47, 26 mag 2024 (CEST)[rispondi]
@OrbiliusMagister ottimo, grazie mille. Friniate (disc.) 16:49, 26 mag 2024 (CEST)[rispondi]
@OrbiliusMagister Mi pare una decisione salomonica. Ottimo. Alex brollo (disc.). 16:59, 26 mag 2024 (CEST)[rispondi]
Certo, ma non ha molto senso trasferire da una ghiacciaia ad un'altra ghiacciaia questi testi: o stanno e allora ci industriamo per trovare le fonti e formattarli, o non stanno e li eliminiamo. Il senso del trasferimento è questo: se su Pedia ci stavano ad aspettare ora che abbiamo i testi qui non procrastiniamo, va bene? εΔω 22:12, 26 mag 2024 (CEST)[rispondi]
@OrbiliusMagister Basta che resti traccia del trasferimento e della decisione, caso per caso. E che sia chiaro che la nostra decisione, al proposito, una volta "presi in carico" i testi, è insindacabile: non vorrei, qui, niente di simile delle estenuanti discussioni di Pedia. Alex brollo (disc.). 07:17, 27 mag 2024 (CEST)[rispondi]
Non siamo su Pedia: un testo totalmente in francese e presente su fr.source è appena stato eliminato. Al contempo ho trovato la fonte per quello in occitano con traduzione italiana (P.S. se volessi caricarla su commons faresti un piacere), infine mi sto muovendo presso lij.source per trovare la fonte di quelli in genovese bonifacino... @Paperoastro sta trovando altre fonti, insomma noi (non io) facciamo la nostra parte. Avverto che i testi senza fonte saranno messi tra breve in cancellazione (con la semicanonica settimana di attesa). Insomma, nulla di misterioso so arbitrario. εΔω 07:26, 27 mag 2024 (CEST)[rispondi]
@OrbiliusMagister Posso caricare Antologia provenzale da IA, beninteso, tutto il volume. Le scansioni mi sembrano eccellenti. Prima controllo la sequenza pagine. Alex brollo (disc.). 17:22, 29 mag 2024 (CEST)[rispondi]
@OrbiliusMagister Test campionario della sequenza pagine del djvu ok. Procedo (così faccio un test degli script rianimati). Alex brollo (disc.). 21:59, 29 mag 2024 (CEST)[rispondi]
Eccellente! εΔω 22:17, 29 mag 2024 (CEST)[rispondi]

Tech News: 2024-22

modifica

MediaWiki message delivery 02:15, 28 mag 2024 (CEST)[rispondi]