Discussioni progetto:Qualità/Proposte tecniche: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 564:
== Malto via bot: interessanti prospettive in vista ==
[[Utente:Qualc1|Qualc1]] mi ha magicamente scritto al volo una routine python attraverso la quale ogni bot può inviare una mail a un utente (che abbia abilitato la ricezione mail da wiki, ovvio) attraverso la pagina [[Speciale:EmailUser]]. In termini pratici, questo significa che possono essere scritte delle routine per abilitare un bot ad accettare richieste di ricerca, anche estremamente laboriosa e complessa, nell'intero database di Source, e a rispondere all'utente richiedente via mail, risparmiando lo spazio web source. La preoccupazione di risparmiare spazio web su Source può sembrare eccessiva, ma era un ostacolo notevole (per me) a sviluppare routine di questo tipo. Per gli amministratori-botolatori, si schiudono anche possibilità notevoli di invio di comunicati ecc (con la misura e la cautela che ogni invio di mail multiple richiede, ovvio). Il rischio che una funzione del genere alimenti lo spam esiste, ma secondo Jayvdb, che ho interpellato via irc, non è critico. --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 08:51, 7 mag 2009 (CEST)
 
== Spostato da Zibaldone ==
 
== Nuovo fronte: questione di virgole ==
''(Spostato qui dal Bar Zibaldone perchè mi sono reso conto che con Zibaldone c'entra poco).''
 
 
Farò degli esperimenti per estrarre alcuni elementi significativi dal testo txt che IE fornisce per Zibaldone. Fra questi:
#punto di fine pagina
#punteggiatura
 
L'idea è quella di utilizzare tali elementi per migliorare ulteriormente il testo che sto caricando, ''senza introdurre errori'', o meglio e più realisticamente: introducendo nuovi errori in ''numero molto minore delle correzioni esatte'' (diciamo, con un rapporto inferiore a 1:10).
 
Non è un problema facile, perchè devo ideare uno script che si fondi sulla ''similitudine'' più che sull'''uguaglianza'' fra parole... una sfida terrificante, ma se mi riesce.... :-) --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 09:39, 29 giu 2009 (CEST)
: Non serve alcuno sforzo per riscoprire l'acqua calda. Fra le routine del modulo difflib.py di python c'è tutto quello che serve per comparare sequenze, valutarne la ratio (indice di somiglianza, da 0 a 1), elencare le differenze e perfino produrre una pagina html finita, in cui a sono visualizzate a fronte le due sequenze e le loro differenze (esattamente quello che fa il software wiki nella pagina "differenze fra revisioni").
: Quindi, contrentrerò gli sforzi per capire bene le routine di questa liberia, e riassemblarle "a modo mio" incorporandole in Alebot. Fra l'altro, devo anche rovistare nel mattone pywikipedia, può essere che ci sia qualcosa di pronto. :-) --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 08:04, 1 lug 2009 (CEST)
=== Lectio facilior ===
Avendo a disposizione, come per Ziba, due versioni testuali '''a''' e '''b''' dello stesso testo (una proveniente da Binni-Ghinetti attraverso LiberLiber; l'altra, proveniente da Le Monnier attraverso Internet Archive), niente impedisce di ''caricare prima il testo a, poi il testo b, sulla stessa pagina'', e poi chiedere la differenza fra revisioni (in questo caso, la differenza fra versioni); chissà che non possa essere utile per vedere, "a colpo d'occhio umano", qualche particolare utile? Penso che rispolvererò un mio vecchio tool che ricava le pagine singole dal file xml.djvu di IE e vediamo cosa succede...--[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 08:13, 1 lug 2009 (CEST)
Ritorna alla pagina "Qualità/Proposte tecniche".