Contenuto cancellato Contenuto aggiunto
→‎Nuovo fronte: nuova sezione
Riga 123:
 
Lasciamo le StringFunction al loro destino, sto per montare sul bot una potente libreria per il confronto e il delta di sequenze (=di pagina e di pezzi di testo), se sei esperto al proposito ti chiedo qualche dritta... altrimenti esploro e poi ti racconto! Ciao! --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 16:02, 1 lug 2009 (CEST)
 
== Match testo su testo ==
 
Caro Stefano, sono delusissimo dei primi test concreti di difflib.py. Di conseguenza mi sono imbarcato in un'opera difficile al cubo: scrivere da me un ''algoritmo di comparazione fra sequenze''. Stamattina presto ho avuto un'intuizione "tipo film", che dai primi test sembrerebbe funzionare e che sembra anche molto veloce (un "match semplice" ciclato per 10000 volte per un grossolano test di performance ci mette ''meno di 2 secondi'').
 
Il problema è: date due stringhe o sequenze, trovare tutte le sottostringhe o sottosequenze comuni e di conseguenza tutte le sottostringhe o sottosequenze diverse. In genere si tratta di sequenze simili ma non identiche, come avviene nel caso di due versioni di un file. Chiaro che ci sono programmi a bizzeffe che lo fanno, e forniscono un risultato "leggibile dall'uomo" (un chiaro esempio è la pagina differenze fra revisioni qui in wiki), ma io vorrei il controllo ''totale'' dell'algoritmo e tabelle di dati adeguate ad andare avanti via software, per gestire "intelligentemente" le ricorrenze e le differenze.
 
Ora, ci sono due casi... o anche tu sei "entusiasta scopritore dell'acqua calda", ossia sei disponibile a spaccarti la testa, per il puro piacere di farlo, su un problema che altri, con estrema probabilità, hanno già risolto, oppure no. Nel primo caso, volentieri condividerei con te l'avvicinamento all'algoritmo definitivo.... nel secondo caso, facendolo ti farei un dispetto e ti farei solo perdere tempo. Sappimi dire! --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 10:40, 2 lug 2009 (CEST)