Differenze tra le versioni di "Discussioni utente:Qualc1"

m
 
::*
 
:::Più che una risposta, vi dico come stavo provando a fare...
:::Prima di tutto volevo provare ad usare il database [http://wikixmldb.dyndns.org/ sedna] per fare una prima selezione tra pagine contenenti "Archimede" e pagine da ignorare completamente.
:::Il tentativo è fallito:
:::*Ho scoperto che la "Full-text search" (per la ricerca "istantanea" di testo) in realtà è supportata solo se si installa [http://www.dtsearch.com/ dtsearch], che è sia proprietario che a pagamento...
:::*La query per la ricerca di testo "normale", mandava in crash sedna... (ho segnalato il [http://sourceforge.net/tracker/?func=detail&atid=713730&aid=2555614&group_id=129076 bug] e dovrebbe venire corretto prossimamente)
 
:::Avevo un bot che faceva qualcosa di simile, l'ho reso un po' più generico per fare questo tipo di ricerca: appena lo commento lo copio su wikisource...
 
 
:::Per la sostituzione non distruttiva stavo provando a spezzettare la "stringona" che contiene tutto il testo della pagina in una ''lista'' di ''parti della pagina'' (più o meno si otterrebbe la stessa struttura che Alex ottiene con la sostituzione di parti di testo con #el1#, e mettendo le parti nel dizionario); con
:::*ogni parte può essere un template, link, testo semplice (parole?, punteggiatura?... e tante altre cose ci sarebbero...)
:::*ogni parte che a sua volta può contenere una lista di parti (per cercare di gestire elementi annidati)
:::Da questa struttura si potrebbero trovare/modificare più facilmente le parti richieste e poi riconcatenare tutte le parti per riottenere la "stringona" della pagina.
:::Provo a vedere se riesco ad ottenere qualcosa di sufficientemente funzionante... (non ho molto tempo a disposizione) --[[User:Qualc1|qualc1]] ([[User talk:Qualc1|disc.]]) 19:59, 4 feb 2009 (CET)
3 955

contributi