Pagina:Teoria degli errori e fondamenti di statistica.djvu/241

12.7 - Il metodo di Kolmogorov e Smirnov 225

12.7 Il metodo di Kolmogorov e Smirnov

Il test di Kolmogorov e Smirnov è un metodo di analisi statistica che permette di confrontare tra loro un campione di dati ed una distribuzione teorica (oppure due campioni di dati) allo scopo di verificare l’ipotesi statistica che la popolazione da cui i dati provengono sia quella in esame (oppure l’ipotesi che entrambi i campioni provengano dalla stessa popolazione).

Una caratteristica interessante di questo metodo è che esso non richiede la preventiva, e più o meno arbitraria, suddivisione dei dati in classi di frequenza; definendo queste ultime in modo diverso si ottengono ovviamente, dal metodo del , differenti risultati per gli stessi campioni.

Il test di Kolmogorov e Smirnov si basa infatti sulla frequenza cumulativa relativa dei dati, introdotta nel paragrafo 4.1 a pagina 33; e sull’analogo concetto di funzione di distribuzione di una variabile continua definito nel paragrafo 6.1 a pagina 68. Per la compatibilità tra un campione ed una ipotetica legge che si ritiene possa descriverne la popolazione di provenienza, e collegata ad una funzione di distribuzione , bisogna confrontare la frequenza cumulativa relativa del campione con per ricavare il valore assoluto del massimo scarto tra esse,

.

Si può dimostrare che, se l’ipotesi da verificare fosse vera, la probabilità di ottenere casualmente un valore di non inferiore ad una prefissata quantità (positiva) sarebbe data da

ove è la serie

(12.20)

e vale

. (12.21)

La legge ora enunciata è approssimata, ma il test di Kolmogorov e Smirnov può essere usato già per dimensioni del campione uguali a 5. Attenzione però che, se qualche parametro da cui la distribuzione teorica dipende è stato stimato sulla base dei dati, l’integrale della densità di probabilità