Pagina:Teoria degli errori e fondamenti di statistica.djvu/220

204 Capitolo 12 - La verifica delle ipotesi (I)

la funzione normale, la quantità

(12.9)

cioè la somma, su tutte le classi di frequenza (il cui numero abbiamo supposto sia ), del quadrato della differenza tra il numero di misure ivi attese () ed ivi effettivamente osservate (), diviso per la varianza del numero di misure attese (approssimata da ), ha approssimativamente la distribuzione del , con gradi di libertà; il motivo di quest’ultima affermazione è che esiste un vincolo sulle , quello di avere per somma il numero totale di misure effettuate (che viene usato nella formula (12.9), mediante la quale abbiamo definito , per calcolare il numero di misure attese in ogni intervallo).

La condizione enunciata si può in pratica supporre verificata se le in ogni intervallo sono almeno pari a 5; o, meglio, se il numero di classi di frequenza in cui ci si aspetta un numero di misure minore di 5 è trascurabile rispetto al totale (meno del 10%). In realtà, se le classi di frequenza si possono scegliere arbitrariamente, la cosa migliore consiste nel definirle di ampiezze differenti: in modo tale che quegli intervalli dove cadono poche misure vengano riuniti assieme in un’unica classe più ampia, ove valga almeno 5 (ma nemmeno troppo ampia, per soddisfare al vincolo di avere ; in genere si cerca di riunire assieme più classi in modo da avere degli ).

Tornando al problema iniziale, per la verifica dell’ipotesi statistica che i dati vengano dalla distribuzione usata per il calcolo delle basta:

  • fissare arbitrariamente un livello di probabilità che rappresenti il confine tra eventi ammissibili nell’ipotesi della pura casualità ed eventi invece tanto improbabili da far supporre che il loro verificarsi sia dovuto non a fluttuazioni statistiche, ma al non essere verificate le ipotesi fatte in partenza (il provenire i dati dalla distribuzione nota a priori): ad esempio il 95% o il 99%.
  • Cercare nelle apposite tabelle1 il valore di taglio corrispondente alla coda superiore della distribuzione del ad gradi di libertà avente area pari al livello di confidenza desiderato; ossia quell’ascissa

  1. Alcuni valori numerici di questo tipo sono tabulati nell’appendice G. È bene anche ricordare che quando il numero di gradi di libertà è superiore a 30 si può far riferimento alla distribuzione normale con media ed errore quadratico medio ; e che, già per piccoli , è approssimativamente normale con media e varianza 1.