Pagina:Teoria degli errori e fondamenti di statistica.djvu/219

12.2 - Verifiche basate sulla distribuzione del χ2 203

solamente da N; non dipende, in particolare, dalla media del campione . Quindi:

Il valore medio e la varianza campionaria , calcolati su valori estratti a caso da una stessa popolazione normale, sono due variabili casuali statisticamente indipendenti tra loro.

Questo risulta anche intuitivamente comprensibile; se infatti ci è noto che un certo campione di dati ha una dispersione più o meno grande, questo non deve alterare la probabilità che il suo valore medio abbia un valore piuttosto che un altro; né, viceversa, il fatto che il campione sia centrato attorno ad un certo valore deve permetterci di prevedere in qualche modo la sua dispersione.

12.2 Verifiche basate sulla distribuzione del

12.2.1 Compatibilità dei dati con una distribuzione

Supponiamo di avere dei dati raccolti in un istogramma, e di voler verificare l’ipotesi che i dati provengano da una certa distribuzione; ad esempio, dalla distribuzione normale. Ora, per una misura, la probabilità di cadere nell’intervallo i-esimo (di ampiezza prefissata e corrispondente alla generica classe di frequenza usata per la realizzazione dell’istogramma) è data dal valore medio della funzione densità di probabilità nell’intervallo stesso moltiplicato per .

Il numero di misure effettivamente ottenute in una classe di frequenza su N prove deve obbedire poi alla distribuzione binomiale: il loro valore medio è quindi , e la loro varianza ; quest’ultimo termine si può approssimare ancora con se si ammette che le classi di frequenza siano sufficientemente ristrette da poter trascurare i termini in rispetto a quelli in (cioè se ).

In questo caso il numero di misure in ciascuna classe segue approssimativamente la distribuzione di Poisson; questa è infatti la funzione di frequenza che governa il presentarsi, su un grande numero di osservazioni, di eventi aventi probabilità trascurabile di verificarsi singolarmente in ognuna: distribuzione nella quale l’errore quadratico medio è effettivamente dato dalla radice quadrata del valore medio, .

Nei limiti in cui il numero di misure attese in una classe è sufficientemente elevato da poter confondere la relativa funzione di distribuzione con