Pagina:Teoria degli errori e fondamenti di statistica.djvu/219

Questa pagina è stata trascritta, formattata e riletta.

12.2 - Verifiche basate sulla distribuzione del χ²

203

solamente da N; non dipende, in particolare, dalla media del campione ${\bar {x}}$ . Quindi:

Il valore medio ${\bar {x}}$ e la varianza campionaria $s^{2}$ , calcolati su valori estratti a caso da una stessa popolazione normale, sono due variabili casuali statisticamente indipendenti tra loro.

Questo risulta anche intuitivamente comprensibile; se infatti ci è noto che un certo campione di dati ha una dispersione più o meno grande, questo non deve alterare la probabilità che il suo valore medio abbia un valore piuttosto che un altro; né, viceversa, il fatto che il campione sia centrato attorno ad un certo valore deve permetterci di prevedere in qualche modo la sua dispersione.

12.2 Verifiche basate sulla distribuzione del $\chi ^{2}$

12.2.1 Compatibilità dei dati con una distribuzione

Supponiamo di avere dei dati raccolti in un istogramma, e di voler verificare l’ipotesi che i dati provengano da una certa distribuzione; ad esempio, dalla distribuzione normale. Ora, per una misura, la probabilità $p_{i}$ di cadere nell’intervallo i-esimo (di ampiezza prefissata $\Delta x$ e corrispondente alla generica classe di frequenza usata per la realizzazione dell’istogramma) è data dal valore medio della funzione densità di probabilità nell’intervallo stesso moltiplicato per $\Delta x$ .

Il numero di misure effettivamente ottenute in una classe di frequenza su N prove deve obbedire poi alla distribuzione binomiale: il loro valore medio è quindi $N\,p_{i}$ , e la loro varianza $N\,p_{i}(1-p_{i})$ ; quest’ultimo termine si può approssimare ancora con $N\,p_{i}$ se si ammette che le classi di frequenza siano sufficientemente ristrette da poter trascurare i termini in $p_{i}^{2}$ rispetto a quelli in $p_{i}$ (cioè se $p_{i}\ll 1$ ).

In questo caso il numero di misure in ciascuna classe segue approssimativamente la distribuzione di Poisson; questa è infatti la funzione di frequenza che governa il presentarsi, su un grande numero di osservazioni, di eventi aventi probabilità trascurabile di verificarsi singolarmente in ognuna: distribuzione nella quale l’errore quadratico medio è effettivamente dato dalla radice quadrata del valore medio, $\sigma ={\sqrt {N\,p_{i}(1-p_{i})}}\simeq {\sqrt {N\,p_{i}}}$ .

Nei limiti in cui il numero di misure attese in una classe è sufficientemente elevato da poter confondere la relativa funzione di distribuzione con