Teoria degli errori e fondamenti di statistica/13.4

13.4 Il rapporto delle massime verosimiglianze

../13.3 ../13.5 IncludiIntestazione 2 settembre 2022 100% Da definire

13.3 13.5

[p. 235 modifica]

13.4 Il rapporto delle massime verosimiglianze

Nel caso generale in cui sia l'ipotesi nulla che quella alternativa siano composte, la situazione è più complicata: non esiste normalmente un test di massima potenza uniforme, e, tra i vari criteri possibili per decidere tra le due ipotesi, bisogna capire quali abbiano caratteristiche (significanza e potenza) adeguate; un metodo adatto a costruire una regione di rigetto dotata asintoticamente (per grandi campioni) di caratteristiche, appunto, desiderabili, è quello seguente (metodo del rapporto delle massime verosimiglianze). [p. 236 modifica]

Sia una variabile casuale , la cui densità di probabilità supponiamo sia una funzione dipendente da parametri: indicando sinteticamente la -pla dei valori dei parametri come un vettore in uno spazio a dimensioni (spazio dei parametri), consista nell'essere compreso all'interno di una certa regione di tale spazio; mentre consista nell'appartenere alla regione complementare a : , così che coincida con l'intero spazio dei parametri .

In particolare, può estendersi, in alcune delle dimensioni dello spazio dei parametri, da a ; e, in tal caso, il vincolo sulle cui corrisponde l'ipotesi nulla riguarderà un numero di parametri minore di .

Scritta la funzione di verosimiglianza,

(13.8)

indichiamo con il suo massimo valore nell'intero spazio dei parametri; e con il massimo valore assunto sempre della (13.8), ma con i parametri vincolati a trovarsi nella regione (quindi limitatamente a quei casi nei quali è vera). Il rapporto

(13.9)

deve essere un numero appartenente all'intervallo ; se si fissa un arbitrario valore (), esso definisce una generica regione di rigetto, , attraverso la

(ovvero si accetta quando e la si rigetta quando ). Nel caso si sappia determinare la densità di probabilità di condizionata all'assunzione che sia vera, , la probabilità di un errore di prima specie è data ovviamente da

.

L'importanza del metodo sta nel fatto che si può dimostrare il seguente

Teorema: se l'ipotesi nulla consiste nell'appartenenza di un insieme di dei parametri ad una determinata regione , e se l'ipotesi alternativa consiste nel fatto che essi non vi appartengano (), allora , ove è definito dalla (13.9), ha densità di probabilità che, ammessa vera l'ipotesi nulla, converge in probabilità (all'aumentare di ) alla distribuzione del a gradi di libertà. [p. 237 modifica]che, dicendoci quale è (almeno nel limite di grandi campioni) la forma di , ci mette comunque in grado di calcolare la significanza del test.

Illustriamo il metodo con un esempio: disponendo ancora di un campione di determinazioni indipendenti, provenienti da una popolazione normale di varianza nota, vogliamo applicarlo per discriminare tra l’ipotesi nulla che il valore medio abbia valore 0 () e quella che esso abbia valore differente ().

Il logaritmo della funzione di verosimiglianza è ancora dato dalla (13.1); e già sappiamo, dal paragrafo 11.3, che assume il suo massimo valore quando , per cui

.

Inoltre si riduce ad un unico punto, ; per cui

.

Dalla (13.9) si ricava

e la regione di rigetto è definita dalla ; ovvero (ricordando che ) da

e, posto

si accetterà se (e la si rigetterà se ).

In questo caso il teorema precedentemente citato afferma che

è distribuito asintoticamente come il ad un grado di libertà (cosa che del resto già sapevamo, vista l’espressione di ); per cui, indicando [p. 238 modifica]con la densità di probabilità della distribuzione del a gradi di libertà, avremo

della quale ci possiamo servire per ricavare se vogliamo che la significanza del test abbia un certo valore: ad esempio un livello di confidenza del 95% corrisponde ad e, dalle tabelle della distribuzione del , ricaviamo

e quindi .

Anche senza dover ricorrere al teorema sul comportamento asintotico di , allo stesso risultato si può pervenire per altra via: in questo caso si conosce infatti esattamente , che vale

e, dalle tabelle della distribuzione normale standardizzata, si ricava che un'area two-tailed del 5% corrisponde ad un valore assoluto dello scarto normalizzato ; per cui, ancora, si ricaverebbe come test per un livello di confidenza del 95%.