<dc:title> Teoria degli errori e fondamenti di statistica </dc:title><dc:creator opt:role="aut">Maurizio Loreti</dc:creator><dc:date>2006</dc:date><dc:subject></dc:subject><dc:rights>CC BY-SA 3.0</dc:rights><dc:rights>GFDL</dc:rights><dc:relation>Indice:Teoria_degli_errori_e_fondamenti_di_statistica.djvu</dc:relation><dc:identifier>//it.wikisource.org/w/index.php?title=Teoria_degli_errori_e_fondamenti_di_statistica/13.4&oldid=-</dc:identifier><dc:revisiondatestamp>20220902072441</dc:revisiondatestamp>//it.wikisource.org/w/index.php?title=Teoria_degli_errori_e_fondamenti_di_statistica/13.4&oldid=-20220902072441
Teoria degli errori e fondamenti di statistica - 13.4 Il rapporto delle massime verosimiglianze Maurizio LoretiTeoria degli errori e fondamenti di statistica.djvu
Nel caso generale in cui sia l'ipotesi nulla che quella alternativa siano composte, la situazione è più complicata: non esiste normalmente un test di massima potenza uniforme, e, tra i vari criteri possibili per decidere tra le due ipotesi, bisogna capire quali abbiano caratteristiche (significanza e potenza) adeguate; un metodo adatto a costruire una regione di rigetto dotata asintoticamente (per grandi campioni) di caratteristiche, appunto, desiderabili, è quello seguente (metodo del rapporto delle massime verosimiglianze).
[p. 236modifica]
Sia una variabile casuale , la cui densità di probabilità supponiamo sia una funzione dipendente da parametri: indicando sinteticamente la -pla dei valori dei parametri come un vettore in uno spazio a
dimensioni (spazio dei parametri), consista
nell'essere compreso all'interno di una certa regione di tale spazio; mentre consista nell'appartenere alla regione complementare a : , così che coincida con l'intero spazio dei parametri .
In particolare, può estendersi, in alcune delle dimensioni dello spazio dei parametri, da a
; e, in tal caso, il vincolo sulle cui corrisponde l'ipotesi nulla riguarderà un numero di parametri minore di .
Scritta la funzione di verosimiglianza,
(13.8)
indichiamo con il suo massimo valore nell'intero spazio dei parametri; e con il massimo valore assunto sempre della (13.8), ma con i parametri vincolati a trovarsi nella regione (quindi limitatamente a quei casi nei quali è vera). Il rapporto
(13.9)
deve essere un numero appartenente all'intervallo ; se si fissa un arbitrario valore (), esso definisce una generica regione di rigetto, , attraverso la
(ovvero si accetta quando e la si rigetta quando ). Nel caso si sappia determinare la densità di probabilità di
condizionata all'assunzione che sia vera, , la probabilità di un errore di prima specie è data ovviamente da
.
L'importanza del metodo sta nel fatto che si può dimostrare il seguente
Teorema:se l'ipotesi nulla consiste nell'appartenenza di un insieme di dei parametri ad una determinata regione , e se l'ipotesi alternativa consiste nel fatto che essi non vi appartengano (), allora , ove è definito dalla(13.9), ha densità di probabilità che, ammessa vera l'ipotesi nulla, converge in probabilità (all'aumentare di ) alla distribuzione del a gradi di libertà.[p. 237modifica]che, dicendoci quale è (almeno nel limite di grandi campioni) la forma di , ci mette comunque in grado di calcolare la significanza del test.
Illustriamo il metodo con un esempio: disponendo ancora di un campione di determinazioni indipendenti, provenienti da una popolazione normale di varianza nota, vogliamo applicarlo per discriminare tra l’ipotesi nulla che il valore medio abbia valore 0 () e quella che esso abbia valore differente ().
Il logaritmo della funzione di verosimiglianza è ancora dato dalla (13.1); e già sappiamo, dal paragrafo 11.3, che assume il suo massimo valore quando , per cui
e la regione di rigetto è definita dalla ; ovvero (ricordando che ) da
e, posto
si accetterà se (e la si rigetterà se ).
In questo caso il teorema precedentemente citato afferma che
è distribuito asintoticamente come il ad un grado di libertà (cosa che del resto già sapevamo, vista l’espressione di ); per cui, indicando [p. 238modifica]con la densità di probabilità della distribuzione del a gradi di libertà, avremo
della quale ci possiamo servire per ricavare se vogliamo che la significanza del test abbia un certo valore: ad esempio un livello di confidenza del 95% corrisponde ad e, dalle tabelle della distribuzione del , ricaviamo
e quindi
.
Anche senza dover ricorrere al teorema sul comportamento asintotico di , allo stesso risultato si può pervenire per altra via: in questo caso si conosce infatti esattamente , che vale
e, dalle tabelle della distribuzione normale standardizzata, si ricava che un'area two-tailed del 5% corrisponde ad un valore assoluto dello scarto normalizzato ; per cui, ancora, si ricaverebbe come test per un livello di confidenza del 95%.