Teoria degli errori e fondamenti di statistica/D

D Il modello di Laplace e la funzione di Gauss

../C.5 ../E IncludiIntestazione 4 settembre 2022 100% Da definire

C.5 E
[p. 277 modifica]

Appendice D

Il modello di Laplace e la funzione di Gauss



Pensiamo di eseguire una misura di una grandezza fisica (il cui valore vero indicheremo con il simbolo ), e sia il risultato ottenuto; in generale è diverso da per la presenza degli errori di misura, che supporremo siano di natura puramente casuale.

Questi errori casuali di misura possono essere schematizzati come un insieme estremamente grande, al limite infinito, di disturbi contemporanei molto piccoli, al limite infinitesimi, ognuno dei quali tende ad alterare di pochissimo il risultato della misura; si considerino in particolare le seguenti ipotesi (modello semplificato di Laplace1 per gli errori di misura):

  1. Ognuna delle singole cause di disturbo presenti introdurrà nella misura una variazione rispetto al valore vero di modulo fisso , con uguale probabilità in difetto o in eccesso.
  2. Ognuna delle variazioni nella misura dovute a queste cause di disturbo è statisticamente indipendente dalle altre. [p. 278 modifica]

Ognuna delle cause indipendenti di disturbo produce quindi la variazione con probabilità oppure con probabilità ; se tra le perturbazioni sono positive (e le altre negative), il valore osservato sarà

.

La probabilità di un dato valore di sulle prove è data dalla distribuzione binomiale (vedi il paragrafo 8.4, ed in particolare l’equazione (8.7)), e vale

.

Il valore medio di è dato da , e la sua varianza da ; indichiamo poi con il simbolo lo scarto di dal suo valore medio

.

In corrispondenza al variare di tra 0 ed , varia tra i limiti e ; risulta poi anche

e la probabilità di ottenere un certo valore di su prove vale

.

Valore medio e varianza di valgono poi

e

.

L’andamento generale della probabilità in funzione di si può trovare considerando il rapporto tra i valori di che corrispondono a due valori successivi di :

=
[p. 279 modifica]e risulterà minore, uguale o maggiore di a seconda che risulti minore, uguale o maggiore di ; ossia, essendo , a seconda che sia minore, uguale o maggiore di .

Insomma, chiamato il più piccolo intero non minore di , la sequenza di valori è crescente, mentre quella dei valori è decrescente. Il massimo valore della probabilità si ha in corrispondenza ad un intero che soddisfi la

e che è unico, salvo il caso che i due estremi dell’intervallo siano entrambi numeri interi: in questo caso si hanno due valori massimi, uguali, in corrispondenza di entrambi. Concludendo: il caso più probabile è che l’evento si presenti in una sequenza di prove volte, ed il valore di con la massima probabilità di presentarsi è 0.

Cerchiamo ora di determinare se esiste e quanto vale il limite della probabilità di ottenere un certo risultato al crescere indefinito del numero delle prove. Per ottenere questo, introduciamo la formula approssimata di de Moivre e Stirling2 per il fattoriale:

con

.

È lecito trascurare il resto quando l’argomento del fattoriale è elevato: per l’errore commesso è già inferiore all’1%. Per usare la formula di de Moivre e Stirling nel nostro caso, sviluppiamo

e, similmente,

.

[p. 280 modifica]

Queste approssimazioni sono valide quando gli argomenti dei fattoriali, e , sono abbastanza grandi: cioè quando non è vicino ai valori limite e ; accettata la loro validità (e ritorneremo su questo punto tra poco), sostituendo si ha

.

Questa espressione è certamente valida quando non è troppo grande, e per fornisce la probabilità del valore medio di (), che risulta

.

Questa probabilità tende a zero come al crescere di ; dato che la somma delle probabilità relative a tutti i casi possibili deve essere 1, si deve concludere che il numero di valori di per cui la probabilità non è trascurabile rispetto al suo massimo deve divergere come al crescere di , sebbene il numero di tutti i possibili valori (che è ) diverga invece come .

L’espressione approssimata di non è valida per valori di prossimi agli estremi e (è infatti divergente); tuttavia tali valori hanno probabilità infinitesime di presentarsi al crescere di . Infatti e , ed entrambi tendono a zero quando tende all’infinito essendo sia che inferiori all’unità.

Concludendo: la formula approssimata da noi ricavata è valida già per valori relativamente piccoli di , e per molto grande si può ritenere esatta per tutti i valori dello scarto con probabilità non trascurabile di presentarsi, valori che sono mediamente dell’ordine dell’errore quadratico medio e che quindi divergono solo come . Consideriamo ora il fattore

che nell’espressione approssimata di moltiplica il valore massimo , e se ne prenda il logaritmo naturale:

Ora, poiché sia che sono in modulo minori dell’unità (salvi i due casi estremi, di probabilità come sappiamo infinitesima), si possono [p. 281 modifica]sviluppare i due logaritmi in serie di McLaurin:

.

Il primo termine di diventa

ed il secondo

e sommando si ottiene

.

Da questo sviluppo risulta che il solo termine che si mantiene finito al divergere di , e per valori di dell’ordine di , è il primo; gli altri due scritti convergono a zero come , e tutti gli altri omessi almeno come . In conclusione, per valori dello scarto per cui la probabilità non è trascurabile (grosso modo ), al divergere di il logaritmo di è bene approssimato da

e la probabilità dello scarto dalla media da

;

per la variabile sarà invece

[p. 282 modifica]

Nel caso particolare del modello semplificato di Laplace per gli errori di misura, e pertanto i termini di ordine sono identicamente nulli: l’approssimazione è già buona per ; nel caso generale , essa è invece accettabile per . Introducendo lo scarto quadratico medio di e di

l’espressione si può scrivere

che è la celebre legge normale o legge di Gauss.

Tornando ancora al modello semplificato di Laplace per gli errori di misura, il risultato ha uno scarto dal valore vero che vale

e possiede varianza

.

La probabilità di un certo risultato vale infine

.

La è una grandezza discreta che varia per multipli di ; nel limite su accennato diventa una variabile continua, e è infinitesima con perdendo così significato; si mantiene invece finita la densità di probabilità, che si ottiene dividendo per l’ampiezza dell’intervallo che separa due valori contigui di :

ed ha infatti le dimensioni fisiche di , ovvero di .

Al medesimo risultato per si perverrebbe anche nell’ipotesi più generale che gli errori elementari siano distribuiti comunque, ed anche diversamente l’uno dall’altro, purché ciascuno abbia una varianza dello stesso ordine di grandezza degli altri ed infinitesima al divergere del numero delle cause di errore.

Note

  1. Pierre Simon de Laplace visse in Francia dal 1749 al 1827; famoso matematico, fisico ed astronomo, provò la stabilità del sistema solare, sviluppò la teoria delle equazioni differenziali e dei potenziali, contribuì allo studio del calore e dei fenomeni capillari oltre a gettare le basi matematiche per una teoria dell’elettromagnetismo. Durante la rivoluzione francese fu uno degli ideatori del sistema metrico decimale; per quel che riguarda la statistica, nel 1812 pubblicò il trattato “Théorie Analytique des Probabilités” che contiene, tra l’altro, studi sulla distribuzione normale e la derivazione della regola dei minimi quadrati.
  2. Per la dimostrazione, vedi ad esempio: G. Castelnuovo — Calcolo delle probabilità (Zanichelli), in appendice. La formula è dovuta al solo Stirling, che la pubblicò nel suo libro “Methodus Differentialis” del 1730; ma non divenne nota nel mondo scientifico fino a quando de Moivre non la usò — da qui il nome comunemente adottato.