Varianza e sqm (o deviaz. standard)
Ricordo che c'era qualcuno che chiedeva come mai la varianza (o meglio la
devianza) campionaria doveva essere divisa per n-1 anzich� per n, e a questo
proposito seguivano svariate risposte, anche molto complesse, e raffinate
elucubrazioni in merito; la risposta � molto semplice:
Se ci poniamo nell'universo bernoulliano, ma il ragionamento si pu�
estendere a quello esaustivo e a quello in blocco, si pu� dimostrare
facilmente che il valore atteso della varianza campionaria s^2 � proprio
Var(X) * (n-1)/n
dove Var(X) � la varianza del carattere quantitativo X nella popolazione
oggetto di studio
Lo stimatore "varianza campionaria" � dunque distorto o non corretto; gode
della propriet� di correttezza solo asintoticamente, ma ci� spesso non � di
grande utilit� nello studio di popolazioni finite.
Notiamo invece che
E( s^2 * n/n-1) = Var(X)
La variabile campionaria S^2 = (s^2 * n/n-1) � dunque uno stimatore corretto
per la varianza della popolazione;
per ottenerla dovremo pertanto calcolare la devianza campionaria (cio� la
somma dei quadrati degli scarti dalla media campionaria) e dividerla per n-1
anzich�, come verrebbe spontaneo data la definizione di media aritmetica,
per n.
Esiste un ragionamento analogo nell'inferenza statistica multivariata, dove
si fa un uso pesante di vettori e matrici, allorch� parlando di stimatori
corretti e lineari, ottenuti col teorema di Gauss-Markov e il metodo dei
minimi quadrati, si dimostra che uno stimatore non distorto di sigma quadro
si ottiene dividendo una certa quantit� S(beta stimato) per (n-p), dove n �
il numero di osservazioni condotte su ciascuna delle p variabili
indipendenti X j con le quali si vuole spiegare il comportamento della
variabile dipendente Y mediante il vettore beta di coefficienti di
combinazione lineare.
Spero di essere stato sufficientemente chiaro...Ciao a tutte e a tutti.
Paolo.
Received on Thu Jan 09 2003 - 16:00:51 CET
This archive was generated by hypermail 2.3.0
: Mon Jan 20 2025 - 04:23:11 CET