Poprawka Bessela

Poprawka Bessela – stosowanie $n-1$ zamiast surowej liczby obserwacji $n$ przy statystycznej estymacji wariancji populacji na podstawie próby. Poprawka redukuje obciążenie tego estymatora (systematyczne niedoszacowanie wariancji) wynikające z jednoczesnego szacowania wariancji i średniej ze skończonej próby. Ma znaczenie zwłaszcza przy próbach poniżej ok. 30 obserwacji^[1]^[2]. Jej zwyczajowa nazwa odwołuje się do astronoma Friedricha W. Bessela; technikę opisał w tym samym okresie jednak także Carl Gauss^[3].

Poprawka nie jest potrzebna, jeśli do obliczeń wykorzystuje się prawdziwą średnią populacyjną. Jeśli dane nie pochodzą z rozkładu normalnego, poprawka może być nieskuteczna i zwiększać błąd średniokwadratowy estymatora^[4]. Nie zapewnia nieobciążenia oszacowania odchylenia standardowego. Inne momenty rozkładu (jak skośność i kurtoza) także wymagają poprawek, jednak jest to bardziej skomplikowane.

Dowód edytuj

Oczekiwana rozbieżność pomiędzy obciążonym estymatorem wariancji z próby, a jej prawdziwą wartością w populacji, odpowiada wariancji średniej z próby:

{\begin{aligned}\operatorname {E} \left[\sigma ^{2}-s_{\text{obc.}}^{2}\right]&=\operatorname {E} \left[{\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-\mu )^{2}-{\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}\right]\\&={\frac {1}{n}}\operatorname {E} \left[\sum _{i=1}^{n}\left((x_{i}^{2}-2x_{i}\mu +\mu ^{2})-(x_{i}^{2}-2x_{i}{\overline {x}}+{\overline {x}}^{2})\right)\right]\\&=\operatorname {E} \left[\mu ^{2}-{\overline {x}}^{2}+{\frac {1}{n}}\sum _{i=1}^{n}(2x_{i}({\overline {x}}-\mu ))\right]\\&=\operatorname {E} \left[\mu ^{2}-{\overline {x}}^{2}+2({\overline {x}}-\mu ){\overline {x}}\right]\\&=\operatorname {E} \left[\mu ^{2}-2{\overline {x}}\mu +{\overline {x}}^{2}\right]\\&=\operatorname {E} \left[({\overline {x}}-\mu )^{2}\right]\\&=\operatorname {Var} ({\overline {x}})\\&={\frac {\sigma ^{2}}{n}}\end{aligned}}

I analogicznie, oczekiwana wartość obciążonego estymatora to prawdziwa wartość wariancji pomniejszona o tę rozbieżność:

\operatorname {E} \left[s_{\text{obc.}}^{2}\right]=\sigma ^{2}-{\frac {\sigma ^{2}}{n}}={\frac {n-1}{n}}\sigma ^{2}

Co pozwala uzyskać następujący wzór na estymator nieobciążony:

s_{\text{nieobc.}}^{2}={\frac {n}{n-1}}s_{\text{obc.}}^{2}

Intuicja edytuj

Estymator obciążony jest obliczany przy użyciu średniej z próby, co wprowadza dodatkowe źródło błędu – każde odchylenie obserwacji, $x_{i}-\mu ,$ jest niedoszacowane o odchylenie średniej z próby od średniej z populacji, ${\bar {x}}-\mu .$ Wariancja jej estymatora wynosi ${\frac {\sigma ^{2}}{n}}.$ Poprawka Bessela usuwa to systematyczne obciążenie.

Przypisy edytuj

↑ RobertR. Mackiewicz RobertR., Liczby nie wiedzą, skąd pochodzą: przewodnik po metodologii i statystyce. Nie tylko dla psychologów, Lublin: Wyd. KUL, 2005, s. 222 i następne, ISBN 83-7363-326-X, OCLC 137311630 [dostęp 2019-03-15] .
↑ Dodatek VIII: Analiza wariancji, [w:] William JohnW.J. Reichmann William JohnW.J., Drogi i bezdroża statystyki, Państwowe Wydawnictwo Naukowe, 1968 .
↑ John FrancisJ.F. Kenney John FrancisJ.F., Ernest SydneyE.S. Keeping Ernest SydneyE.S., Mathematics of Statistics: Part Two, wyd. 2, D. van Nostrand Company, Inc., 1951, s. 161, Cytat: „This factor is sometimes called Bessel’s correction. Perhaps it should be attributed more appropriately to Gauss who made use of it, in this connection, as early as 1823.” .
↑ MichaelM. Hardy MichaelM., An Illuminating Counterexample, „The American Mathematical Monthly”, 110 (3), 2003, s. 234–238, DOI: 10.1080/00029890.2003.11919960, ISSN 0002-9890 [dostęp 2019-03-15] .

[1] RobertR. Mackiewicz RobertR., Liczby nie wiedzą, skąd pochodzą: przewodnik po metodologii i statystyce. Nie tylko dla psychologów, Lublin: Wyd. KUL, 2005, s. 222 i następne, ISBN 83-7363-326-X, OCLC 137311630 [dostęp 2019-03-15] .

[2] Dodatek VIII: Analiza wariancji, [w:] William JohnW.J. Reichmann William JohnW.J., Drogi i bezdroża statystyki, Państwowe Wydawnictwo Naukowe, 1968 .

[3] John FrancisJ.F. Kenney John FrancisJ.F., Ernest SydneyE.S. Keeping Ernest SydneyE.S., Mathematics of Statistics: Part Two, wyd. 2, D. van Nostrand Company, Inc., 1951, s. 161, Cytat: „This factor is sometimes called Bessel’s correction. Perhaps it should be attributed more appropriately to Gauss who made use of it, in this connection, as early as 1823.” .

[4] MichaelM. Hardy MichaelM., An Illuminating Counterexample, „The American Mathematical Monthly”, 110 (3), 2003, s. 234–238, DOI: 10.1080/00029890.2003.11919960, ISSN 0002-9890 [dostęp 2019-03-15] .

[1]

[2]

[3]

[4]