Poprawka Bessela – stosowanie zamiast surowej liczby obserwacji przy statystycznej estymacji wariancji populacji na podstawie próby. Poprawka redukuje obciążenie tego estymatora (systematyczne niedoszacowanie wariancji) wynikające z jednoczesnego szacowania wariancji i średniej ze skończonej próby. Ma znaczenie zwłaszcza przy próbach poniżej ok. 30 obserwacji[1][2]. Jej zwyczajowa nazwa odwołuje się do astronoma Friedricha W. Bessela; technikę opisał w tym samym okresie jednak także Carl Gauss[3].

Dwuwymiarowy wykres punktowy przedstawiający setki symulacji prób, oraz dopasowane do ich rozkładów linie. Błąd oszacowania z poprawką jest, niezależnie od rozmiaru próby, znacznie bliższy zera.
Błąd oszacowania wariancji (na osi Y) z poprawką i bez (kolor czarny i żółty), w zależności od wielkości próby (na osi X) – ilustrowany na podstawie stu symulacji losowań z rozkładu normalnego (μ=0, σ²=1) dla każdego n. Średni błąd oszacowania z poprawką jest równy zeru. Błąd estymatora bez poprawki jest szczególnie silny w próbach mniejszych niż ok. 30 obserwacji.

Poprawka nie jest potrzebna, jeśli do obliczeń wykorzystuje się prawdziwą średnią populacyjną. Jeśli dane nie pochodzą z rozkładu normalnego, poprawka może być nieskuteczna i zwiększać błąd średniokwadratowy estymatora[4]. Nie zapewnia nieobciążenia oszacowania odchylenia standardowego. Inne momenty rozkładu (jak skośność i kurtoza) także wymagają poprawek, jednak jest to bardziej skomplikowane.

Dowód edytuj

Oczekiwana rozbieżność pomiędzy obciążonym estymatorem wariancji z próby, a jej prawdziwą wartością w populacji, odpowiada wariancji średniej z próby:

 

I analogicznie, oczekiwana wartość obciążonego estymatora to prawdziwa wartość wariancji pomniejszona o tę rozbieżność:

 

Co pozwala uzyskać następujący wzór na estymator nieobciążony:

 

Intuicja edytuj

Estymator obciążony jest obliczany przy użyciu średniej z próby, co wprowadza dodatkowe źródło błędu – każde odchylenie obserwacji,   jest niedoszacowane o odchylenie średniej z próby od średniej z populacji,   Wariancja jej estymatora wynosi   Poprawka Bessela usuwa to systematyczne obciążenie.

Przypisy edytuj

  1. Robert Mackiewicz, Liczby nie wiedzą, skąd pochodzą: przewodnik po metodologii i statystyce. Nie tylko dla psychologów, Lublin: Wyd. KUL, 2005, s. 222 i następne, ISBN 83-7363-326-X, OCLC 137311630 [dostęp 2019-03-15].
  2. Dodatek VIII: Analiza wariancji, [w:] William John Reichmann, Drogi i bezdroża statystyki, Państwowe Wydawnictwo Naukowe, 1968.
  3. John Francis Kenney, Ernest Sydney Keeping, Mathematics of Statistics: Part Two, wyd. 2, D. van Nostrand Company, Inc., 1951, s. 161, Cytat: „This factor is sometimes called Bessel’s correction. Perhaps it should be attributed more appropriately to Gauss who made use of it, in this connection, as early as 1823.”.
  4. Michael Hardy, An Illuminating Counterexample, „The American Mathematical Monthly”, 110 (3), 2003, s. 234–238, DOI10.1080/00029890.2003.11919960, ISSN 0002-9890 [dostęp 2019-03-15].