Przedział wiarygodności

Przedział wiarygodności (albo przedział wiarogodności[1]) – przedział używany do scharakteryzowania rozkładu prawdopodobieństwa stosowany w statystyce bayesowskiej. Przedział wiarygodności wyznacza się tak, żeby nieobserwowana wprost wartość parametru mieściła się w nim z określonym prawdopodobieństwem. Na przykład jeżeli na podstawie eksperymentu mającego na celu określenie rozkładu możliwych wartości parametru stwierdzimy, że prawdopodobieństwo, iż leży pomiędzy 35 a 45, wynosi 0,95, to będzie 95-procentowym przedziałem wiarygodności.

Przykład 90-procentowego przedziału wiarygodności o najwyższej gęstości dla niesymetrycznego rozkładu a posteriori.

Za pomocą przedziałów wiarygodności zwykle charakteryzuje się rozkłady prawdopodobieństwa a posteriori lub predykcyjne rozkłady prawdopodobieństwa[2]. Uogólnieniem przedziału wiarygodności na problemy wielowymiarowe jest region wiarygodności.

Przedziały wiarygodności są bayesowskim odpowiednikiem przedziałów ufności stosowanych w ramach wnioskowania częstościowego[3]. Obie koncepcje wywodzą się z różnych filozofii[4]: w przypadku przedziałów bayesowskich krańce przedziałów trakuje się jako stałe, a szacowany parametr jako zmienną losową, podczas gdy w przypadku częstościowych przedziałów ufności stałą jest szacowany parametr, zaś krańce są zmiennymi losowymi. Ponadto bayesowskie przedziały wiarygodności korzystają z wiedzy na temat rozkładu a priori właściwego w danym kontekście (a nawet wymagają założenia takiego rozkładu), podczas gdy częstościowe przedziały nie korzystają z takiego założenia.

Wybór przedziału wiarygodności

edytuj

Przedziały wiarygodności nie są unikalne. Dla danego rozkładu a posteriori można wyznaczyć niekończoną liczbę 95-procentowych przedziałów wiarygodności. Istnieje w związku z tym wiele metod definiowania odpowiedniego przedziału wiarygodności:

  • Wybór najwęższego przedziału. W przypadku rozkładu jednomodalnego przedział ten będzie obejmował dominantę (maksimum a posteriori). Taki przedział nazywany jest czasem przedziałem o najwyższej gęstości a posteriori (ang. highest posterior density interval, HPDI).
  • Wybór przedziału, w przypadku którego prawdopodobieństwo znalezienia się poniżej dolnego krańca przedziału jest tak samo, jak prawdopodobieństwo znalezienia się powyżej górnego krańca. Przedział ten będzie obejmował medianę. Taki przedział nazywa się czasem przedziałem o równych ogonach (ang. equal-tailed interval).
  • Jeżeli średnia (wartość oczekiwana) rozkładu a posteriori istnieje, można wybrać przedział, dla którego średnia jest punktem centralnym.

W przypadku problemów wielowymiarowych obszar wiarygodności o najwyżej gęstości a posteriori jest ograniczony odpowiednią linią konturową gęstości prawdopodobieństwa[5].

Przypisy

edytuj
  1. Roman J. Nowak, Statystyka dla fizyków, Warszawa: Wydaw. Naukowe PWN, 2002, s. 527, ISBN 978-83-01-13702-1 [dostęp 2024-02-18].
  2. Ward Edwards. Bayesian statistical inference in psychological research. „Psychological Review”. 70 (3), s. 193-242, 1963. DOI: 10.1037/h0044139. 
  3. Lee, P.M. (1997) Bayesian Statistics: An Introduction, Arnold. ISBN 0-340-67785-6
  4. Jake VanderPlas: Frequentism and Bayesianism III: Confidence, Credibility, and why Frequentism and Science do not Mix | Pythonic Perambulations. jakevdp.github.io.
  5. O'Hagan, A. (1994) Kendall's Advanced Theory of Statistics, Vol 2B, Bayesian Inference, Section 2.51. Arnold, ISBN 0-340-52922-9