Przedział wiarygodności

Przedział wiarygodności (albo przedział wiarogodności^[1]) – przedział używany do scharakteryzowania rozkładu prawdopodobieństwa stosowany w statystyce bayesowskiej. Przedział wiarygodności wyznacza się tak, żeby nieobserwowana wprost wartość parametru mieściła się w nim z określonym prawdopodobieństwem. Na przykład jeżeli na podstawie eksperymentu mającego na celu określenie rozkładu możliwych wartości parametru $\mu$ stwierdzimy, że prawdopodobieństwo, iż $\mu$ leży pomiędzy 35 a 45, wynosi 0,95, to $35\leq \mu \leq 45$ będzie 95-procentowym przedziałem wiarygodności.

Za pomocą przedziałów wiarygodności zwykle charakteryzuje się rozkłady prawdopodobieństwa a posteriori lub predykcyjne rozkłady prawdopodobieństwa^[2]. Uogólnieniem przedziału wiarygodności na problemy wielowymiarowe jest region wiarygodności.

Przedziały wiarygodności są bayesowskim odpowiednikiem przedziałów ufności stosowanych w ramach wnioskowania częstościowego^[3]. Obie koncepcje wywodzą się z różnych filozofii^[4]: w przypadku przedziałów bayesowskich krańce przedziałów trakuje się jako stałe, a szacowany parametr jako zmienną losową, podczas gdy w przypadku częstościowych przedziałów ufności stałą jest szacowany parametr, zaś krańce są zmiennymi losowymi. Ponadto bayesowskie przedziały wiarygodności korzystają z wiedzy na temat rozkładu a priori właściwego w danym kontekście (a nawet wymagają założenia takiego rozkładu), podczas gdy częstościowe przedziały nie korzystają z takiego założenia.

Wybór przedziału wiarygodności

Przedziały wiarygodności nie są unikalne. Dla danego rozkładu a posteriori można wyznaczyć niekończoną liczbę 95-procentowych przedziałów wiarygodności. Istnieje w związku z tym wiele metod definiowania odpowiedniego przedziału wiarygodności:

Wybór najwęższego przedziału. W przypadku rozkładu jednomodalnego przedział ten będzie obejmował dominantę (maksimum a posteriori). Taki przedział nazywany jest czasem przedziałem o najwyższej gęstości a posteriori (ang. highest posterior density interval, HPDI).
Wybór przedziału, w przypadku którego prawdopodobieństwo znalezienia się poniżej dolnego krańca przedziału jest tak samo, jak prawdopodobieństwo znalezienia się powyżej górnego krańca. Przedział ten będzie obejmował medianę. Taki przedział nazywa się czasem przedziałem o równych ogonach (ang. equal-tailed interval).
Jeżeli średnia (wartość oczekiwana) rozkładu a posteriori istnieje, można wybrać przedział, dla którego średnia jest punktem centralnym.

W przypadku problemów wielowymiarowych obszar wiarygodności o najwyżej gęstości a posteriori jest ograniczony odpowiednią linią konturową gęstości prawdopodobieństwa^[5].

Przypisy

↑ Roman J.R.J. Nowak Roman J.R.J., Statystyka dla fizyków, Warszawa: Wydaw. Naukowe PWN, 2002, s. 527, ISBN 978-83-01-13702-1 [dostęp 2024-02-18] .
↑ Ward Edwards. Bayesian statistical inference in psychological research. „Psychological Review”. 70 (3), s. 193-242, 1963. DOI: 10.1037/h0044139.
↑ Lee, P.M. (1997) Bayesian Statistics: An Introduction, Arnold. ISBN 0-340-67785-6
↑ Jake VanderPlas: Frequentism and Bayesianism III: Confidence, Credibility, and why Frequentism and Science do not Mix | Pythonic Perambulations. jakevdp.github.io.
↑ O'Hagan, A. (1994) Kendall's Advanced Theory of Statistics, Vol 2B, Bayesian Inference, Section 2.51. Arnold, ISBN 0-340-52922-9

[Nowak-1] Roman J.R.J. Nowak Roman J.R.J., Statystyka dla fizyków, Warszawa: Wydaw. Naukowe PWN, 2002, s. 527, ISBN 978-83-01-13702-1 [dostęp 2024-02-18] .

[2] Ward Edwards. Bayesian statistical inference in psychological research. „Psychological Review”. 70 (3), s. 193-242, 1963. DOI: 10.1037/h0044139.

[3] Lee, P.M. (1997) Bayesian Statistics: An Introduction, Arnold. ISBN 0-340-67785-6

[VanderPlas2014-4] Jake VanderPlas: Frequentism and Bayesianism III: Confidence, Credibility, and why Frequentism and Science do not Mix | Pythonic Perambulations. jakevdp.github.io.

[5] O'Hagan, A. (1994) Kendall's Advanced Theory of Statistics, Vol 2B, Bayesian Inference, Section 2.51. Arnold, ISBN 0-340-52922-9

[1]

[2]

[3]

[4]

[5]