Rozkład Dirichleta

Rozkład Dirichleta – rodzina wielowymiarowych ciągłych rozkładów prawdopodobieństwa, sparametryzowana z wykorzystaniem K-elementowego wektora dodatnich liczb rzeczywistych. Stanowi uogólnienie rozkładu beta dla zmiennej wielowymiarowej (wektora losowego).

Rozkład Dirichleta
Gęstość prawdopodobieństwa
Ilustracja
Kilka wykresów gęstości prawdopodobieństwa dla rozkładu Dirichleta, kiedy dla różnych parametrów wektorów Zgodnie z kierunkiem wskazówek zegara od górnego lewego: (6; 2; 2), (3; 7; 5), (6; 2; 6), (2; 3; 4).
Parametry

ilość kategorii (całkowitych)
parametry skupienia, gdzie

Nośnik

gdzie oraz

Gęstość prawdopodobieństwa


gdzie

Wartość oczekiwana (średnia)



gdzie to funcja digamma, czyli pochodna logarytmiczna funkcji gamma

Moda

Wariancja


gdzie

Entropia

Rozkład Dirichleta jest często wykorzystywany w statystyce bayesowskiej jako rozkład aprioryczny i faktycznie rozkład Dirichleta jest rozkładem sprzężonym rozkładu wielopunktowego i rozkładu wielomianowego. W efekcie funkcja rozkładu zwraca przekonanie, że prawdopodobieństwo możliwych zdarzeń losowych wynosi biorąc pod uwagę, że każde zdarzenie zostało zaobserwowane razy.

Wielowymiarowym uogólnieniem rozkładu Dirichleta jest proces Dirichleta.

Definicja formalna

edytuj
 
Wykres ilustruje jak zmienia się logarytm funkcji rozkładu kiedy   i zmieniany jest wektor   od  (0,3, 0,3, 0,3) do (2,0, 2,0, 2,0), zachowując wszystkie   równe sobie nawzajem.

Rozkład Dirichleta rzędu   z parametrami   ma funkcję rozkładu prawdopodobieństwa w mierze Lebesgue’a dla przestrzeni euklidesowej   określoną zależnością:

 

na otwartym zbiorze  -wymiarowego sympleksu określonego jako:

 

oraz zero poza.

Stałą normalizującą jest wielomianowa funkcja B, którą można wyrazić w zależności od funkcji gamma:

 

Nośnik

edytuj

Nośnikiem rozkładu Dirichleta jest zbiór  -wymiarowych wektorów   określonych liczbami rzeczywistymi w zakresie (0,1), tak więc   co znaczy, że suma wszystkich składowych jest 1. Mogą być one przedstawiane jako prawdopodobieństwa  -wymiarowego zdarzenia. Należy zauważyć, iż w praktyce zbiór punktów w nośnika dla  -wymiarowego rozkładu Dirichleta jest zamkniętym zbiorem  -sympleksów, znajdujących się w przestrzeni  -wymiarowej. Przykładowo dla   jest to trójkąt równoboczny zawarty w trójwymiarowej przestrzeni z wierzchołkami (1;0;0), (0;1;0) oraz (0;0;1), „dotykający” każdej z osi w odległości 1 od początku układu współrzędnych.

Zobacz też

edytuj

Linki zewnętrzne

edytuj