Wspólny rozkład prawdopodobieństwa

Wspólny rozkład prawdopodobieństwa (ang. joint probability distribution) – rodzaj rozkładu prawdopodobieństwa, który zmiennym losowym X, Y, .... przypisuje prawdopodobieństwo, iż zmienne X, Y, .... przyjmą określone wartości (ciągłe lub dyskretne, należące do specyficznych dla każdej z nich zbiorów wartości).

Czarne punkty uzyskane z pomiaru dwóch zmiennych losowych X, Y – większej gęstości punktów w pobliżu danego punktu (x, y) odpowiada większe wspólne prawdopodobieństwo, że X przyjmie wartość w pobliżu x, a Y w pobliżu y. Pokazano też rozkłady brzegowe P(X=x) oraz P(Y=y).

Jeśli mamy tylko dwie zmienne losowe, to rozkład nazywamy dwuwymiarowym, a dla większej liczby zmiennych losowych rozkład nazywamy wielowymiarowym.

Wspólny rozkład prawdopodobieństwa może zostać wyrażony także jako wspólna dystrybuanta, wspólna funkcja gęstości prawdopodobieństwa (w przypadku zmiennych ciągłych) lub wspólna funkcja masy prawdopodobieństwa (w przypadku zmiennych dyskretnych). Te z kolei mogą być wykorzystywane do znalezienia dwóch innych rodzajów rozkładów: rozkładu brzegowego (czyli rozkładu prawdopodobieństwa dla jakiejś jednej zmiennej losowej bez odniesienia do pozostałych zmiennych) oraz rozkładu warunkowego (czyli rozkładu prawdopodobieństwa dla wybranego podzbioru zmiennych losowych przy ustalonych wartościach pozostałych zmiennych).

Przykład edytuj

Pomyślmy, że toczymy kostką do gry i uznajmy, że A = 1, jeśli liczba jest parzysta (in. jeśli wytoczymy liczbę 2, 4 lub 6) oraz A = 0, jeśli liczba jest nieparzysta (in. jeśli wytoczymy liczbę 1, 3 lub 5). Ponadto rozważmy, że B = 1, jeśli wytoczymy liczbę pierwszą (czyli 2, 3, 5) oraz B = 0, jeśli wytoczymy inną liczbę.

1 2 3 4 5 6
A 0 1 0 1 0 1
B 0 1 1 0 1 0

Wtedy wspólny rozkład prawdopodobieństwa dla A i B, wyrażony jako funkcja masy prawdopodobieństwa, wynosi

 
 
 
 

Ważne rodzaje rozkładów edytuj

Nazwanymi wspólnymi rozkładami, powstającymi często w statystykach, są: wielowymiarowy rozkład normalny, wielowymiarowy rozkład stabilny, rozkład wielomianu, negatywny rozkład wielomianu, wielowymiarowy rozkład hipergeometryczny i rozkład eliptyczny.

Dystrybuanta edytuj

Wspólny rozkład prawdopodobieństwa dla pary zmiennych losowych może być wyrażona w terminie ich dystrybuanty:

 

Funkcja gęstości lub funkcja masy edytuj

Rozkłady dyskretne edytuj

Wspólna funkcja masy prawdopodobieństwa dla dwóch zmiennych losowych dyskretnych jest równa

 

Wspólny rozkład prawdopodobieństwa   zmiennych losowych dyskretnych   jest równy

 

Tożsamość ta jest znana jako reguła łańcucha prawdopodobieństwa.

Ponieważ są to prawdopodobieństwa, w przypadku dwóch zmiennych mamy

 

które uogólniają   zmiennych losowych dyskretnych   do

 

Rozkłady ciągłe edytuj

Wspólna funkcja gęstości prawdopodobieństwa   dla zmiennych losowych ciągłych wynosi

 

gdzie   i   dają rozkład warunkowy, gdzie   równa się   a   równa się   natomiast   i   dają rozkład brzegowy odpowiednio dla   i  

Ponieważ są to rozkłady prawdopodobieństwa, po połączeniu ich uzyskamy:

 

Wspólny rozkład dla zmiennych niezależnych edytuj

Jeśli dla zmiennych losowych dyskretnych   dla wszystkich   i   całkowicie zmiennych losowych ciągłych   dla wszystkich   i   wtedy   i   są uważane za niezależne. Oznacza to, że pozyskiwanie informacji o wartości jednej lub więcej zmiennych losowych prowadzi do rozkładu warunkowego innych zmiennych, który jest identyczny do rozkładu bezwarunkowego (brzegowego), zatem nie zmienne są źródłem informacji o zmiennych losowych.

Wspólny rozkład dla zmiennych zależnych warunkowo edytuj

Jeśli podzbiór   zmiennych   jest warunkowo zależny, podany przez inny podzbiór   tych zmiennych, wtedy wspólny rozkład   jest równy   W związku z tym może być skutecznie reprezentowany przez inne mniejsze wielowymiarowe rozkłady prawdopodobieństwa   i   Takie powiązania niezależności warunkowych (ang. conditional independence relations) mogą być reprezentowane w sieci bayesowskiej.

Zobacz też edytuj

Bibliografia edytuj