Rozkład prawdopodobieństwa

Rozkład prawdopodobieństwamiara probabilistyczna określona na zbiorze wartości pewnej zmiennej losowej (wektora losowego), przypisująca prawdopodobieństwa wartościom tej zmiennej[1]. Formalnie rozkład prawdopodobieństwa można rozpatrywać bez odwołania się do zmiennych losowych.

Definicja formalna edytuj

Rozkład prawdopodobieństwa – to miara probabilistyczna   określona na σ-ciele podzbiorów borelowskich pewnej przestrzeni polskiej   Dla rozkładów ciągłych jako przestrzeń polską wybiera się:

  • zbiór liczb rzeczywistych   (dla 1-wymiarowej zmiennej losowej),
  • przestrzeń euklidesowa   (dla n-wymiarowej zmiennej losowej).

Rozkład prawdopodobieństwa nazywamy jednowymiarowym, jeżeli zmienna losowa jest 1-wymiarowa, a wielowymiarowym, jeżeli zmienna losowa jest n-wymiarowa.

Zastosowanie zmiennych losowych edytuj

Przestrzenią probabilistyczną nazywa się trójkę uporządkowaną, złożoną z: a) przestrzeni zdarzeń elementarnych   b) określonego na niej σ-ciała   którego elementy są nazywane zdarzeniami losowymi, c) miary probabilistycznej   przyporządkowującej zdarzeniom liczby zwane prawdopodobieństwami.

Tak określone prawdopodobieństwo jest jednak niewygodne do badania, gdy   jest zbiorem bez zadanych jakichkolwiek relacji między jego elementami. Dlatego definiuje się funkcję zwaną zmienną losową, która przyporządkowuje elementom przestrzeni   elementy jakiejś przestrzeni mierzalnej   o pożądanych właściwościach[a]. Najczęściej jako przestrzeń mierzalną wykorzystuje się przestrzeń euklidesową, tj.   Wtedy zmienną losową nazywa się wektorem losowym.

Przeciwobraz każdego zbioru mierzalnego w   jest zdarzeniem losowym. Podzbiory mierzalne przestrzeni   tworzą σ-ciało, które oznaczać będziemy symbolem   Ponieważ zmienna losowa nie musi być funkcją różnowartościową, więc ten sam zbiór mierzalny   można w ogólnym przypadku otrzymać z wielu różnych zdarzeń o różnych prawdopodobieństwach. Aksjomaty σ-ciała zapewniają, że wśród tych zdarzeń jest także ich suma i do niej jest przypisane największe prawdopodobieństwo. Suma ta jest równa przeciwobrazowi zbioru   czyli  

Rozkład zmiennej losowej   – to funkcja   określona na sigma ciele   taka że prawdopodobieństwo zdarzenia   jest równe prawdopodobieństwu przypisanemu przeciwobrazowi   zdarzenia  

 

Rozkład   jest nową miarą probabilistyczną. Jest on w przestrzeni stanów   odpowiednikiem miary probabilistycznej  

Uwaga 1:

Zapis   gdzie   jest zdarzeniem, a nie zmienną losową jest stosowany na oznaczenie prawdopodobieństwa warunkowego.

Uwaga 2:

Niżej omówiono rozkłady ciągłe i dyskretne. Oprócz nich istnieją także rozkłady nie mieszczące się w żadnej z tych kategorii – na przykład rozkład o dystrybuancie Cantora.

Rozkład ciągły edytuj

Jeżeli istnieje funkcja   taka że

 

(całka Lebesgue’a) dla dowolnego zbioru borelowskiego   to funkcję tę nazywa się gęstością rozkładu prawdopodobieństwa (funkcją gęstości prawdopodobieństwa).

Nazwa pochodzi od intuicji fizycznych (zob. gęstość masy). O rozkładzie   mającym gęstość mówi się, że jest ciągły (lub typu ciągłego).

Powyższa definicja jest poprawna dla dowolnych rozkładów prawdopodobieństwa, także wielowymiarowych – wówczas   jest wektorem.

Rozkład   zmiennej losowej   spełniający powyższe warunki definiuje się analogicznie. O zmiennej losowej również mówi się wówczas, iż jest ciągła (lub typu ciągłego).

Rozkład dyskretny edytuj

Rozkład   nazywa się dyskretnym, jeśli jest skupiony na zbiorze przeliczalnym, tzn. istnieje zbiór (co najwyżej) przeliczalny   dla którego   Jeżeli

  oraz   dla każdego  

to dla dowolnego zbioru borelowskiego  

 

gdzie   to indykator (funkcja charakterystyczna) zbioru  

Zatem zbiór par   jednoznacznie wyznacza rozkład   Stąd dowolny zbiór tej postaci, gdzie   oraz   (co wynika z własności rozkładu), nazywa się czasami rozkładem (dyskretnym). Odwzorowanie   oznaczane   nosi nazwę funkcji masy prawdopodobieństwa i jest ono dyskretnym odpowiednikiem gęstości prawdopodobieństwa.

Dyskretna zmienna losowa   to zmienna losowa o rozkładzie dyskretnym. Wówczas można go zdefiniować podobnie jak wyżej równością

 

jednakże w tym wypadku zachodzi dodatkowo

 

gdzie   jest zbiorem wszystkich wartości przyjmowanych przez zmienną  

Dystrybuanta rozkładu jednowymiarowego edytuj

Osobny artykuł: dystrybuanta.

Dystrybuantą jednowymiarowego rozkładu prawdopodobieństwa   nazywa się funkcję   zdefiniowana wzorem:

 

Dystrybuanta rozkładu zmiennej losowej   to dystrybuanta   oznaczana zwykle symbolem   otrzymana z rozkładu tej zmiennej losowej:

 

Jeśli rozkład   ma gęstość   jego dystrubuanta   wyraża się wzorem:

 

Dystrybuanta w pełni wyznacza rozkład, tzn. dwie zmienne o tej samej dystrybuancie muszą mieć ten sam rozkład; obrazuje to poniższy przykład.

Przykłady edytuj

1) Niech   będzie przestrzenią zdarzeń elementarnych doświadczenia polegającego na rzucie monetą, które może z jednakowym prawdopodobieństwem dać dwa wyniki: orła i reszkę, tj.

  oraz  

Jeżeli zmienna   jest określona równościami

  oraz  

to jej rozkład   jest określony następująco:

 

a funkcja masy prawdopodobieństwa ma postać:

 

Oznacza to, że zmienna losowa   odwzorowuje zdarzenia

 
 

oraz zachowuje prawdopodobieństwo określone na   przekształcając je w rozkład określony na  

Z definicji dystrybuanty wynika, iż prawdopodobieństwo zdarzenia

 

dane jest wzorem

 

Dystrybuanta zmiennej   to funkcja   określona wzorem

 

2) Niech   będzie przestrzenią zdarzeń elementarnych rzutu monetą, wyżej opisanego, przy czym dodatkowo uwzględnimy upadek na kant, który prawie na pewno się nie zdarzy. Jeżeli

  oraz  

to zmienna losowa   określona równościami

  oraz  

ma taki sam rozkład   (oraz funkcję masy) co zmienna   określona wyżej, mimo iż są one różne.

Także dystrybuanta   zmiennej   dana jest tym samym wzorem co dystrybuanta   zmiennej  

Dystrybuanta rozkładu wielowymiarowego edytuj

Osobny artykuł: dystrybuanta.

Jeśli   jest wektorem losowym, tzn.   to rozważa się wówczas przedziały wielowymiarowe, tzn. zbiory będące iloczynami kartezjańskimi przedziałów, mające postać

 

Dystrybuanta   ma postać

 

Stosuje się następujący zapis dystrybuanty rozkładu zmiennej losowej:

 

gdzie  

Oznaczając   powyższy wzór można zapisać w skrócie

 

Jeśli rozkład wielowymiarowy   ma gęstość   jego dystrybuanta   wyraża się za pomocą całki Lebesgue’a:

 

co można zapisać w prostszej wersji (ale tylko wtedy, gdy całkę Lebesgue’a da się rozbić w poniższy sposób):

 

Rozkład osobliwy edytuj

Df. Zmienna losowa   ma rozkład osobliwy (singularny), jeśli ma ciągłą dystrybuantę oraz istnieje zbiór   taki że ma on zerową miarę Lebesgue’a   i jednostkowy rozkład prawdopodobieństwa   tzn.

  oraz  

Rozkład arytmetyczny edytuj

Df. Rozkładami arytmetycznymi nazywa się rozkłady skoncentrowane na zbiorze punktów postaci   gdzie  

Tw. To, iż rozkład   jest skupiony na zbiorze   jest równoważne temu, iż jego funkcja charakterystyczna   ma okres równy   bądź   dla pewnego  

Analizując funkcje charakterystyczne można stwierdzić, że arytmetyczne są rozkłady:

geometryczny, Bernoulliego i Poissona.

Rozkłady jedno- i dwupunktowe są przesuniętymi rozkładami arytmetycznymi.

Popularne rozkłady edytuj

Rozkłady ciągłe edytuj

 
Wybrane rozkłady gęstości prawdopodobieństwa:
 rozkład normalny,
 rozkład wykładniczy,
 rozkład jednostajny,
 rozkład trójkątny,
  – rozkład delty Diraca dla zmiennej pewnej.

Rozkłady dyskretne edytuj

Pozostałe edytuj

Statystyka edytuj

Jeśli mamy na myśli rzeczywiste prawdopodobieństwa wystąpienia danej wartości cechy w populacji, to mówimy o rozkładzie w populacji. Jeśli mamy na myśli prawdopodobieństwa wystąpienia danej cechy wyznaczone podczas badania statystycznego, to mówimy o rozkładzie empirycznym.

Zobacz też edytuj

Uwagi edytuj

  1. Ściślej musi to być funkcja  -mierzalna, gdzie   jest rodziną podzbiorów borelowskich przestrzeni   Jako   zwykle wybiera się jedną z tzw. przestrzeni polskich, do których zaliczają się w szczególności przestrzenie euklidesowe.

Przypisy edytuj

  1. Rozkład zmiennej losowej, [w:] Encyklopedia PWN [dostęp 2021-07-22].