Twierdzenie de Moivre’a-Laplace’a

Twierdzenie de Moivre’a-Laplace’a – dwa twierdzenia rachunku prawdopodobieństwa nazywane lokalnym i całkowym (integralnym) wskazujące związek rozkładu dwumianowego (Bernoulliego) z rozkładem normalnym; można traktować go jako szczególny przypadek centralnego twierdzenia granicznego.

Wraz ze wzrostem liczby prób wykres rozkładu dwumianowego coraz bardziej przypomina wykres krzywej Gaussa.

Przypadek symetryczny pochodzi z wydrukowanej w 1730 roku pracy Miscellanea analytica de seriebus et quadraturis („Rozmaite analityka o szeregach i kwadraturach”)[1] od Abrahama de Moivre’a, a niesymetryczny – z opublikowanego w trzy lata później dodatku Miscelaneis analyticis supplementum z 1733 roku; szerszej publiczności twierdzenia zaprezentowane zostały w drugim wydaniu dzieła The Doctrine of Chances: or, a method for calculating the probabilities of events in play („Doktryna szans: lub, metoda obliczania prawdopodobieństw zdarzeń w grze”) z 1738 roku. Twierdzenie w pełnej ogólności udowodnił Pierre Simon de Laplace w pracy Théorie analytique des probabilités („Analityczna teoria prawdopodobieństw”) z 1812 roku, który nie miał w zwyczaju powoływać się na źródła – z tego powodu do XX wieku prace Moivre’a były szerzej nieznane[2].

Twierdzenia de Moivre’a-Laplace’a edytuj

Oznaczenia
Niech   oznacza rozkład dwumianowy dla procesu Bernoulliego, w którym prawdopodobieństwo osiągnięcia dokładnie   sukcesów o prawdopodobieństwie   w   próbach dane jest wzorem
 
gdzie   jest prawdopodobieństwem porażki, a   oznacza liczbę sukcesów; ponadto niech   oraz   oznaczają odpowiednio wartość oczekiwaną i odchylenie standardowe tego rozkładu.
Rozpatrywana będzie unormowana wersja powyższego rozkładu, tzn. jego wartość oczekiwana będzie równa zeru, a jego wariancja (odchylenie standardowe) będzie jednostkowa, czyli zamiast liczby sukcesów   rozważana będzie jej unormowana wersja   W związku z tym niżej stosowane będą również następujące oznaczenia:   to szerokość przedziału klasowego,   to unormowane odchylenie liczby sukcesów od średniej; wygodnie będzie zakładać, że   nie musi być naturalne – w szczególności   skąd  
Funkcja   będzie oznaczać gęstość unormowanego rozkładu normalnego   o dystrybuancie   podczas gdy   będzie oznaczać gęstość rozkładu normalnego   o dystrybuancie  
Twierdzenie lokalne
Jeżeli   to
 
gdzie
 
W szczególności   dla   czyli
 
Twierdzenie całkowe
Jeżeli   to
 
gdzie
 
W szczególności   dla   oraz   zmieniających się tak, by   jest wtedy
 
zachodzi również następujące, mniej dokładne, ale prostsze, a przez to częściej stosowane, przybliżenie:
 

W zastosowaniach najczęściej spotyka się następujący wniosek z twierdzenia całkowego:

Wniosek
Jeżeli   są stałe, to
 

Przykłady edytuj

Liczebność próby
Twierdzenie de Moivre’a-Laplace’a można wykorzystać do określenia minimalnej liczebności próby losowej z danej populacji w danym badaniu mającym na celu jak najbardziej miarodajne oszacowanie danej obserwacji, która zachodzi z pewnym prawdopodobieństwem, bądź nie (tj. zachodzącej zgodnie z rozkładem zero-jedynkowym). Przykładowo: w badaniu przesiewowym choroby, która jest na tyle rzadka, że nie choruje na nią więcej niż   populacji, przy czym błąd ma być mniejszy niż   z prawdopodobieństwem   w celu wskazania chorych z ustaloną pewnością należałoby wybrać próbę co najmniej  -osobową[3].
Reguła 3σ
Opierając się na twierdzeniu całkowym można się spodziewać, że reguła trzech sigm sformułowana dla rozkładu normalnego zachodzi również dla procesu Bernoulliego. Jedną z jej wersji jest
 
o ile   oraz   co można krótko zapisać  [4].

Przypisy edytuj

  1. W pracy, którą autor przekazał jedynie kilku znajomym, pojawia się wzór postaci   gdzie   który posłużył do wyprowadzenia opisanych w tym artykule twierdzeń, znany obecnie jako wzór Stirlinga, przy czym James Stirling zauważył jedynie, że   o czym autor wspomina w drugim wydaniu tej pracy 1933 roku z dwoma dodatkami.
  2. Szczegóły można znaleźć w artykułach Raymonda Clare Archibalda i Karla Pearsona z 1926 roku zebranych w tej pracy.
  3. Skoro   oznacza prawdopodobieństwo zapadnięcia jednostki na daną chorobą, a   jest oszacowaniem procenta chorych w populacji, to   skąd   W tablicach statystycznych można znaleźć, iż   (gdyż wtedy  ), dlatego   powinno spełniać warunek   a ponieważ   to   przyjmuje największą wartość dla   zatem  
  4. Dla przypadku symetrycznego   oznacza to, że   w przypadku   prawdopodobieństwo wynosi   liczbę   wzięto zapewne od popularnego oszacowania dla rozkładu normalnego, dla którego   Twierdzenie to można wzmacniać korzystając z wyników w rodzaju nierówności Bernsteina.