Dobór próby: Różnice pomiędzy wersjami

[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
Paweł Ziemian BOT (dyskusja | edycje)
poprawa przek., WP:SK+ToS+mSK+mSI+Bn, drobne redakcyjne, typo, kolejność sekcji końcowych
Linia 1:
'''Dobór próby''' jest częściączęść [[badanie statystyczne|badania statystycznego]]. Polega na wybraniu pewnych indywidualnych [[obserwacja statystyczna|obserwacji]], które tworząc tzw. [[próba statystyczna|próbę statystyczną]] pozwolą uzyskać pewną wiedzę o całej [[populacja statystyczna|populacji]].
 
Każda obserwacja może obejmować jedną lub większą liczbę konkretnych wartości tzw. [[cecha statystyczna|cech statystycznych]] dotyczących jednego konkretnego obiektu badań, lub (w przypadku analiz zmian jakiegoś zjawiska w czasie) jednej chwili czasowej.
Linia 18:
== Definiowanie szerokiej populacji ==
Właściwa praktyka statystyczna opiera się na poprawnym zdefiniowaniu problemu. Przede wszystkim musimy wiedzieć, jakie obiekty badamy. Populacja statystyczna to hipotetyczny zbiór wszelkich możliwych obiektów, o których chcemy uzyskać informacje, np.:
* mieszkańcy Polski w wieku 18-2518–25 lat
* partia właśnie wyprodukowanych żarówek.
Niekiedy badamy tzw. [[szereg czasowy|szeregi czasowe]], czyli zmiany pewnych wielkości w czasie. Wówczas populacja może obejmować np. obserwacje badanych wielkości w kolejnych chwilach czasowych, np.
Linia 25:
 
== Operat losowania ==
W najprostszym przypadku istnieje teoretyczna możliwość zbadania całej populacji statystycznej, np. całej partii żarówek. Często jednak takiej możliwości nie ma, np. nigdy nie zbadamy reakcji wszystkich żyjących muszek owocówek na dany bodziec, nie miałoby to zresztą sensu.
 
Z zasady więc ograniczamy wstępnie populację do obiektów które jesteśmy w stanie zidentyfikować i włączyć dowolny z nich do próby. Zbiór ten zwany jest '''operatem losowania'''.
W przedwyborczym [[sondaż opinii|sondażu opinii]] możliwe zawężenia populacji obejmują np.:
* [[rejestr wyborców]]
* [[książka telefoniczna|książkę telefoniczną]]
Linia 42:
=== Prosta próba losowa ===
{{osobny artykuł|dobór losowy}}
W prostej próbie losowej o pewnej liczności, każdy element z operatu ma jednakową szansę znalezienia się w próbie. Przy właściwym doborze operatu próba taka jest reprezentatywna dla populacji.
 
Jeśli jednak interesuje nas zjawisko rzadkie w populacji, np. nietypowa odmiana badanej choroby, może okazać się, że prosta próba losowa albo nie będzie obejmowała wystarczającej liczby tych nietypowych przypadków, albo jej liczność będzie musiała być bardzo duża i badania będą zbyt kosztowne. Lepiej wówczas użyć próby warstwowej.
Linia 49:
W próbie kwotowej operat jest najpierw dzielony na rozłączne podgrupy. Następnie eksperymentator lub ankieter wybiera z każdej podgrupy przypadki w odpowiedniej proporcji. Na przykład ankieter ma za zadanie przepytać 200 kobiet i 300 mężczyzn w wieku od 45 do 60 lat.
 
Ten drugi krok sprawia, że próby uzyskane tą techniką mogą być niereprezentatywne. Na przykład jest prawdopodobne, że ankieter (nawet nieświadomie) będzie wybierał osoby w dobrym humorze, gdyż z doświadczenia wie, że chętniej odpowiadają one na pytania.
 
=== Próba warstwowa ===
Linia 55:
Próba warstwowa (lub: próba warstwowana) tak jak w przypadku kwotowej wymaga podzielenia operatu na podgrupy (klasy, warstwy), jednak z każdej grupy obiekty do próby wybierane są losowo. Główne przyczyny stosowania prób warstwowych to:
* zapewnienie określonym grupom wystarczającej liczności w próbie
* zapewnienie większej efektywności badań przez przeważanie próby.
 
Jeśli w populacji 99% obiektów jest z klasy A i 1% z klasy B (cokolwiek oznacza to w danym przypadku), a do badań potrzebujemy co najmniej 300 obiektów z każdej klasy, to przy prostej próbie losowej musielibyśmy mieć ponad 30000 obiektów w próbie. W przypadku próby warstwowej losujemy 300 obiektów z klasy A, 300 z klasy B i we wszystkich analizach nadajemy obiektom w klasie A wagę 0,99 a obiektom w B wagę 0,01. W ten sposób podobną [[Poziom istotności|istotność]] statystyczną wyników zapewnia pięćdziesięciokrotnie mniejsza próba. Z drugiej strony utrudnia to analizę i sprawia, że wariancja w małych klasach mocno wpływa na wariancję wyniku.
 
=== Próba grupowa ===
Inna nazwa: '''próba zespołowa'''. W tej wersji operat jest dzielony na grupy, a następnie losowane są do próby nie pojedyncze jednostki, lecz całe grupy.
 
Takie losowanie upraszcza badania. Istnieje jednak zagrożenie, że niektóre z pominiętych grup różnią się rozkładami cech i w ten sposób próba będzie niereprezentatywna. Ponadto wymaga to wprowadzenia pewnych korekt do [[test statystyczny|testów statystycznych]].
Linia 72:
=== Próba systematyczna ===
{{osobny artykuł|losowanie systematyczne}}
Wybór badanych w jakikolwiek systematyczny sposób np. co 10 nazwiska z książki telefonicznej. Jeśli zmienna według której wybieramy (czyli tu: pozycja w książce telefonicznej) jest [[niezależnośćzależność zmiennych losowych#Niezależność statystyczna|niezależna]] od wszystkich zmiennych badanych, to próba jest reprezentatywna. Istnieje jednak ryzyko, że nie uwzględniamy jakiegoś czynnika, który wpływa na badania (np. konkurencyjna firma badawcza nadużywała próby systematycznej i dokładnie ci badani, którzy znajdują się na co 10 miejscu w książce są teraz wrogo nastawieni do ankiet i podają nieprawdziwe dane).
 
=== Próba ekspercka / dobór celowy ===
Linia 81:
 
== Rozmiar próby ==
Rozmiar próby powinien być taki, aby zapewnić [[Poziom istotności|istotność]] statystyczną wyników. Potrzeba do tego jednak pewnych danych o populacji. Można więc w pierwszym rzucie zdecydować się na małą próbę, a w razie potrzeby ją poszerzać. Do badania istotności służą [[test istotności|testy istotności statystycznej]].
 
== Zobacz też ==
* [[dobór losowy]]
* [[dobór celowy]]
* [[próba reprezentatywna]]
* [[sampling (archeologia)]]
 
== Bibliografia ==
* Brown, K.W., Cozby, P.C., Kee, D.W., & Worden, P.E. (1999). ''Research Methods in Human Development,'' 2d ed. Mountain View, CA : Mayfield. {{ISBN|1-55934-875-5}}.
* [https://web.archive.org/web/20090306043450/http://www.osra.org/itlpj/bartlettkotrlikhiggins.pdf Bartlett, J. E., II, Kotrlik, J. W., & Higgins, C. (2001). Organizational research: Determining appropriate sample size for survey research. Information Technology, Learning, and Performance Journal, 19(1) 43-50.]
* Chambers, R L, and Skinner, C J (editors) (2003), ''Analysis of Survey Data'', Wiley, {{ISBN|0-471-89987-9}}.
* {{Cytuj|autor = William Gemmell Cochran |tytuł = Sampling Techniques |data = 1977 |isbn = 0-471-16240-X |wydanie = 3d ed |miejsce = New York |wydawca = Wiley |oclc = 2799031 }}
* Deming, W E (1975) On probability as a basis for action, ''The American Statistician'', 29(4), pp146-152.
* [https://web.archive.org/web/20090326133405/http://flyvbjerg.plan.aau.dk/Publications2006/0604FIVEMISPUBL2006.pdf Flyvbjerg, B (2006) "Five„Five Misunderstandings About Case Study Research." Qualitative Inquiry, vol. 12, no. 2, April 2006, pps. 219-245219–245]
* Gy, P (1992) ''Sampling of Heterogeneous and Dynamic Material Systems: Theories of Heterogeneity, Sampling and Homogenizing''
* Kish, L (1995) ''Survey Sampling'', Wiley, {{ISBN|0-471-10949-5}}.
* Korn, E L, and Graubard, B I (1999) ''Analysis of Health Surveys'', Wiley, {{ISBN|0-471-13773-1}}.
* Lohr, H (1999) ''Sampling: Design and Analysis'', Duxbury, {{ISBN|0-534-35361-4}}.
* Sarndal, Swenson, and Wretman (1992), Model Assisted Survey Sampling, Springer-Verlag, {{ISBN|0-387-40620-4}}.
* Stuart, Alan (1962) ''Basic Ideas of Scientific Sampling'', Hafner Publishing Company, New York
* ASTM E105 Standard Practice for Probability Sampling Of Materials
* ASTM E122 Standard Practice for Calculating Sample Size to Estimate, With a Specified Tolerable Error, the Average for Characteristic of a Lot or Process
* ASTM E141 Standard Practice for Acceptance of Evidence Based on the Results of Probability Sampling
* ASTM E1402 Standard Terminology Relating to Sampling
* ASTM E1994 Standard Practice for Use of Process Oriented AOQL and LTPD Sampling Plans
* ASTM E2234 Standard Practice for Sampling a Stream of Product by Attributes Indexedby AQL
 
== Zobacz też ==
* [[dobór losowy]]
* [[dobór celowy]]
* [[próba reprezentatywna]]
* [[sampling (archeologia)]]
 
== Linki zewnętrzne ==