Test Shapiro–Wilka jest standardowym testem wykorzystywanym do testowania normalności danych. Został opublikowany w 1965 roku przez Samuela Shapiro i Martina Wilka.

Teoria edytuj

Załóżmy, że pobraliśmy próbę   i chcemy sprawdzić czy pochodzi z rozkładu normalnego. Hipoteza zerowa i alternatywna w teście Shapiro–Wilka ma następującą postać:

  Próba pochodzi z populacji o rozkładzie normalnym
  Próba nie pochodzi z populacji o rozkładzie normalnym.

W celu przeprowadzenia testu wykorzystuje się statystykę  :

  • Uporządkuj obserwacje niemalejąco:  
  • Oblicz:  
  • Jeżeli   jest parzyste, niech   w przeciwnym razie  
  • Używając stabelaryzowanych wartości   oblicz  
  • Oblicz statystykę  
  • Porównaj wynik ze stabelaryzowanymi wartościami dla odpowiednich poziomów ufności i liczebności próby.

Przykład edytuj

W celu zilustrowania procesu, załóżmy, że mamy następujące obserwacje:

 
  • Sortując otrzymujemy:  
  • Obliczając  
  • Dla wartości   z odpowiednich tabel otrzymujemy kolejne wartości:   oraz wartość  
  • Wartość statystyki  

Wartość teoretycznej statystyki   na poziomie istotności   i   wynosi   Ponieważ ta wartość jest mniejsza niż otrzymana z testu, nie mamy powodu odrzucić hipotezy, że próba pochodzi z rozkładu normalnego.

Porównanie z innymi testami edytuj

Analiza porównawcza przy użyciu metod Monte Carlo pokazała, że test Shapiro–Wilka ma największą moc spośród innych testów badających normalność: Test Andersona–Darlinga, Test Kołmogorowa–Smirnowa czy Test Lilliefors[potrzebny przypis].

Modyfikacja testu edytuj

Oryginalnie zaproponowane podejście ograniczało się do próbek poniżej 50 obserwacji. Royston w 1995 roku zaproponował algorytm AS R181, który mógł być wykorzystany w zakresie  

Zobacz też edytuj

Bibliografia edytuj

  • S.S. Shapiro, M.B. Wilk., An Analysis of Variance Test for Normality, Biometrika, Vol. 52, No. 3/4. (Dec., 1965), s. 591–611
  • Nornadiah Mohd Razali, Yap Bee Wah, Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests, Journal of Statistical Modeling and Analytics, Vol. 2 No. 1, 21–33, 2011

Linki zewnętrzne edytuj