Test Shapiro-Wilka

Test Shapiro-Wilka jest standardowym testem wykorzystywanym do testowania normalności danych. Został opublikowany w 1965 roku przez Samuela Shapiro i Martina Wilka.

TeoriaEdytuj

Załóżmy, że pobraliśmy próbę   i chcemy sprawdzić czy pochodzi z rozkładu normalnego. Hipoteza zerowa i alternatywna w teście Shapiro-Wilka ma następującą postać:

  Próba pochodzi z populacji o rozkładzie normalnym
  Próba nie pochodzi z populacji o rozkładzie normalnym.

W celu przeprowadzenia testu wykorzystuje się statystykę  

  • Uporządkuj obserwacje niemalejąco:  
  • Oblicz:  
  • Jeżeli   jest parzyste, niech   w przeciwnym razie  
  • Używając stabelaryzowanych wartości   oblicz  
  • Oblicz statystykę  
  • Porównaj wynik ze stabelaryzowanymi wartościami dla odpowiednich poziomów ufności i liczebności próby.

PrzykładEdytuj

W celu zilustrowania procesu, załóżmy, że mamy następujące obserwacje:

 
  • Sortując otrzymujemy:  
  • Obliczając  
  • Dla wartości   z odpowiednich tabel otrzymujemy kolejne wartości:   oraz wartość  
  • Wartość statystyki  

Wartość teoretycznej statystyki   na poziomie istotności   i   wynosi   Ponieważ ta wartość jest mniejsza niż otrzymana z testu - nie mamy powodu odrzucić hipotezy, że próba pochodzi z rozkładu normalnego.

Porównanie z innymi testamiEdytuj

Analiza porównawcza przy użyciu metod Monte-Carlo pokazała, że test Shapiro-Wilka ma największą moc spośród innych testów badających normalność: Test Andersona-Darlinga, Test Kołmogorowa-Smirnowa czy Test Lilliefors.

Modyfikacja testuEdytuj

Oryginalnie zaproponowane podejście ograniczało się do próbek poniżej 50 obserwacji. Royston w 1995 roku zaproponował algorytm AS R181, który mógł być wykorzystany w zakresie  

Zobacz teżEdytuj

BibliografiaEdytuj

  • S.S. Shapiro, M.B. Wilk., An Analysis of Variance Test for Normality, Biometrika, Vol. 52, No. 3/4. (Dec., 1965), s. 591–611
  • Nornadiah Mohd Razali, Yap Bee Wah, Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests, Journal of Statistical Modeling and Analytics, Vol. 2 No. 1, 21–33, 2011

Linki zewnętrzneEdytuj