Rozkład Hotellinga

Statystyka T² Hotellinga[1] – uogólnienie rozkładu Studenta, który jest używany do testowania hipotez wielowymiarowych. Nazwa pochodzi od Harolda Hotellinga.

Statystyka Hotellinga jest definiowana jako:

gdzie jest liczbą obserwacji, jest p-wymiarową kolumną wektorową, a jest macierzą kowariancji.

Jeśli jest zmienną losową z wielowymiarowego rozkładu Gaussa i (niezależne od ) ma rozkład Wisharta z taką samą macierzą wariancji oraz z wówczas rozkład jest rozkładem T² Hotellinga z parametrami i

Można pokazać, że:

gdzie jest rozkładem F Snedecora.

Teraz załóżmy, że

jest kolumną wektorową, której wartościami są liczby rzeczywiste. Załóżmy, że

są ich średnią. Niech będzie macierzą dodatnie określoną

jest macierzą „przykładowych wariancji”. (Transpozycja jakiejkolwiek macierzy jest oznaczona jako ). Niech będzie znanym wektorem. Wówczas statystyka Hotellinga przyjmuje postać:

Warto zauważyć, że jest blisko powiązona z kwadratem odległością Mahalanobisa.

W szczególności może to być pokazane poprzez[2]:

Jeśli są niezależne, i i są jak zdefiniowano powyżej, wówczas ma rozkład Wisharta z stopniami swobody

i jest niezależna od oraz

To oznacza, że:

Statystyka T² Hotellinga dla dwóch prób edytuj

Jeśli   oraz   są próbkami niezależnymi wyciągniętymi z dwóch niezależnych wielowymiarowych rozkładów Gaussa o takiej samej średniej oraz kowariancji, i definiujemy

 

jako średnie próbek, oraz

 

jako estymator nieobciążonej macierzy kowariancji, wówczas statystyka T² Hotellinga dla dwóch prób wygląda tak:

 

i może być przedstawiona w postaci rozkładu F Snedecora:

 [2].

Zobacz też edytuj

Przypisy edytuj

  1. H. Hotelling (1931) The generalization of Student’s ratio, Ann. Math. Statist., Vol. 2, s. 360–378.
  2. a b K.V. Mardia, J.T. Kent, J.M. Bibby (1979), Multivariate Analysis, Academic Press.