Test t Studentatest statystyczny używany do porównywania dwóch średnich lub porównywania średniej z próby z pewną założoną wartością i sprawdzania, czy różnice pomiędzy nimi mogą być wynikiem losowości. Test t Studenta korzysta ze statystyki testowej o rozkładzie t.

Zasada działania

edytuj

Jeśli próba losowa pochodzi z populacji o rozkładzie normalnym, to średnia z próby również ma rozkład normalny z taką samą jak w populacji wartością oczekiwaną. Różnica średniej z próby i średniej z populacji dzielona przez błąd standardowy średniej (iloraz odchylenia standardowego z populacji i pierwiastka z liczebności próby) ma standaryzowany rozkład normalny. Odchylenie standardowe w populacji nie jest jednak zwykle znane. Jeśli zastąpimy je odchyleniem z próby, uzyskamy rozkład t, który zbiega do rozkładu normalnego wraz ze wzrostem wielkości próby[1].

Test jednej średniej

edytuj

Hipoteza zerowa. Oznaczmy średnią z próby symbolem   a wariancję z próby – symbolem   W ramach testu jednej średniej weryfikuje się hipotezę zerową, że średnia rozkładu, z którego pobierana jest próbka o liczebności   jest równa pewnej liczbie   Jeżeli ta hipoteza zerowa jest prawdziwa, statystyka T, dana wzorem

 

ma rozkład t z   stopniami swobody.

Formy hipotezy alternatywnej. Hipoteza alternatywna może przyjąć formę dwustronną   (średnia w populacji nie jest równa  ) lub formę jednostronną: lewostronną ( ) lub prawostronną ( )[2]. Podobnie jak w innych podobnych testach, w zależności od formy hipotezy alternatywnej oraz przyjętego poziomu istotności   wyznacza się obszar krytyczny lub wartość p.

Kryterium decyzyjne. Analogicznie do wielu innych testów statystycznych, jeżeli uzyskana w próbie wartość statystyki testowej T znajdzie się w obszarze krytycznym lub (co jest równoważne) wartość p nie przekroczy  , hipoteza zerowa jest odrzucana.

Założenia. Zakłada się, szczególnie w przypadku małych prób (np.  [2]), że rozkład w populacji, z której pobiera się próbę losową, ma w przybliżeniu rozkład normalny.

Test dwóch średnich

edytuj

Hipoteza zerowa. W przypadku testu dwóch średnich porównywane są średnie z dwóch prób o liczebnościach  i   pochodzących z dwóch populacji. Hipoteza zerowa zwykle zakłada równość dwóch średnich w populacjach ( ), co jest równoznaczne stwierdzeniu, że różnica pomiędzy tymi średnimi wynosi zero ( ). Konstrukcja testu pozwala również na niezerową wartość różnicy w hipotezie zerowej ( ), w praktyce najczęściej jednak  

Hipoteza alternatywna. Hipoteza alternatywna może być, podobnie jak w teście jednej średniej, dwustronna   lewostronna ( ) lub prawostronna ( ).

Statystyka testowa dana jest wzorem[3]:

 ,

gdzie  i  to średnia i wariancja w pierwszej próbie, a   i   to analogiczne statystyki z drugiej próby, ma rozkład t o   stopniach swobody.

Założenia. Przeprowadzając test, zakłada się, że rozkłady w populacjach są w przybliżeniu normalne. Jest to ważne w przypadku małych prób, ponieważ dla większych prób test jest odporny na umiarkowane odstępstwa od tego założenia. Test wymaga ponadto założenia o równości wariancji w obu populacjach. Podobny test umożliwiający pominięcie założenia o równości wariancji nazywany jest testem t Welcha.

Test różnicy średnich dla obserwacji powiązanych w pary. Jeżeli obserwacje z dwóch populacji można powiązać w pary (na przykład testujemy zużycie paliwa wylosowanych samochodów w jeździe miejskiej i poza miastem albo umiejętności uczestników szkoleń przed i po szkoleniu), należy obliczyć różnice dla każdej pary i na tak przygotowanych danych (na obliczonych różnicach) przeprowadzić test jednej średniej[3].

Przypisy

edytuj
  1. Jacek Koronacki, Jan Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, s. 201-202, ISBN 978-83-204-3242-8 [dostęp 2024-05-07].
  2. a b Anna Baranowska, Elementy statystyki dla studentów uczelni medycznych: nowoczesne ujęcie z opisem obliczeń w programach Excel, R i Statistica, Wydanie drugie poprawione, Wrocław: Oficyna Wydawnicza GiS, 2022, ISBN 978-83-67234-02-3 [dostęp 2024-05-07].
  3. a b Andrzej Stanisz, Przystępny kurs statystyki z zastosowaniem Statistica PL na przykładach z medycyny. T. 1: Statystyki podstawowe, Wyd. 3 zm. i popr, Kraków: StatSoft Polska, 2006, s. 224-225, ISBN 978-83-88724-18-3 [dostęp 2024-04-22] (pol.).