Pseudo R-kwadrat
Pseudo R-kwadrat – ogólna nazwa miar dopasowania stosowanych do oceny modelu regresji, w którym zmienna objaśniana jest nominalna lub porządkowa, w związku z czym współczynnik determinacji R2 nie może być zastosowany.
W przypadku regresji logistycznej stosuje się kilka konkurencyjnych miar, z których każda ma swoje ograniczenia[1]. Należą do nich między innymi:
- Pseudo R-kwadrat Coxa i Snella
- Pseudo R-kwadrat Nagelkerke'a (Cragga-Uchlera)
- Pseudo R-kwadrat McFaddena
Pseudo R-kwadrat Coxa-Snella
edytujPseudo R-kwadrat Coxa-Snella wyraża się następującym wzorem:
gdzie to liczebność próby, zaś i to funkcje wiarygodności odpowiednio dla modelu zerowego (zawierającego jedynie wyraz wolny) i modelu ocenianego. Miara Coxa-Snella jest problematyczna ze względu na to, że jej maksymalna wartość , która jest osiągana gdy analizowany model przewiduje zmienną objaśnianą w sposób doskonały, może być wyraźnie mniejsza niż 1[2].
Pseudo R-kwadrat Nagelkerke'a
edytujMiara pseudo R-kwadrat Nagelkerke'a, znana również pod nazwą pseudo R-kwadrat Cragga-Uchlera[2] jest modyfikacją miary , tak żeby jej wartość maksymalna wynosiła 1:
Pseudo R-kwadrat McFaddena
edytujMiara pseudo R-kwadrat McFaddena opiera się na logarytmie funkcji wiarygodności i jest zdefiniowana w następujący sposób[3]:
Przypisy
edytuj- ↑ Paul D. Allison: Measures of fit for logistic regression.
- ↑ a b Andrzej Stanisz , Modele regresji logistycznej: zastosowanie w medycynie, naukach przyrodniczych i społecznych, Kraków: Wydawnictwo StatSoft Polska, 2016, s. 255-261, ISBN 978-83-88724-73-2 [dostęp 2024-05-27] .
- ↑ Michał Rubaszek i inni, Skrypt do przedmiotu Ekonometria I [online], Szkoła Główna Handlowa w Warszawie, 2020 [dostęp 2024-05-27] (pol.).