D Somersa (Delta Somersa) – jedna z miar zależności, badająca siłę związku pomiędzy zmiennymi porządkowymi. Nazwana jest na cześć amerykańskiego socjologa i statystyka Roberta Somersa, który zaproponował ją w 1962 roku[1].

Definicja edytuj

D Somersa można zdefiniować z wykorzystaniem miary tau Kendalla ( ). Dla dwóch zmiennych: X i Y, nazywanej zależną, D Somersa wynosi[2]:

 

Wykorzystanie edytuj

W praktyce D Somersa wykorzystuje się najczęściej w sytuacji, gdy zmienna Y jest zmienną dychotomiczną (zero-jedynkową). W takiej sytuacji D jest przekształceniem liniowym pola pod krzywą ROC (AUC):

 .

i można je zinterpretować następująco: jeżeli wylosujemy dwie obserwacje, jedną spośród obserwacji spełniających warunek Y=1 z odpowiadającą jej wartością X1 i drugą z grupy Y=0 z odpowiadającą jej wartością X0, to D jest różnicą prawdopodobieństw[2]:

 .

W praktyce bankowych modeli scoringowych D Somersa znane jest pod nazwą statystyki Giniego[3].

Przypisy edytuj

  1. Andrew Colman, A Dictionary of Psychology, Oxford University Press, 2015, s. 714, ISBN 978-0-19-105784-7 [dostęp 2024-04-20] (ang.).
  2. a b Roger Newson, Parameters behind “Nonparametric” Statistics: Kendall's tau, Somers’ D and Median Differences, „The Stata Journal: Promoting communications on statistics and Stata”, 2 (1), 2002, s. 45–64, DOI10.1177/1536867X0200200103, ISSN 1536-867X [dostęp 2024-04-20] (ang.).
  3. Karol Przanowski, Credit scoring. Studia przypadków procesów biznesowych, 2015 (pol.).

Linki zewnętrzne edytuj