Tablica pomyłek (nazywana również macierzą pomyłek[1] lub macierzą błędów) – tabela przedstawiająca skuteczność działania algorytmu klasyfikacyjnego, najczęściej binarnego (czyli przewidującego przynależność do jednej z dwóch klas). Każda kolumna tablicy przedstawia możliwe rzeczywiste etykiety badanych jednostek, a każdy wiersz przedstawia etykiety przewidywane algorytm[2]. Spotyka się również transponowaną wersję macierzy, gdzie klasy rzeczywiste są w wierszach, a przewidywane w kolumnach[1].

W przypadku klasyfikatora binarnego tablica pomyłek ma wymiary 2×2. Badane jednostki są w takiej sytuacji oznaczone dwoma etykietami: pozytywną i negatywną. Algorytm klasyfikacyjny przypisuje im predykowaną (tzn. przewidywaną) klasę pozytywną albo negatywną. Możliwa jest sytuacja, że jednostka w rzeczywistości pozytywna zostanie omyłkowo zaklasyfikowana jako negatywna, a jednostka w rzeczywistości negatywna jako pozytywna – stąd nazwa macierzy.

Klasa rzeczywista
pozytywna negatywna
Klasa
predykowana
pozytywna prawdziwie
pozytywna (TP)
fałszywie
pozytywna (FP)
negatywna fałszywie
negatywna (FN)
prawdziwie
negatywna (TN)

Na podstawie częstości występowania rzeczywistego stanu pozytywnego w populacji oraz wzajemnych relacji prawidłowych i nieprawidłowych klasyfikacji można wyróżnić szereg wskaźników oceniających siłę predykcyjną klasyfikatora (np. testu diagnostycznego). Poniższy wykres podsumowuje ich powiązania, przy czym – odwrotnie niż w tablicy powyżej – klasa rzeczywista jest w wierszach, a klasa przewidywana w kolumnach:

Klasa predykowana – wynik testu
Populacja Klasyfikacja pozytywna Klasyfikacja negatywna Częstość występowania, chorobowość

Klasa
rzeczywista
Stan
pozytywny
prawdziwie dodatnia, TP fałszywie ujemna
(błąd drugiego rodzaju, FN)
czułość, TPR

FNR

Stan
negatywny
fałszywie dodatnia
(błąd pierwszego rodzaju, FP)
prawdziwie ujemna, TN FPR

swoistość, SPC, TNR

dokładność, ACC

precyzja, PPV

FOR

LR+

DOR

FDR

NPV

LR-


Oznaczenia jednostek w zależności od ich klasy rzeczywistej i przewidywanej:

Miary:

  • czułość (ang. sensitivity), pełność[3] (ang. recall) lub odsetek prawdziwie pozytywnych (ang. true positive rate, TPR)
  • swoistość (ang. specificity, SPC) lub odsetek prawdziwie negatywnych (ang. true negative rate, TNR)
  • precyzja (ang. precision, lub positive predictive value, PPV – wartość predykcyjna dodatnia)

Przykład edytuj

Klasa rzeczywista
pozytywna negatywna
Klasa
predykowana
pozytywna Ludzie chorzy poprawnie
zdiagnozowani jako chorzy
Ludzie zdrowi błędnie
zdiagnozowani jako chorzy
(błąd pierwszego rodzaju)
negatywna Ludzie chorzy błędnie
zdiagnozowani jako zdrowi
(błąd drugiego rodzaju)
Ludzie zdrowi poprawnie
zdiagnozowani jako ludzie zdrowi

Przypisy edytuj

  1. a b Aurélien Géron, Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow, Wydanie II, aktualizacja do modułu TensorFlow 2, Gliwice: Helion, 2020, s. 110, ISBN 978-83-283-6002-0 [dostęp 2024-05-18].
  2. Andrzej Stanisz, Modele regresji logistycznej: zastosowanie w medycynie, naukach przyrodniczych i społecznych, Kraków: Wydawnictwo StatSoft Polska, 2016, ISBN 978-83-88724-73-2 [dostęp 2024-05-18].
  3. Nina Zumel, John Mount, Język R i analiza danych w praktyce, 2021, s. 214 (pol.).