Tablica pomyłek
Tablica pomyłek (nazywana również macierzą pomyłek[1] lub macierzą błędów) – tabela przedstawiająca skuteczność działania algorytmu klasyfikacyjnego, najczęściej binarnego (czyli przewidującego przynależność do jednej z dwóch klas). Każda kolumna tablicy przedstawia możliwe rzeczywiste etykiety badanych jednostek, a każdy wiersz przedstawia etykiety przewidywane algorytm[2]. Spotyka się również transponowaną wersję macierzy, gdzie klasy rzeczywiste są w wierszach, a przewidywane w kolumnach[1].
W przypadku klasyfikatora binarnego tablica pomyłek ma wymiary 2×2. Badane jednostki są w takiej sytuacji oznaczone dwoma etykietami: pozytywną i negatywną. Algorytm klasyfikacyjny przypisuje im predykowaną (tzn. przewidywaną) klasę pozytywną albo negatywną. Możliwa jest sytuacja, że jednostka w rzeczywistości pozytywna zostanie omyłkowo zaklasyfikowana jako negatywna, a jednostka w rzeczywistości negatywna jako pozytywna – stąd nazwa macierzy.
|
Na podstawie częstości występowania rzeczywistego stanu pozytywnego w populacji oraz wzajemnych relacji prawidłowych i nieprawidłowych klasyfikacji można wyróżnić szereg wskaźników oceniających siłę predykcyjną klasyfikatora (np. testu diagnostycznego). Poniższy wykres podsumowuje ich powiązania, przy czym – odwrotnie niż w tablicy powyżej – klasa rzeczywista jest w wierszach, a klasa przewidywana w kolumnach:
Klasa predykowana – wynik testu | |||||
Populacja | Klasyfikacja pozytywna | Klasyfikacja negatywna | Częstość występowania, chorobowość
|
||
Klasa rzeczywista |
Stan pozytywny |
prawdziwie dodatnia, TP | fałszywie ujemna (błąd drugiego rodzaju, FN) |
czułość, TPR
|
FNR
|
Stan negatywny |
fałszywie dodatnia (błąd pierwszego rodzaju, FP) |
prawdziwie ujemna, TN | FPR
|
swoistość, SPC, TNR
| |
dokładność, ACC
|
precyzja, PPV
|
FOR
|
LR+
|
DOR
| |
FDR
|
NPV
|
LR-
|
Oznaczenia jednostek w zależności od ich klasy rzeczywistej i przewidywanej:
- prawdziwie pozytywna (ang. true positive, TP)
- prawdziwie negatywna (ang. true negative, TN)
- fałszywie pozytywna (ang. false positive, FP), błąd pierwszego rodzaju
- fałszywie negatywna (ang. false negative, FN), błąd drugiego rodzaju
Miary:
- czułość (ang. sensitivity), pełność[3] (ang. recall) lub odsetek prawdziwie pozytywnych (ang. true positive rate, TPR)
- swoistość (ang. specificity, SPC) lub odsetek prawdziwie negatywnych (ang. true negative rate, TNR)
- precyzja (ang. precision, lub positive predictive value, PPV – wartość predykcyjna dodatnia)
- dokładność (ang. accuracy, ACC)
Przykład edytuj
|
Przypisy edytuj
- ↑ a b Aurélien Géron , Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow, Wydanie II, aktualizacja do modułu TensorFlow 2, Gliwice: Helion, 2020, s. 110, ISBN 978-83-283-6002-0 [dostęp 2024-05-18] .
- ↑ Andrzej Stanisz , Modele regresji logistycznej: zastosowanie w medycynie, naukach przyrodniczych i społecznych, Kraków: Wydawnictwo StatSoft Polska, 2016, ISBN 978-83-88724-73-2 [dostęp 2024-05-18] .
- ↑ Nina Zumel , John Mount , Język R i analiza danych w praktyce, 2021, s. 214 (pol.).