Sprawdzian krzyżowy
Sprawdzian krzyżowy a. sprawdzanie krzyżowe (branż. walidacja krzyżowa, „kroswalidacja”[a]) – metoda statystyczna polegająca na podziale próby statystycznej na podzbiory, a następnie przeprowadzaniu wszelkich analiz na niektórych z nich, tzw. zbiór uczący, podczas gdy pozostałe służą do potwierdzenia wiarygodności jej wyników, tzw. zbiór testowy (branż. zbiór walidacyjny).
Teoria sprawdzianu krzyżowego została zapoczątkowana przez Seymoura Geissera. Pozwala ona bronić się przed tzw. błędem trzeciego rodzaju i właściwie ocenić trafność prognostyczną modelu predykcyjnego. Bez jej zastosowania nie można być pewnym, czy model będzie dobrze działał dla danych, które nie były wykorzystywane do jego konstruowania (zob. nadmierne dopasowanie).
Rodzaje
edytujSprawdzian prosty
edytujJest to najbardziej typowy rodzaj sprawdzianu, w którym próbę dzieli się losowo na rozłączne zbiory: uczący i testowy. Zwykle zbiór testowy stanowi mniej niż 1/3 próby. Niektórzy nie zaliczają tego typu sprawdzenia do metody sprawdzianu krzyżowego.
Sprawdzian k-krotny
edytujW tej metodzie oryginalna próba jest dzielona na k podzbiorów. Następnie kolejno każdy z nich bierze się jako zbiór testowy, a pozostałe razem jako zbiór uczący, po czym wykonuje się analizę (analiza jest więc wykonywana k razy). Uzyskane k rezultaty łączy się (np. uśrednia) w celu uzyskania jednego wyniku.
Leave-one-out
edytujJest to odmiana sprawdzenia k-krotnego, gdzie elementy podziału są jednoelementowe, tj. N-elementowa próba jest dzielona na N podzbiorów. Stosowana często dla małych zbiorów danych.
Stratyfikowany sprawdzian krzyżowy
edytujNie jest to w zasadzie osobna odmiana sprawdzianu krzyżowego, a odnosi się do wszystkich jej rodzajów wymienionych powyżej. Stratyfikowany sprawdzian krzyżowy (ang. stratified cross-validation) polega na takim podziale obiektów pomiędzy zbiór uczący i zbiór testowy, aby zachowane były oryginalne proporcje pomiędzy klasami decyzyjnymi. Zastosowanie stratyfikowanego sprawdzianu krzyżowego jest szczególnie ważne w przypadku, gdy w oryginalnym zbiorze danych występują znaczne dysproporcje w liczebności przykładów należących do poszczególnych klas decyzyjnych.
Zobacz też
edytuj- metoda samowsporna (bootstrap)
Uwagi
edytuj- ↑ Od ang. cross-validation
Bibliografia
edytuj- Jacek Koronacki, Jan Ćwik: Statystyczne systemy uczące się. Warszawa: Wydawnictwa Naukowo-Techniczne, 2005, s. 90. ISBN 83-204-3157-3.
- Ian H. Witten, Eibe Frank: Data Mining. Morgan Kaufmann, 2005, s. 149. ISBN 978-0-12-088407-0.
Linki zewnętrzne
edytuj- Implementacja naiwnej metody bayesowskiej ze sprawdzianem krzyżowym w języku Visual Basic. paul.luminos.nl. [zarchiwizowane z tego adresu (2009-02-14)]. (ang.) (zawiera pliki wykonywalne i kod źródłowy)
- Ogólna implementacja sprawdzianu k-fold. cs.technion.ac.il. [zarchiwizowane z tego adresu (2008-12-01)]. (ang.) (darmowy open source; zawiera wersję rozproszoną, wykorzystującą jednocześnie wiele komputerów, co może wielokrotnie przyspieszyć obliczenia)