Nadmierne dopasowanie: Różnice pomiędzy wersjami
[wersja przejrzana] | [wersja przejrzana] |
Usunięta treść Dodana treść
zamiana „odnośnie” na „odnośnie do” |
jęz. |
||
Linia 1:
[[Plik:Overfit.png|thumb|300px|Zaszumione (w przybliżeniu liniowe) dane można dopasować zarówno do [[funkcja liniowa|funkcji liniowej]] jak i [[wielomian]]u. Chociaż wielomian przechodzi przez każdy z punktów reprezentujących obserwacje, a prosta tylko przez kilka, jest ona zapewne lepszym przybliżeniem, gdyż wielomian przyjmuje
[[Plik:Overfitting_svg.svg|thumb|300px|Nadmierne dopasowanie podczas tzw. uczenia nadzorowanego (np. w [[sieć neuronowa|sieciach neuronowych]]). Błąd na [[zbiór uczący|zbiorze uczącym]] jest zaznaczony kolorem niebieskim, błąd na [[zbiór testowy|zbiorze testowym]] kolorem czerwonym. Jeśli błąd na zbiorze testowym rośnie, podczas gdy błąd na zbiorze uczącym maleje, to zwykle jest to związane ze zjawiskiem przeuczenia.]]
'''Nadmierne dopasowanie
Nadmierne dopasowanie jest w pewnym sensie pogwałceniem zasady [[brzytwa Ockhama|brzytwy Ockhama]] (niemnożenia bytów ponad potrzebę). Kiedy [[liczba stopni swobody (statystyka)|liczba stopni swobody]] modelu przekracza zawartość informacyjną danych, dobór parametrów staje się w dużym stopniu kwestią przypadku. Model zaczyna dopasowywać się do przypadkowych błędów w danych uczących, i tym samym zanika jego zdolność
Idea nadmiernego dopasowania jest ważna także w [[uczenie maszynowe|uczeniu maszynowym]]. Sieci neuronowe, czy algorytmy genetyczne mają zwykle bardzo dużo zmieniających się w trakcie uczenia parametrów, a niektóre typowe problemy takie jak gra na [[giełda|giełdzie]] w długim horyzoncie czasowym, badania [[genetyka|genetyczne]], czy problemy [[makroekonomia|makroekonomiczne]] generują niewielką liczbę niezależnych obserwacji. Wzrasta zatem ryzyko sytuacji w której np. sieć neuronowa
Zwykle algorytm
Zarówno w statystyce, jak i uczeniu maszynowym w celu uniknięcia nadmiernego dopasowania konieczne jest zastosowanie dodatkowych środków zapobiegawczych (np. [[zbiór testowy|zbiorów testowych]], [[
W [[psychiatria|psychiatrii]] odpowiednikiem nadmiernego dopasowania mogą być [[urojenie|urojenia paranoiczne]]: złożone, spójne wewnętrznie, choć absurdalne modele świata (np. [[teoria spiskowa|teorie spiskowe]]), tworzone na podstawie zbyt skąpych informacji przez pacjentów z objawami [[zespół paranoiczny|zespołu paranoicznego]].
|