Odległość Mahalanobisa: Różnice pomiędzy wersjami

[wersja nieprzejrzana][wersja nieprzejrzana]
Usunięta treść Dodana treść
Piotrg (dyskusja | edycje)
→‎Przypadek 3: wartości - > pierwiastki wartości
Piotrg (dyskusja | edycje)
m boldsymbol{\mu}
Linia 7:
 
==Interpretacja==
Odległość Mahalanobisa stosuje się najczęście w analizie skupień. Mając dany zbiór punktów tworzących pewną klasę, możemy wyznaczyć dla niego wektor średni <math>\boldsymbol{\mu}=[\mu_1,\mu_2,\ldots,\mu_n]</math> oraz [[macierz kowariancji]] <math>C\,</math>, które odzwierciedlają pewien charakter tej klasy. Badając przynależność nieznanego wektora losowego <math>\bold{x}</math> do danej klasy, mierzy się jego podobieństwo do wektora <math>\boldsymbol{\mu}\,</math>, uwzględniając przy tym informację o wariancjach poszczególnych składowych oraz korelacjach między nimi. Miarą takiego podobieństwa jest odległość Mahalanobisa, nazywana ważoną [[odległość euklidesowa | odległością euklidesową]], przy czym macierzą wag jest <math>C^{-1}\,</math>.
 
Rozważmy trzy przypadki różnych zbiorów danych:
Linia 18:
Poszczególne składowe w zbiorze mają równe wariancje (można przyjąć że są one równe 1) i nie są skorelowane. Wówczas macierz kowariancji <math>C\,</math> jest [[macierz jednostkowa|macierzą jednostkową]], a odległość Mahalanobisa jest równa odległości euklidesowej:
{|
|<math>d_{m}(\bold{x},\boldboldsymbol{\mu})</math> || <math> = \sqrt{ (x_1-\mu_1)^2 + \ldots + (x_n-\mu_n)^2} = </math>
|-
|||<math> = \sqrt{(\bold{x}-\boldboldsymbol{\mu})\mathbb{I}^{-1}(\bold{x}-\boldboldsymbol{\mu})^T}</math>
|}
Punkty o identycznej odległości od pewnego danego punktu centralnego tworzą na płaszczyźnie [[okrąg]], a w przestrzeni o trzech lub więcej wymiarach odpowiednio [[sfera|sferę]] i [[hipersfera|hipersferę]].
Linia 38:
Składowe <math>x_1, x_2, \ldots, x_n</math> wektora losowego <math>\bold{x}</math> nie są skorelowane, lecz mają różne wariancje: <math>\sigma_1^2, \sigma_2^2, \ldots, \sigma_n^2</math>. Aby znormalizować poszczególne składowe należy je podzielić przez odpowiadające im wariancje:
{|
|<math>d_{m}(\bold{x},\boldboldsymbol{\mu})</math> || <math> = \sqrt{ \frac{(x_1-\mu_1)^2}{\sigma_1^2} + \ldots + \frac{(x_n-\mu_n)^2}{\sigma_1^2}} = </math>
|-
|||<math> = \sqrt{(\bold{x}-\boldboldsymbol{\mu})D^{-1}(\bold{x}-\boldboldsymbol{\mu})^T}</math>
|}