Metryka probabilistyczna

Metryka probabilistyczna (ang. Lukaszyk-Karmowski metric) funkcja definiująca odległość pomiędzy zmiennymi bądź wektorami losowymi[1][2]. Funkcja ta nie jest, jak sugeruje nazwa, metryką, gdyż nie spełnia jej pierwszego aksjomatu, jakim jest identyczność przedmiotów nierozróżnialnych. Należy jednak zauważyć, że funkcja ta jest metryką w przestrzeni probabilistycznej, co więcej, jest to metryka wyznaczona przez normę tej przestrzeni.

Zmienne losowe edytuj

Metryka probabilistyczna   pomiędzy dwiema zmiennymi losowymi   i   o ciągłych rozkładach gęstości prawdopodobieństwa jest zdefiniowana jako:

 

gdzie   oznacza łączną gęstość prawdopodobieństwa zmiennych losowych   i   Jeżeli   i  niezależne, to:

 

gdzie   i   oznaczają odpowiednie funkcje gęstości prawdopodobieństwa zmiennych   i  

W przypadku dyskretnych zmiennych losowych metryka probabilistyczna przyjmuje postać:

 

Można wykazać, że taka metryka probabilistyczna nie spełnia pierwszego warunku metryki, lub też spełnia go wtedy i tylko wtedy, jeżeli oba jej argumenty to zmienne pewne opisywane funkcją gęstości prawdopodobieństwa typu delty Diraca. W takim przypadku:

 

metryka probabilistyczna zwyczajnie staje się metryką pomiędzy wartościami średnimi     zmiennych   i   i:

 

We wszystkich pozostałych przypadkach:

 

MP spełnia pozostałe aksjomaty metryki: jest symetryczna bezpośrednio z definicji i spełnia nierówność trójkąta:

 

Zatem:

 

 

 
Metryka probabilistyczna pomiędzy dwiema zmiennymi losowymi   i   o normalnych rozkładach gęstości prawdopodobieństwa i tym samym odchyleniu standardowym   (poczynając od krzywej u dołu).   oznacza odległość pomiędzy wartościami oczekiwanymi zmiennych   i  

Przykłady edytuj

Załóżmy, że mamy zmierzyć odległość pomiędzy punktem   a punktem   a punkty te są współliniowe z pewnym punktem  

Załóżmy dalej, że pomiary odległości pomiędzy   a   i pomiędzy   a   zostały dokonane przez dwie niezależne grupy eksperymentatorów z użyciem taśmy mierniczej.

Przy powyższych założeniach pomiary każdej z grup eksperymentatorów można traktować jako zmienne losowe   i   skupione wokół faktycznych położeń punktów odpowiednio   i  

Zakładając dalej, że oba rozkłady zmiennych losowych   i  normalne (N), a ich odchylenie standardowe   jest to samo, całkowanie   prowadzi do:

 

gdzie:

 

a   jest uzupełniająca funkcją błędu.

W tym przypadku „wartość zerowa” metryki   wynosi:

 

co oznacza, że w sensie statystycznym odległość pomiędzy tą samą zmienną losową   jest niezerowa i zależy wyłącznie od typu jej rozkładu i stopnia jego rozproszenia.

Gdy obie zmienne   i   określa rozkład jednostajny (R) o tym samym odchyleniu standardowym   całkowanie   prowadzi do:

 

Minimalna wartość metryki probabilistycznej tego typu wynosi:

 

Dla dwóch dyskretnych zmiennych losowych   i   mających rozkład Poissona metryka probabilistyczna przyjmuje postać:

 

Wektory losowe edytuj

 
powierzchnia równej odległości dla metryki euklidesowej  
 
powierzchnia równej odległości dla euklidesowej metryki probabilistycznej  

Metrykę probabilistyczną zmiennych losowych można rozszerzyć na metrykę   wektorów losowych   podstawiając w miejsce   dowolny operator metryki  

 

gdzie   oznacza łączną gęstość prawdopodobieństwa wektorów losowych   i   Na przykład podstawiając w miejsce   metrykę euklidesową i przy założeniu, że wektory   i   są wzajemnie niezależne otrzymamy:

 

gdzie   i   to wielowymiarowe rozkłady gęstości prawdopodobieństwa wektorów np. wielowymiarowe rozkłady normalne.

Forma euklidesowa edytuj

Jeżeli wektory   i   są nie tylko wzajemnie niezależne, ale także poszczególne składowe każdego z nich są statystycznie niezależne, metrykę probabilistyczną wektorów losowych można także zdefiniować jako:

 

gdzie   jest szczególną formą metryki probabilistycznej zmiennych losowych dobraną w zależności od rozkładów poszczególnych składowych     wektorów  

Interpretacja fizyczna edytuj

Metrykę probabilistyczną można traktować jako odległość cząstek w mechanice kwantowej, gdzie każdej cząstce odpowiada zespolona funkcja falowa   zależna od współrzędnych przestrzennych, a prawdopodobieństwo   tego, że cząstka znajduje się w danym elemencie przestrzeni   wynosi:

 

Cząstka w studni potencjału edytuj

Rozważmy cząstkę   znajdującą się w jednowymiarowej studni potencjału o szerokości   Jeżeli funkcja falowa tej cząstki ma postać:

 

to odległość tej cząstki od dowolnego punktu   studni wynosi:

 

Z właściwości metryki probabilistycznej wynika, że suma odległości pomiędzy krawędzią studni (  lub  ) a danym punktem i metryki probabilistycznej pomiędzy danym punktem a cząstką jest różna od metryki probabilistycznej pomiędzy krawędzią studni a cząstką. Na przykład dla cząstki kwantowej na poziomie energetycznym  

 

Metryka probabilistyczna cząstki kwantowej od krawędzi studni jest przy tym niezależna od energii cząstki i wynosi zawsze  

Dwie cząstki w studni potencjału edytuj

Wzajemną odległość dwóch cząstek     znajdujących się w jednowymiarowej studni potencjału o szerokości   dla których funkcje falowe mają postać:

 
 

można wyrazić za pomocą metryki probabilistycznej zmiennych niezależnych jako:

 

Odległość między cząstkami jest najmniejsza dla   i   czyli dla minimalnej energii cząstek   i   i wynosi:

 

Zgodnie z właściwościami metryki probabilistycznej odległość ta jest niezerowa. Dla wyższych poziomów energii     zmierza do  

Zastosowania praktyczne edytuj

Metrykę probabilistyczną można zastosować w miejscu typowego operatora metryki (zwykle metryki euklidesowej) w różnorakich metodach numerycznych, a w szczególności w algorytmach aproksymacyjnych takich jak radialne funkcje bazowe[3] metoda Sheparda, czy sieci Kohonena.

Takie podejście ma podstawy fizyczne, umożliwiając uwzględnienie niepewności położenia znanych punktów aproksymacyjnych[4][5].

Metryka probabilistyczna znalazła do tej pory wiele praktycznych zastosowań. Zapewnia wygodę analizy i wymaga tylko kilku kroków technicznych, aby spełnić warunek Lipschitza[6]. Została uogólniona z rozkładów prawdopodobieństwa na amplitudy prawdopodobieństwa za pomocą całek po trajektoriach. Amplitudy nie były przy tym interpretowane jako funkcje falowe cząstek kwantowych, ale reprezentowały wagi związane z punktami przestrzennymi w splątanej superpozycji geometrii, reprezentowanych przez przestrzeń fazową wyższego wymiaru[7].

Zaproponowano również adaptacje metryki probabilistycznej, wykazując, że generują one bardziej gładkie wyniki[8][9].

W oparciu o łańcuchy Markowa połączono niepewność środowiskową z heterogenicznością wewnątrznowotworową, obie wyrażone w kategoriach probabilistycznych. Tym samym uwzględniono ewolucyjny charakter karcynogenezy, ponieważ prawdopodobieństwa przejść między poszczególnymi stanami korelują ze statystycznym dopasowaniem środowiska i atraktorów odpowiednich stanów. Wykazano, że konsekwencje losowego przełączania można łatwo określić ilościowo za pomocą metryki probabilistycznej, która określa odległość geometryczną punktów o współrzędnych zadanych odpowiednimi rozkładami prawdopodobieństwa[10].

Przypisy edytuj

  1. Metryka Pomiarowa, przykłady zastosowań aproksymacyjnych w mechanice doświadczalnej (Measurement metric, examples of approximation applications in experimental mechanics), rozprawa doktorska, Szymon Łukaszyk (autor), Wojciech Karmowski (promotor), Politechnika Krakowska, przedłozono 31 grudnia 2001 r., zakończono 31 marca 2004 r.
  2. A new concept of probability metric and its applications in approximation of scattered data sets, Łukaszyk Szymon, Computational Mechanics Volume 33, Number 4, 299–304, Springer-Verlag 2003, doi:10.1007/s00466-003-0532-2
  3. Florian Hogewind, Peter Bissolli (2010) Operational maps of monthly mean temperature for WMO-Region VI (Europe and Middle East), IDŐJÁRÁS, Quarterly Journal of the Hungarian Meteorological Service, Vol. 115, No. 1-2, Styczeń–Czerwiec 2011, str. 31-49, str. 41
  4. Gang Meng, Jane Law, Mary E. Thompson (2010) "Small-scale health-related indicator acquisition using secondary data spatial interpolation", International Journal of Health Geographics, 9:50 doi:10.1186/1476-072X-9-50
  5. Gang Meng (2010)Social and Spatial Determinants of Adverse Birth Outcome Inequalities in Socially Advanced Societies, Thesis (Doctor of Philosophy in Planning), University of Waterloo, Canada
  6. X. Pan, et al. Theoretical Analysis of Image-to-Image Translation with Adversarial Learning, Proceedings of the 35th International Conference on Machine Learning, Stockholm, Sweden, PMLR 80, 2018.
  7. M. Lake, et. al. Generalised uncertainty relations from superpositions of geometries, Classical and Quantum Gravity, Volume 36, Number 15, 2019.
  8. P. Durdevic, et al. Cost-Effective ERT Technique for Oil-in-Water Measurement for Offshore Hydrocyclone Installations, 2nd IFAC Workshop on Automatic Control in Offshore Oil and Gas Production, May 27-29, 2015, Florianópolis, Brazil.
  9. S. Pedersen, et al. Online Slug Detection in Multi-phase Transportation Pipelines Using Electrical Tomography, 2nd IFAC Workshop on Automatic Control in Offshore Oil and Gas Production, May 27-29, 2015, Florianópolis, Brazil.
  10. B. Brutovsky, et al. Towards inverse modeling of intratumor heterogeneity, Open Phys. 2015; 13:232–241.