Gry różniczkowe – dział matematycznej teorii sterowania optymalnego, w którym rozpatruje się sterowanie w sytuacjach konfliktowych. Ma on także związek z teorią gier. Teoria powstała w latach 50. XX wieku.

Sformułowania problemów teorii gier różniczkowych

edytuj

W teorii wyróżnia się dwa rodzaje gier:

  • gra dwóch graczy,
  • gra wielu graczy.

Podstawowe wyniki uzyskano dla gier różniczkowych dwóch graczy, a sama gra podporządkowana jest wtedy następującemu schematowi:

  • dany jest pewien układ dynamiczny, w którym część sterujących działań podporządkowana jest graczowi I, a inna część graczowi II,
  • zakłada się, że dla każdego z graczy wybór działań gwarantujących mu osiągnięcie założonego celu, przy dowolnym, nieznanym wcześniej sterowaniu przeciwnika, opiera się jedynie na informacji o bieżącym stanie układu[1].

W teorii gier różniczkowych rozpatruje się także problemy, w których zakłócenia działania układu traktuje się jako działania przeciwnika.

Zazwyczaj zakłada się, że ruch sterowanego układu jest podporządkowany równaniu różniczkowemu

 

gdzie   jest wektorem fazowym układu,   i   – wektorami sterowania odpowiednio graczy I i II, a   czasem. Określona jest klasa strategii   gracza I, a dla każdej strategii   określony jest wiązką ruchów   która jest generowana przez tę strategię oraz wszystkie możliwe strategie przeciwnika. Wiązka ta wychodzi z początkowego stanu powyższego układu.

Na ruchach   układu zadany jest funkcjonał   nazywany płacą gry, którego wartość gracz I stara się zminimalizować. Czasem funkcjonał   zależy także od realizacji   sterowania obu graczy[2].

Biorąc pod uwagę także najbardziej niekorzystną realizację ruchu   gdy wybór strategii jest pozostawiony graczowi II, jakość strategii   jest oceniana za pomocą wielkości:

 

Zadanie gracza I polega na określeniu strategii   na której realizowane jest minimum funkcjonału   (jest to zadanie potęgi). Czasem rozpatruje się zadanie jakości, które polega na znalezieniu strategii   spełniającej nierówność:

 

gdzie   jest daną liczbą[3].

W analogiczny sposób można sformułować zadanie gracza II. Jego strategia   jest oceniana przez wielkość:

 

Zadanie potęgi polega wtedy na znalezieniu strategii maksymalizującej wartość funkcjonału   a zadanie jakości – na znalezieniu strategii   dla której:

 

Jeśli w zadaniach graczy I i II klasy strategii   i   mają taką własność, że dla każdej pary uporządkowanej   można określić choć jeden ruch

 

generowany przez tę parę, to oba te zadania generują grę różniczkową na klasie strategii  

Jeśli w grze różniczkowej spełniona jest równość

 

to wielkość   nazywa się ceną gry różniczkowej[3].

Przykład

edytuj

Typowym przykładem gry różniczkowej jest zagadnienie pościgu-ucieczki[4]. W tej grze

 

gdzie   są odpowiednio wektorami fazowymi ścigającego i uciekającego, a ich ruch opisywany jest równaniami

 [3].

Najczęściej rozpatruje się przypadki, gdy wybór sterowania podlega ograniczeniom typu

 

gdzie   są pewnymi zbiorami zwartymi. Płacą w takiej grze jest czas spotkania, tzn.:

 

gdzie   i   są wektorami utworzonymi z pierwszych   współrzędnych wektorów   i   Zatem zbliżenie punktów   i   na odległość mniejszą od   jest interpretowane jako spotkanie obiektów.

Przypisy

edytuj
  1. И.М. Виноградов (redaktor): Математическая Энциклопедия. T. 2. Д-Коо. Москва: Советская Энциклопедия, 1979, s. 329. (ros.).
  2. Математическая Энциклопедия, op. cit., s. 329.
  3. a b c Математическая Энциклопедия, op. cit., s. 330.
  4. Elementarny przykład rozwiązania takiego problemu można znaleźć w książce: Wiktor Gutenmacher, Nikołaj Wasiliew: Proste i krzywe. Warszawa: WSiP, 1995, s. 67–70. ISBN 83-02-05275-2.

Linki zewnętrzne

edytuj