Pochodna kowariantna

Pochodna kowariantnatensor powstały w wyniku różniczkowania pewnego tensora wyrażonego we współrzędnych krzywoliniowych przestrzeni euklidesowej i nieeuklidesowej dowolnego wymiaru (w ogólności w rozmaitości pseudoriemannowskiej), z określonym tensorem metrycznym. We współrzędnych kartezjańskich sprowadza się do zwykłej pochodnej cząstkowej.

Użycie pochodnej kowariantnej zamiast zwykłej pochodnej cząstkowej jest niezbędne w analizie wektorowej we współrzędnych krzywoliniowych, np. w ogólnej teorii względności, gdzie pola fizyczne rozchodzą się w 4-wymiarowej zakrzywionej przestrzeni pseudoriemannowskiej.

Zobacz więcej w artykule Współrzędne krzywoliniowe, w sekcji Pochodna kowariantna.

Motywacja edytuj

W układach krzywoliniowych pochodna cząstkowa, np. z funkcji skalarnej, nie ma na ogół charakteru tensorowego. Aby otrzymać wielkość tensorową (a więc wielkość geometryczną, czyli taką, która nie zależy od przyjętego układu współrzędnych), definiuje się pochodną kowariantną: jest ona równa pochodnej cząstkowej uzupełnionej o dodatkowe składniki, związane z krzywoliniowością układu współrzędnych.

Podobnie jest dla innych tensorów (wielkości skalarne są tensorami 0-go rzędu, wektory są tensorami 1-go rzędu; definiuje się tensory 2-go i wyższych rzędów). Tensory są obiektami geometrycznymi, dlatego operacje wykonywanie na nich powinny nie zależeć od wyboru układu współrzędnych. W trakcie rozwoju teorii tensorów poszukiwano takich działań na tensorach, które w wyniku dają inne tensory. Jednym z takich działań jest obliczanie pochodnej tensora. Pierwsze podejście, polegające na obliczaniu pochodnej cząstkowej, prowadziło w układach krzywoliniowych do obiektu, który nie był tensorem.

Odkryto, że charakter tensorowy będzie miała tzw. pochodna kowariantna tensora – pochodna cząstkowa uzupełniona o dodatkowe składniki, związane z krzywoliniowością układu współrzędnych.

Pochodna kowariantna tensora redukuje się do pochodnej cząstkowej w prostoliniowym kartezjańskim układzie współrzędnych.

Pochodna kowariantna – podstawowe wzory edytuj

Pochodną kowariantną oznacza się symbolem średnika, po którym umieszcza się indeks współrzędnej, po której wykonuje się różniczkowanie (czasami zamiast średnika stosuje się slash (/), zaś w 3-wymiarowej przestrzeni znak pionowej kreski ( | )[1], zaś symbol przecinka oznacza pochodną cząstkową, np.:

  •   – pochodna cząstkowa po współrzędnej krzywoliniowej  
  •   – pochodna kowariantna po współrzędnej krzywoliniowej  

Używa się także symbolu delty na oznaczenie pochodnej kowariantnej – zamiast średnika; np. zamiast wyrażenia

 

pisze się

 

(W poniższych wzorach kolorem oznaczono powtarzające się indeksy, po których należy wykonać sumowanie zgodnie z konwencją sumacyjną Einsteina).

Pochodna wektora kontrawariantnego edytuj

 

gdzie  symbole Christoffela II rodzaju.

Pochodna wektora kowariantnego edytuj

 

Pochodna tensora kontrawariantnego 2-go rzędu edytuj

 

Pochodna tensora kowariantnego 2-go rzędu edytuj

 

Pochodna tensora kontrawariantno-kowariantnego 2-go rzędu edytuj

 

Pochodna dowolnego tensora edytuj

 

Z powyższego widać, że[2]:

pochodna kowariantna = pochodna cząstkowa po tej samej współrzędnej uzupełniona o dodatkowe człony w liczbie równej liczbie indeksów tensora, przy czym

  • każdy indeks kontrawariantny wnosi dodatkowe człony ze znakiem  
  • każdy indeks kowariantny wnosi dodatkowe człony ze znakiem  

Pochodna kowariantna skalara edytuj

Pochodna kowariantna skalara jest równa jego pochodnej cząstkowej, tj.

 

Przykład

Powyższy wzór pozwala skrócić obliczenia.

(a) Obliczmy pochodną kontrawariantną iloczynu tensorów, korzystając z twierdzenia o pochodnej iloczynu:

 
(w przedostatnim równaniu składniki   oraz   są równe – widać to jawnie, gdy zamieni się indeksy   z   np. w drugim składniku)

(b) Korzystając zaś z pochodnej skalara, wykorzystując fakt, iż kontrakcja wektorów jest skalarem, mamy natychmiast ten sam wynik

  

Pochodna kontrawariantna edytuj

Podnosząc przy pochodnych kowariantnych wskaźnik dotyczący różniczkowania, otrzymuje się tzw. pochodną kontrawariantną:

 
 

Dywergencja kowariantna edytuj

Dywergencja pola wektorowego edytuj

W dowolnych współrzędnych krzywoliniowych   przestrzeni  -wymiarowej euklidesowej (lub przestrzeni pseudoeuklidesowej i ogólniej – przestrzeni pseudoreimannowskiej) dywergencję wyraża wzór[3]

 

gdzie:

  •   – moduł wyznacznika tensora metrycznego współrzędnych krzywoliniowych w danym punkcie,
  •   – pochodna cząstkowa po współrzędnej krzywoliniowej  
  •   – współrzędna pole wektorowego w układzie współrzędnych krzywoliniowych.

W powyższym wzorze trzeba wykonać sumowanie po powtarzającym się indeksie   przyjmując  

Uwaga:

Wyznacznik tensora metrycznego nie jest wielkością stałą, ale zależy od współrzędnych uogólnionych. Np. dla sfery, na której wprowadzono współrzędne uogólnione   tensor metryczny ma postać (wyprowadzenie poniższego wzoru – patrz np. tensor metryczny)

 

Stąd:

 

– wyznacznik zależy od   (  nie jest zmienną, bo dla sfery jest to stały jej promień).

Dywergencja tensora antysymetrycznego edytuj

Jeżeli dany jest tensor antysymetryczny, to dywergencja tenora ma postać[4]

 

gdzie:

  •   – współrzędna pole tensorowego antysymetrycznego, tj. zmieniające znak przy zamianie indeksów  

Dywergencja tensora symetrycznego edytuj

Jeżeli dany jest tensor symetryczny, to dywergencja tenora ma postać[4]

 

gdzie:

  •   – współrzędne pole tensorowego symetrycznego, tj. takie że nie zmieniają znaku przy zamianie indeksów  

Twierdzenia o pochodnej kowariantnej edytuj

Tw. 1 (o tensorowym charakterze pochodnej kowariantnej)

Składniki pochodnej kowariantnej pola tensorowego transformują się kowariantnie.

Dlatego pole tensorowe powstałe z obliczenia pochodnej kowariantnej tensora   – krotnie kowariantnego jest tensorem kowariantnie  -krotnym (krotność zaś kontrawariantna nie zmienia się).

Tw. 2 (o pochodnej kowariantnej iloczynu tensorów)

Pochodna kowariantna iloczynu tensorów jest równa sumie iloczynu czynnika pierwszego przez pochodną kowariantną czynnika drugiego oraz iloczynu czynnika drugiego przez pochodną kowariantną czynnika pierwszego, np.

 

Tw. 3 Pochodna kowariantna tensora metrycznego wynosi zero, tj.[5]

 

Pochodna absolutna w układzie krzywoliniowym edytuj

Pochodna zupełna funkcji w układzie kartezjańskim edytuj

(1) Pochodna funkcji skalarnej

Jeżeli w przestrzeni euklidesowej  -wymiarowej określona jest funkcja   wielu zmiennych takich że zmienne   są zależne od jednej zmiennej   to jej pochodną zupełną nazywa się wyrażenie

 

przy czym zmienne zależne   są zadane znanymi funkcjami od zmiennej   tj.

 

(2) Pochodna funkcji wektorowej

W układzie ortokartezjańskim pochodna zupełna wektora jest wektorem, którego współrzędne są pochodnymi zupełnymi współrzędnych danego wektora, tj.

 

Pochodna absolutna w układzie krzywoliniowym edytuj

W układzie krzywoliniowym zmiennych   pochodne zupełne tensorów muszą być zastąpione przez pochodne absolutne[6].

(1) Pochodna absolutna funkcji skalarnej

Pochodna zupełna funkcji   wyraża się wzorem analogicznym jak we współrzędnych kartezjańskich, tj.

 

czyli:

 

(2) Pochodna absolutna wektora

W układzie krzywoliniowym pochodne zupełne muszą być zastąpiona tzw. pochodnymi absolutnymi takimi że[6]:

 

– widać, że pochodne cząstkowa przechodzi w pochodną kowariantną. Pochodna absolutna dana jest więc wyrażeniem

 

Podobnie dla wektora kowariantnego

 

Jeżeli funkcja wektorowa nie zależy jawnie od parametru   to pochodne cząstkowe zerują się, tj.

  oraz  

i powyższe wzory upraszczają się.

Zasady modyfikacji tensorów edytuj

Jeżeli chce się równania tensorowe znane ze współrzędnych ortokartezjańskich zapisać we współrzędnych krzywoliniowych, to obowiązuje zasada, iż pochodne cząstkowe przechodzą na pochodne kowariantne, a różniczki zupełne przechodzą na różniczki absolutne[7].

Przykład 1: Równania ruchu cząstki w polu grawitacyjnym edytuj

(a) Jeżeli cząstka nie podlega oddziaływaniom, to jej przyspieszenie jest zerowe, tj.[7]

 

gdzie:

  •  czteroprędkość cząstki,
  •   – różniczkowy przyrost tzw. interwału czasoprzestrzennego mierzony wzdłuż trajektorii cząstki; równoważnie można zapisać, że różniczka 4-prędkości cząstki zeruje się, tj.
 

(b) Przechodząc do układu współrzędnych krzywoliniowych, równanie ruchu cząstki niepodlegającej oddziaływaniom należy zmodyfikować, zamieniając różniczkę zupełną na różniczkę absolutną, tj.[7]:

 

Różniczka absolutna wektora kowariantnego dana jest zależnością:

 

lub

 

gdzie:

  – różniczka 4-prędkości cząstki.

Stąd mamy równanie ruchu cząstki w układzie krzywoliniowym

 

Dzieląc przez   i uwzględniając, że   znajdujemy

 

– jest to równanie linii geodezyjnej w przestrzeni z metryką   (od której zależą m.in. symbole Christoffela  ). Przy tym, jeżeli przestrzeń jest pozbawiona źródeł pola grawitacyjnego, to symbole Christoffela   są takie, że zerują tensor krzywizny i równania geodezyjnych sprowadzają się do prostych euklidesowych; jeżeli jednak przestrzeń jest zakrzywiona na skutek obecności materii, to tensor krzywizny jest niezerowy, a geodezyjne są inne niż proste euklidesowe.

Uwaga:

Wielkość   jest czteroprzyśpieszeniem cząstki. Ponieważ symbole Christoffela wyrażają się przez pochodne składowych tensora metrycznego

 

to widać, że trajektoria cząstki określona jest przez pochodne   które pełnią rolę natężeń pola grawitacyjnego, wobec tego tensor metryczny pełni rolę potencjału pola grawitacyjnego (przypomnienie: pochodna potencjału po współrzędnych daje natężenie pola).

Lokalne bazy wektorów: kowariantne i kontrawariantne edytuj

 
Rys. 4 Wektor v rozłożony w dwóch bazach: (1) baza e1, e2, e3 (żółta, z lewej) wektorów stycznych do krzywych współrzędnych (czarne) (2) kobaza e1, e2, e3 (niebieska, z prawej) wektorów prostopadłych do powierzchni współrzędnych (szare). Wektory bazy i kobazy nie są do siebie równoległe, chyba że współrzędne (q1, q2, q3) są ortogonalne.

Uwaga 1: Poniższe rozdziały zestawiają niektóre pojęcia stanowiące podstawę do wprowadzenia pojęcia pochodnej kowariantnej. Bardziej wyczerpujące opracowanie znajduje się w artykule współrzędne krzywoliniowe. Oznaczenia: Odtąd w artykule tensory oznacza się literami pogrubionymi.

Załóżmy, że mamy przestrzeń wektorową  -wymiarową.

(1) Definiujmy dowolny układ współrzędnych – na ogół będzie to układ współrzędnych krzywoliniowych  

(2) W każdym punkcie   przestrzeni ustalamy lokalną bazę niezależnych liniowo wektorów, których będziemy używać do znajdowania i wyliczania składowych wektorów; wektory bazy zależą od punktu przestrzeni, przy czym wyróżniamy

  • bazy kowariantne – zbiory   wektorów stycznych do linii współrzędnych,   (z dolnymi indeksami),
  • bazy kontrawariantne – zbiory wektorów prostopadłych do powierzchni współrzędnych,   (z górnymi indeksami).

(3) W każdym punkcie przestrzeni definiujemy dwa typy współrzędnych wektorów:

  • współrzędne kontrawariantne (zapisywane z górnymi indeksami): gdy zostały wyrażone jako kombinacje liniowe wektorów bazy kowariantnej
 
  • współrzędne kowariantne (zapisywane z dolnymi indeksami): gdy zostały wyrażone jako kombinacje liniowe wektorów bazy kontrawariantnej
 

Uwagi:

(1) Wektor, któremu przyporządkowano współrzędne kontrawariantne, nazywa się skrótowo „wektorem kontrawariantnym”.

(2) Wektor, któremu przyporządkowano współrzędne kowariantne, nazywa się skrótowo „wektorem kowariantnym”.

(3) Jednakże: dany wektor jest wielkością niezależną od wyboru bazy, w której jest przedstawiany za pomocą współrzędnych: można go przedstawić w dowolnej bazie.

(4) To, że współrzędne wektora są różne w tych dwóch bazach nie oznacza, że mamy dwa różne wektory: wektor jest ten sam, ale wyrażony za pomocą dwóch różnych baz.

Pole tensorowe edytuj

Utożsamiamy pojęcie tensora z polem tensorowym,, tzn. zakładamy, że składowe tensorów (skalara, wektora, ...) można wyrażać w lokalnych bazach za pomocą funkcji współrzędnych, które są funkcjami gładkimi, zmieniającymi się na ogół przy przechodzeniu z danego punktu przestrzeni do innego. Założenie to pozwala wykonywać np. operacje różniczkowania na współrzędnych tensorów.

Lokalne bazy tensorów edytuj

Jeżeli zdefiniuje się tensory nad przestrzenią liniową  -wymiarową, to tensory danego typu tworzą przestrzenie liniowe zwane przestrzeniami tensorowymi, przypisane każdemu punktowi przestrzeni. Przestrzenie te mają bazy, służące do wyrażania składowych tensorów. Wymiar przestrzeni tensorowej zależy od rzędu tensora. W szczególności:

a) Tensory 0-go rzędu (skalary) – w danym punkcie przestrzeni są pojedynczymi liczbami, niezależnymi od układu współrzędnych, w którym się je oblicza; nie wymagają bazy układu współrzędnych, przestrzeń tensorowa jest zbiorem liczbowym.

b) Tensory 1-go rzędu (wektory) – w danym punkcie przestrzeni są reprezentowane za pomocą   liczb; wymagają bazy złożonej z   liniowo niezależnych wektorów (bazami tymi są bazy kowariantna lub kontrawariantna).

c) W ogólności tensory p-krotnie kontrawariantne i q-krotnie kowariantne są obiektami określonymi w przestrzeniach tensorowych  -wymiarowych, gdzie  -wymiar przestrzeni liniowej, na jakiej określa się tensory; bazy tych przestrzeni tworzy się z iloczynów tensorowych baz kowariantnych i/lub kontrawariantnych – w zależności od typu tensora.

Np. tensor   1-krotnie kontrawariantny i 2-krotnie kowariantny ma polibazę złożoną z iloczynów tensorowych

 

tj. z iloczynów, gdzie jest 1 wektor kowariantny i 2 wektory kontrawariantne.

Pochodna cząstkowa wektora po współrzędnej edytuj

(1) Weźmy teraz najprostszy (i nietrywialny) różniczkowalny tensor: wektor kontrawariantny. Jego składowe spełniają równanie:

 

gdzie:

  •   – wektor,
  •   – jego składowe.

(2) Jeżeli w punktach pewnego podzbioru przestrzeni wektorowej określone jest pole wektorowe, to współrzędne wektorów są funkcjami współrzędnych. Każdy wektor (ogólnie: tensor) można traktować jako funkcję wielu zmiennych zwanych współrzędnymi.

(3) Przy takim rozumieniu można zdefiniować pochodną współrzędnej wektora oraz wektora:

Definicja: Pochodną współrzędnej   wektora   nazywamy wektor, którego współrzędnymi są pochodne cząstkowe jego składowych względem współrzędnych, tj.

 

gdzie przyjęliśmy oznaczenie:   – pochodna cząstkowa względem współrzędnej  

Ponieważ

 

to pochodna wektora   będzie sumą pochodnych poszczególnych składowych, czyli

 

(4) Przejdźmy teraz z danego układu współrzędnych do innego układu współrzędnych. Przy tym słuszne są wzory:

(w-1)  

gdzie   – macierz transformacji do nowego układu

(w-2)   (transformacja odwrotne),
(w-3)   (transformacja odwrotna bazy dualnej),
(w-4)   (transformacja składowych wektora),
(w-5)   (pochodna względem nowych współrzędnych wyrażona przez pochodne w starych współrzędnych).

Przejdziemy do nowego układu współrzędnych

 
 
  (w-1 – przejście do drugiej bazy)
  (pochodna iloczynu)
  (mnożenie sumy przez czynnik)
  (skracanie macierzy wzajemnie odwrotnych)
  (przeniesienie macierzy w pobliże operatora różniczkowania)
  (przejście do nowych zmiennych różniczkowania).

Widać stąd, że przy przejściu do innego układu współrzędnych pochodna cząstkowa uzyskuje dodatkowy składnik

 

– zależy on od pochodnych wektorów bazowych względem nowych współrzędnych,  

– wobec tego nie wyznacza żadnej reprezentacji grupy przekształceń,

– zatem pochodna cząstkowa nie jest tensorem.

Ten dodatkowy składnik zeruje się, gdy nowy układ współrzędnych jest kartezjański.

Pochodna kowariantna edytuj

Chcemy uzyskać działanie różniczkowe dające w wyniku tensor.

(1) Definiuje się pomocniczą wielkość (nie będącą tensorem) zwaną polem kompensacyjnym

 

Pole to przy transformacji do innego układu współrzędnych daje taki sam dodatkowy składnik, jak pochodna cząstkowa

 

(2) Definiuje się teraz pochodną kowariantną jako operator będący różnicą pochodnej cząstkowej i pola kompensacyjnego, tj.

 
przy czym
 

Podczas transformacji zarówno pochodna cząstkowa, jak i pole kompensacyjne dadzą te same składniki, które zniosą się i w wyniku uzyskamy tensor.

Twierdzenie: Pochodna kowariantna jest tensorem edytuj

(i dlatego jest poprawną wielkością uzyskiwaną z różniczkowania tensorów).

Dowód

 
 
(wyrazy umieszczone w nawiasach prostokątnych znoszą się)
 

– widać stąd, że otrzymuje się analogiczne wyrażenia na pochodną kowariantną tensora w obu układach współrzędnych, co oznacza, że pochodna kowariantna jest tensorem, cnd.

Twierdzenie (o pochodnej kowariantnej iloczynu tensorów) edytuj

 

Pole kompensacyjne edytuj

Pozostaje obliczyć pole kompensacyjne. Nie jest ono tensorem, dlatego trzeba je obliczać osobno dla każdego układu współrzędnych:

 

Wiemy, że w prostoliniowym układzie kartezjańskim pochodna cząstkowa jest identyczna z pochodną kowariantną, czyli całe pole jest równe 0. Zatem składowe   pola pomocniczego są równe 0 w układzie kartezjańskim prostoliniowym.

Składowe w innych układach można wyprowadzić z faktu, że podczas transformacji pojawia się dodatkowy składnik.

Interpretacja pola kompensacyjnego edytuj

Pole kompensacyjne wynika z krzywoliniowości układu współrzędnych (nie jest miarą zakrzywienia przestrzeni). W przestrzeni kartezjańskiej jest ono równe 0 i pochodna kowariantna pokrywa się z pochodną cząstkową. We współrzędnych krzywoliniowych wektory bazowe mają niezerowe pochodne względem współrzędnych kartezjańskich – wtedy pole kompensacyjne staje się niezerowe.

Pole kompensacyjne nie jest tensorem. Tensorem jest komutator dwóch pól kompensacyjnych – nazywa się go tensorem krzywizny Riemanna. Jeżeli składowe tego tensora są niezerowe,to przestrzeń jest zakrzywiona.

Pochodna kowariantna w innych teoriach edytuj

Pochodna cząstkowa jest nieodpowiednią wielkością także w innych teoriach, dlatego także w nich trzeba wprowadzać pola kompensacyjne i pochodną kowariantną. Jednak o ile w teorii względności dodatkowy składnik pojawiający się przy transformowaniu pochodnej cząstkowej zawiera wyłącznie współrzędne czasoprzestrzenne i ich pochodne, o tyle w innych teoriach składnik ten może zależeć od innych parametrów. Pole kompensacyjne nie ma wtedy naturalnego wyprowadzenia i trzeba je ustalić arbitralnie.

Na przykład w teoriach pól kwantowych z cechowaniem pochodna zależy od dodatkowego parametru (albo parametrów), który nie ma nic wspólnego ze współrzędnymi czasoprzestrzennymi. Np. pochodna kwantowego pola elektronu zależy od potencjału elektrycznego; wprowadza się pole kompensujące, które można zidentyfikować jako pole fotonu. Pole fotonu nie jest poprawnym tensorem (ściślej: wektorem) w przestrzeni Lorentza, ponieważ wykazuje dodatkową niezmienniczość względem cechowania. Pozwala jednak na zdefiniowanie pochodnej pola elektronu będącej poprawnym tensorem. Interpretacja fizyczna tego faktu jest taka, że obecność pola elektrycznego wpływa na ruch elektronu.

Fakt ten jest odzwierciedleniem ogólnej zasady, że każde oddziaływanie wynika z jakiejś symetrii cechowania. Pochodne cząstkowe pól materii nie są poprawnymi tensorami; trzeba wprowadzić pochodną kowariantną, zdefiniowaną za pomocą pól kompensujących zwanych polami cechowania. Kwanty pól cechowania odpowiadają cząstkom fizycznym, zwanym bozonami cechowania. Właśnie z tego faktu wziął się pogląd, że każde oddziaływanie polega na wymianie wirtualnego bozonu. Przykładowo, polem cechowania w elektrodynamice jest foton, a w teorii oddziaływań elektrosłabych – foton, bozon Z i bozony W.

Ogólna teoria względności podaje jeden wzór na pole kompensacyjne, w innych teoriach trzeba ustalić je na podstawie obserwacji. Istnieje jednak hipoteza, że pola kompensacyjne wszystkich teorii da się wyprowadzić w sposób podobny do znanego z teorii względności, jednak w większej ilości wymiarów. Wszystkie oddziaływania byłyby spowodowane zakrzywieniem czasoprzestrzeni: grawitacja – czterech znanych wymiarów, a pozostałe – dodatkowych wymiarów. Teoria Kaluzy-Kleina to przykład teorii podobnej do teorii względności, gdzie elektromagnetyzm tłumaczony jest jako zakrzywienie piątego wymiaru.

Zobacz też edytuj

Inne

Przypisy edytuj

  1. Landau 2009 ↓, s. 288–297.
  2. Landau 2009 ↓, s. 292.
  3. Landau 2009 ↓, s. 295.
  4. a b Landau 2009 ↓, s. 296.
  5. Landau 2009 ↓, s. 294.
  6. a b Korn 1983 ↓, s. 34.
  7. a b c Landau 2009 ↓, s. 297.

Bibliografia edytuj

  • L.D. Landau, E.M. Lifszyc: Teoria pola. Warszawa: PWN, 2009.
  • T. Trajdos: Matematyka część III. Warszawa: PWN, 1993. ISBN 83-204-1547-0.
  • G.A. Korn, T.M. Korn, Matematyka dla pracowników naukowych i inżynierów, cz. 2, Warszawa: PWN, 1983.
  • E. Kącki, L. Siewierski, Wybrane działy matematyki wyższej z ćwiczeniami, Warszawa: PWN, 1975, s. 265–312.
  • P.K. Raszewski: Geometria Riemanna i analiza tensorowa. Warszawa: PWN, 1958.
  • J.L. Synge: Rachunek tensorowy. Warszawa: Państwowe Wydawnictwo Naukowe, 1964.