Określoność formy: Różnice pomiędzy wersjami

[wersja przejrzana][wersja nieprzejrzana]
Usunięta treść Dodana treść
Nieosobliwość macierzy A oznacza, że ilość niezależnych liniowo wektorów wierszowych macierzy A jest równy wymiarowi macierzy A. Zatem kombinacja liniowa będąca wynikiem A i z będzie niezerowa. Sama niezerowość A oczywiście nie starczy.
uporządkowanie i małe rozwinięcie
Linia 1:
{{Macierzmacierz}}
'''Określoność formy''' – właściwość [[forma kwadratowa|formy kwadratowej]] określonej na rzeczywistej<ref group="uwaga" name="general">Bądź ogólniej: [[przestrzeń liniowa|przestrzeni liniowej]] nad [[ciało uporządkowane|ciałem uporządkowanym]]; w szczególności nie nad [[ciało (matematyka)|ciałem]] [[liczby zespolone|liczb zespolonych]]. Można rozpatrywać inne uogólnienia, np. [[forma hermitowska|formy hermitowskie]] określone na przestrzeniach liniowych nad [[liczby zespolone|liczbami zespolonymi]] i o wartościach rzeczywistych (czy w ciele uporządkowanym); macierze takiej formy powinna być wtedy nie [[macierz symetryczna|symetryczna]] a [[macierz hermitowska|hermitowska]].</ref> [[przestrzeń liniowa|przestrzeni liniowej]], która przyjmuje bądź nie przyjmuje wartości ustalonego [[znak liczby|znaku]].
'''Określoność formy''' – przyjmowanie przez [[Forma kwadratowa|formę kwadratową]] tego samego [[Znak liczby|znaku]], niezależnie od jej argumentu.
 
== Definicja ==
Formę można zdefiniować
{{osobny artykuł|forma kwadratowa}}
:<math>B(x)=\mathbf{x}^{\ T} A \mathbf{x}</math>
gdzieFormę kwadratową <math>\textbf{x} \in \mathbb{R}^nQ</math>, ''A''na jestprzestrzeni [[macierz symetryczna|macierzą symetryczną]] wymiaruliniowej <math> n \times nV</math> nad <math>\mathbb{ R}</math>.<ref group="uwaga" name="general" /> nazywa się
* ''dodatnio określoną'' (lub ''dodatnią''), jeżeli <math>Q(\mathbf x) > 0</math> i
* ''ujemnie określoną'' (lub ''ujemną''), gdy <math>Q(\mathbf x) < 0</math>
dla wszystkich <math>\mathbf x \ne \mathbf 0.</math> Niezdegenerowane<ref group="uwaga">Forma kwadratowa jest niezdegenerowana, gdy przyjmuje wartość zerową wyłącznie dla argumentu zerowego: <math>\scriptstyle Q(\mathbf x) \ne 0</math> tylko dla <math>\mathbf x = \mathbf 0.</math></ref> formy kwadratowe, które nie są ani dodatnio, ani ujemnie określone, nazywa się ''nieokreślonymi''. Rozpatruje się także nierówności nieostre: mówi się wtedy o formach
* ''niedodatnio określoną'' (lub ''niedodatnią'' albo ''dodatnio półokreśloną''), jeżeli <math>Q(\mathbf x) \geqslant 0</math> i
* ''nieujemnie określoną'' (lub ''nieujemną'' albo ''ujemnie półokreśloną''), gdy <math>Q(\mathbf x) \leqslant 0</math>
dla dowolnych <math>\mathbf x \in V.</math>
 
Tak samo określa się dowolną macierz <math>\mathbf Q</math> odpowiadającą pewnej formie <math>Q.</math> W szczególności forma kwadratowa <math>Q</math> może być zadana za pomocą [[forma dwuliniowa|symetrycznej formy dwuliniowej]] <math>B(\mathbf x, \mathbf y)</math> wzorem <math>Q(\mathbf x) = B(\mathbf x, \mathbf x);</math> wtedy macierze tych form są równe. W ten sposób ma sens mówienie nie tylko o określoności (lub jej braku) macierzy form kwadratowych, ale i dowolnych dwuliniowych; w ogólności każda macierz kwadratowa może być macierzą pewnej formy dwuliniowej.
Macierz ''A'' nazywa się macierzą formy ''B''. O określoności formy ''B'' decyduje jej macierz ''A'', dlatego zwrotów ''określoność formy'' i ''określoność macierzy'' używamy zamiennie.
 
== Właściwości ==
Formę można także zdefiniować ogólniej:
Wszystkie dodatnio określone formy na przestrzeni wymiaru <math>n</math> są równoważne<ref group="uwaga" name="equiv">Formy kwadratowe <math>\scriptstyle Q_1</math> i <math>\scriptstyle Q_2</math> określone odpowiednio na <math>\scriptstyle V_1</math> i <math>\scriptstyle V_2</math> nazywa się ''równoważnymi'', jeżeli istnieje taki izomorfizm (liniowy) <math>\scriptstyle \mathrm C\colon V_1 \to V_2,</math> który spełniałby <math>\scriptstyle Q_2(\mathrm C\mathbf x) = Q_1(\mathbf x).</math></ref> sumie <math>n</math> kwadratów, a co za tym idzie: są równoważne<ref group="uwaga" name="equiv"/>; podobnie ma się rzecz z formami określonymi ujemnie. Własności te (w przeciwieństwie do przedstawienia w postaci sumy kwadratów) nie zależą od wyboru współrzędnych. Oznacza to, że wszystkie [[wektory i wartości własne|wartości własne]] dodatnio określonej formy są dodatnie.
:<math>B(x)=\overline{\mathbf{x}}^{\ T} A \mathbf{x}</math>.
gdzie <math>\mathbf{x} \in \mathbb{C}^n</math>, ''A'' jest [[macierz hermitowska|macierzą hermitowską]] wymiaru <math> n \times n</math> nad <math>\mathbb{C}</math>.
 
Dlatego też formy/macierze dodatnio określone są [[wyznacznik|nieosobliwe]], tzn. mają niezerowy wyznacznik (będący iloczynem wszystkich wartości własnych), a zatem [[macierz odwrotna|odwracalne]]; ponadto forma/macierz odwrotna do niej również jest dodatnio określona<ref group="uwaga">Zgodnie z [[twierdzenie Cauchy’ego (teoria wyznaczników)|twierdzeniem Cauchy’ego]] wyznacznik macierzy odwrotnej jest odwrotnością macierzy wyjściowej, odwrotność dodatniej liczby również jest dodatnia</ref> (to samo dotyczy ''[[mutatis mutandis]]'' macierzy ujemnie określonych). Suma form/macierzy dodatnio określonych także jest dodatnio określona<ref>Jeśli <math>\scriptstyle A</math> oraz <math>\scriptstyle B</math> są dodatnio określone, to <math>\scriptstyle A + B</math> również jest dodatnio określona, ponieważ <math>\scriptstyle (A + B)(\mathbf x) = A(\mathbf x) + B(\mathbf x) > 0</math> dla <math>\scriptstyle \mathbf x \ne \mathbf 0.</math></ref>.
Badanie określoności takiej formy ma sens, bowiem <math>B(x)</math> jest liczbą rzeczywistą:
:<math>\overline {B(x)} =\overline {\overline{\mathbf{x}}^{\ T} A \mathbf{x} } = \overline{\overline{\mathbf{x}}^{\ T}} \overline{A} \overline{\mathbf{x}} = \mathbf{x}^{\ T} A^{\ T} \overline{\mathbf{x}} = (\overline{\mathbf{x}}^{\ T} A \mathbf{x})^{\ T} = \left(B(x)\right)^{\ T} = B(x)</math>
Skorzystaliśmy tu z tego, że ''A'' jest hermitowska tj. <math>\overline{A} = A^{\ T}</math> oraz z tego, że B(x) jest macierzą 1×1 tj. <math>\left(B(x)\right)^{\ T} = B(x)</math>.
 
Symetryczna<ref group="uwaga" name="complex">Ogólniej: [[macierz hermitowska|hermitowska]], wtedy transpozycję we wzorze należy zastąpić [[sprzężenie hermitowskie|sprzężeniem hermitowskim]].</math></ref> macierz dodatnio określona <math>\mathbf A</math> ma [[rozkład Choleskiego]], tzn. istnieje macierz odwracalna <math>\mathbf L,</math> dla której <math>\mathbf A = \mathbf{LL}^\mathrm T</math> (wspomniane warunki są tak [[warunek konieczny|konieczne]], jak i [[warunek dostateczny|dostateczne]])
==Definicje==
Forma B(x) oraz jej macierz ''A'' jest:
*'''dodatnio określona''', jeśli <math>B(x)>0</math> dla <math>x\ne 0</math>
*'''ujemnie określona''', jeśli <math>B(x)<0</math> dla <math>x\ne 0</math>
*'''niedodatnio określona''' (półujemnie określona), jeśli <math>B(x) \leqslant 0</math>.
*'''nieujemnie określona''' (półdodatnio określona), jeśli <math>B(x) \geqslant 0</math>.
Jeśli dla pewnych x<sub>1</sub>, x<sub>2</sub> zachodzi B(x<sub>1</sub>)>0, B(x<sub>2</sub>)<0, to formę i jej macierz nazywamy '''nieokreśloną'''.
 
Dla dowolnej nieosobliwej/odwracalnej macierzy rzeczywistej <math>\mathbf A</math> iloczyny <math>\mathbf A^\mathrm T \mathbf A</math> oraz <math>\mathbf{AA}^\mathrm T</math> są dodatnio określone<ref group="uwaga">Dla niezerowej macierzy kolumnowej <math>\mathbf X</math> zachodzi <math>\mathbf X^\mathrm T(\mathbf A^\mathrm T \mathbf A)\mathbf X = (\mathbf{AX})^\mathrm T \mathbf{AX} = \mathbf{AX} \cdot \mathbf{AX} = \|\mathbf{AX}\|^2,</math> skąd [[norma macierzowa]] <math>\|\mathbf{AX}\| > 0</math> (indukowana ze [[iloczyn skalarny|standardowego iloczynu skalarnego macierzy]]) musi być nieujemna, ponieważ tak nieosobliwość/odwracalność macierzy <math>\mathbf A</math> pociąga <math>\mathbf{AX} \ne \mathbf \Theta,</math> wyłącznie kiedy to norma mogłaby być zerowa. Podobnie <math>\mathbf X^\mathrm T(\mathbf{AA}^\mathrm T)\mathbf X = (\mathbf A^\mathbf T \mathbf X)^\mathrm T \mathbf A^\mathbf T \mathbf X = (\mathbf A^\mathbf T \mathbf X) \cdot (\mathbf A^\mathbf T \mathbf X) = \|\mathbf A^\mathbf T \mathbf X\|^2,</math> oznacza <math>\|\mathbf A^\mathbf T \mathbf X\| > 0</math> z tym samym uzasadnieniem końcowym.</ref>. W szczególności wynika stąd, że dodatnio określona jest forma/[[macierz jednostkowa]]<ref group="uwaga">Ze względu na równości <math>\mathbf I = \mathbf I^\mathrm T \mathbf I = \mathbf{II}^\mathrm T.</math></ref>; ponieważ wszystkie wartości własne formy/[[macierz zerowa|macierzy zerowej]] są równe zeru, to jest ona jednocześnie określona nieujemnie i niedodatnio – jest to jedyna forma/macierz o tej własności.
== Twierdzenia ==
* Wszystkie [[Wektory i wartości własne|wartości własne]] macierzy <math>A\;</math> dodatnio określonej są dodatnie.
 
* Macierz dodatnio określona jest zawsze [[Macierz odwrotna#Odwracalność a nieosobliwość|odwracalna]] i jej odwrotność jest również dodatnio określona.
 
* Jeśli <math>A\;</math> i <math>B\;</math> są dodatnio określone, to <math>A+B\;</math> jest dodatnio określona.
 
* Dla macierzy dodatnio określonej i symetrycznej <math>A\;</math> istnieje taka odwracalna macierz <math>M\;</math>, że <math>M M^{\,T} = A\,</math>
:czyli, istnieje dla niej [[rozkład Choleskiego]].
 
* Dla dowolnej nieosobliwej macierzy rzeczywistej <math>A</math> iloczyn <math> A^{\mathrm{T}} A </math> jest dodatnio określony.
:'''Dowód:''' Dla niezerowego wektora <math> z </math> spełniony jest warunek <math> z^{\mathrm{T}} ( A^{\mathrm{T}} A ) z =(Az)^{\mathrm{T}} A z = \| A z \|^2 > 0, </math> ponieważ nieosobliwość macierzy <math>A</math> implikuje, że <math>Az \neq 0.</math>
 
{{Spis treści}}
 
== Przykłady ==
PowyższePoniższe przykłady macierzy pokazują, że znaki elementów macierzy nie mają związku z określonością macierzy.:
 
*Macierz jednostkowa ''I'' jest dodatnio określona.
:Rzeczywiście, dla niezerowego wektora ''z'' o współrzędnych rzeczywistych mamy <math> z^{\mathrm{T}} I z = z^{\mathrm{T}}z = \|z\|^2 > 0</math>.
:Analogicznie, dla dowolnego niezerowego wektora ''z'' o zespolonych współrzędnych mamy <math> z^* I z = z^*z = \|z\|^2 > 0</math>.
: w obu przypadkach <math> \|z\|</math> oznacza iloczyn skalarny odpowiednio [[przestrzeń euklidesowa|przestrzeni euklidesowej]] i [[przestrzeń unitarna|unitarnej]] .
 
*Macierz zerowa jest jednocześnie ujemnie półokreślona i dodatnio półokreślona.
 
* Macierz rzeczywista symetryczna
::<math>\mathbf MP = \begin{bmatrix} -12 & -1 &1 0 \\ -1 &- 2 &0 -1 \\1& 0 & -1 & 2 \end{bmatrix} </math>
 
:: jest dodatnio określona, ponieważ dla dowolnej macierzy kolumnowej <math> MX = \begin{bmatrix} 2a &-1 b &0\\-1&2&-1\\0&-1&2 c \end{bmatrix}^\mathrm T</math> jest
::<math>\begin{align} z^{\mathrm{T}}M zmathbf = (zX^{\mathrm T\mathbf{TPX}}M) z& &= \begin{bmatrix} (2a - b) &( -a + 2b - c) &( -b + 2c) \end{bmatrix} \begin{bmatrix} a & b & c \end{bmatrix}^\bmathrm T \\c & = \begin{bmatrix} 2a^2 - ab - ab + 2b^2 - bc - bc + 2c^2 \end{bmatrix}, \\end{align}</math>
:jest dodatnio określona, ponieważ dla każdego wektora ''z'' = [''a'', ''b'', ''c''] mamy
: co oznacza, że odpowiadająca tej macierzy forma kwadratowa <math>P</math> ma wzór
::<math>\begin{align} z^{\mathrm{T}}M z = (z^{\mathrm{T}}M) z &= \begin{bmatrix} (2a-b)&(-a+2b-c)&(-b+2c) \end{bmatrix} \begin{bmatrix} a\\b\\c \end{bmatrix} \\
&:: <math>P(\mathbf x) = 2{a}2a^2 - 2ab + 2{b}2b^2 - 2bc + 2c^2{ = a^2 + (a-b)^2 + (b-c})^2 \\+ c^2,</math>
: gdzie <math>\mathbf x = (a, b, c),</math> a więc dana jest jako sumę kwadratów (która nieujemna; zeruje się tylko, gdy <math>\mathbf x = \mathbf 0</math>).
&= {a}^2+(a - b)^{2} + (b - c)^{2}+{c}^2
\end{align} </math>
:W wyniku otrzymaliśmy sumę kwadratów, która jest nieujemna; wynik ten jest równy 0 tylko wtedy, gdy ''a'' = ''b'' = ''c'' = 0 ( tj. gdy ''z=''0 ).
 
* Macierz rzeczywista symetryczna
::<math>\mathbf MN = \begin{bmatrix} -1 &3& -21 & 1 \\3 -1 & -2 & 0 \\-2 1 & 0 &1 -2 \end{bmatrix} </math>
 
: jest określone nieujemnie, ponieważ odpowiadająca jej forma kwadratowa <math>N</math> ma postać
::<math> M = \begin{bmatrix} -1&-1&1\\-1&-2&0\\1&0&-2 \end{bmatrix} </math>
:: <math>N(\mathbf x) = -a^2 - 2ab + 2ac - 2b^2 - 2c^2 = -(a + b - c)^2 - (b + c)^2,</math>
:jest ujemnie półokreślona, ponieważ dla każdego wektora ''z''= [''a'',''b'',''c''] mamy
: gdzie <math>\mathbf x = (a, b, c),</math> a suma we wzorze jest niedodatnia: przyjmuje zero wyłącznie dla <math>\mathbf x = (-2t, t, -t),</math> gdzie <math>t \in \mathbb R.</math>
::<math>\begin{align} z^{\mathrm{T}}M z = (z^{\mathrm{T}}M) z &= \begin{bmatrix} (-a-b+c)&(-a-2b)&(a-2c) \end{bmatrix} \begin{bmatrix} a\\b\\c \end{bmatrix} \\
&= -{a}^2 - 2ab +2ac -2{b}^2 -2{c}^2 \\
&= -(a + b - c)^{2} - (b + c)^{2}
\end{align} </math>
:W wyniku otrzymaliśmy sumę, która jest niedodatnia; wynik ten jest równy 0 tylko wtedy, gdy z = [-2k,k,-k].
 
* Macierz rzeczywista symetryczna
::<math>\mathbf Q = \begin{bmatrix} 1 & 3 & -2 \\ 3 & -2 & 0 \\ -2 & 0 & 1 \end{bmatrix}</math>
: jest nieokreślona, co można sprawdzić bezpośrednim rachunkiem dla odpowiadającej jej formy kwadratowej
:: <math>BQ(x)=\mathbf{ x}) = a^{\2 T}- A2b^2 \mathbf{x}+ c^2 + 6ab - 4ac,</math>
: gdzie <math>\mathbf x = (a, b, c),</math> mianowicie:
:* jeśli <math>\mathbf x = (0, 1, 1),</math> to <math>Q(\mathbf x) = -5,</math>
:* jeśli <math>\mathbf x = (2, 1, 0),</math> to <math>Q(\mathbf x) = 14,</math>
:* ponadto dla <math>\mathbf x \ne \mathbf 0</math> jest <math>Q(\mathbf x) \ne 0,</math> czyli forma jest niezdegenerowana.
 
== Zobacz też ==
::<math> M = \begin{bmatrix} 1&3&-2\\3&-2&0\\-2&0&1 \end{bmatrix} </math>
* [[kryterium Sylvestera|kryterium Sylvestera określoności form kwadratowych]]
:jest nieokreślona, ponieważ
* [[twierdzenie o bezwładności form kwadratowych|twierdzenie Sylvestera o bezwładności form kwadratowych]]
::dla ''z''= [0,1,1] mamy <math> z^{\mathrm{T}}M z = -5 </math>
::dla ''z''= [2,1,0] mamy <math> z^{\mathrm{T}}M z = 14 </math>
::Ponadto dla ''z''≠0 mamy <math> z^{\mathrm{T}}M z \ne0 </math>
 
{{uwagi}}
Powyższe przykłady macierzy pokazują, że znaki elementów macierzy nie mają związku z określonością macierzy.
 
[[Kategoria:Macierze|DodatnioAlgebra określonaliniowa]]
[[Kategoria:Macierze]]
 
[[de:Definitheit#Definitheit von Matrizen]]