Ekstremum funkcji: Różnice pomiędzy wersjami

Usunięte 20 bajtów ,  10 lat temu
m
poprawa linków do przek., WP:SK, drobne redakcyjne
m (ort.)
m (poprawa linków do przek., WP:SK, drobne redakcyjne)
{{medal}}
[[Plik:Extrema1.gif|thumb|right|250px|Ekstrema lokalne funkcji <math>\scriptstyle{f(x)=2x^3-9x^2+12x-3}</math> zaznaczone kolorem niebieskim (właściwe maksimum lokalne) i czerwonym (właściwe minimum lokalne)]]
'''Ekstremum''' (l. mn. ''ekstrema''; z [[łacina|łac.]] ''extrēmum'' – koniec) – w [[analiza matematyczna|analizie matematycznej]] największa lub najmniejsza wartość [[Funkcja|funkcji]].
 
* Funkcja <math>f(x)\,</math> przyjmuje w punkcie <math>x_0\,</math> '''maksimum lokalne''' (odpowiednio: '''minimum lokalne'''), jeśli w pewnym [[zbiór otwarty|otwartym]]<ref>Czasem uogólnia się to na dowolne [[zbiór pusty|niepuste]] [[zbiór otwarty|zbiory otwarte]]; Zbiór musi być otwarty, żeby wykluczyć patologiczny przypadek, gdy wybierzemy punkt <math>\scriptstyle{x_0\,}</math> na [[brzeg (matematyka)|brzegu]] tego zbioru. Wówczas np. funkcja <math>\scriptstyle{f(x)=x\,}</math> mogłaby mieć minimum i maksimum właściwe w każdym swoim punkcie.</ref> [[otoczenie (matematyka)|otoczeniu]] tego punktu (np. w pewnym [[przedział (matematyka)|przedziale otwartym]]) funkcja nigdzie nie ma wartości większych (odpowiednio: mniejszych).
* Jeśli dodatkowo w pewnym otwartym [[otoczenie (matematyka)|sąsiedztwie]] punktu <math>x_0\,</math> funkcja nie ma również wartości równych <math>f(x_0),\,</math> to jest to '''maksimum''' (odpowiednio: '''minimum''') '''lokalne właściwe'''.
* Minima i maksima lokalne są zbiorczo nazywane '''ekstremami lokalnymi'''.
 
== Funkcje, dla których można rozważać ekstrema ==
[[Plik:Function illustration.svg|thumb|right|250px|Funkcja jako przyporządkowanie]]
W matematyce wartością [[Funkcja|funkcji]] nie musi być koniecznie liczba – funkcją jest dowolne [[Funkcja|przyporządkowanie]] każdemu elementowi zbioru zwanego [[Dziedzina (matematyka)|dziedziną]] po jednym elemencie zbioru zwanego [[Funkcja|przeciwdziedziną]]. Funkcją jest więc również przyporządkowanie każdemu łysemu aktorowi Teatru Wielkiego koloru włosów jego ulubionej peruki.
 
Pojęcie ekstremum wymaga, by wartości funkcji dało się ze sobą porównywać – w [[Funkcja|przeciwdziedzinie]] funkcji powinien być zatem zdefiniowany jakiś [[Częściowy porządek|porządek]]. Zbiór uporządkowany, i to [[porządek liniowy|liniowo]], tworzą np. [[liczby rzeczywiste]]. Nie ma natomiast powszechnie przyjętego uporządkowania kolorów, zwłaszcza porządku liniowego.
Funkcja <math>f\,</math> o wartościach w zbiorze uporządkowanym określona na przestrzeni topologicznej ma w punkcie <math>x_0\,</math> tej przestrzeni:
* '''minimum lokalne''', jeśli istnieje [[otoczenie (matematyka)|otoczenie]] otwarte <math>U</math> punktu <math>x_0\,</math> takie, że dla każdego <math>x\in U\,</math>
:: <math>f(x)\geqslant f(x_0)\,</math>
: więc nie występują w okolicy punktu <math>x_0\,</math> wartości funkcji mniejsze od <math>f(x_0)\,</math> (ani nieporównywalne), choć mogą występować wartości równe;
* '''maksimum lokalne''', gdy istnieje otoczenie otwarte <math>U\,</math> punktu <math>x_0\,</math> takie, że dla każdego <math>x\in U\,</math>
:: <math>f(x)\leqslant f(x_0)\,</math>
: więc nie występują w okolicy punktu <math>x_0\,</math> wartości funkcji większe od <math>f(x_0)\,</math> (ani nieporównywalne), choć mogą występować wartości równe;
* '''właściwe minimum lokalne''', jeśli w pewnym otoczeniu otwartym <math>U\,</math> punktu <math>x_0\,</math> funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości większe od <math>f(x_0)\,</math> czyli nie ma wartości równych dla <math>x\ne x_0,\,</math> formalnie:
=== Proste przykłady ekstremów ===
<gallery widths="350px" heights="250px" perrow="2">
grafikaPlik:Cosinus.svg|Funkcja [[Funkcje trygonometryczne|cosinus]] osiąga maksimum dla każdej parzystej wielokrotności <math>\pi,</math> czyli <math>\dots, -4\pi, -2\pi, 0, 2\pi, 4\pi, \dots</math> oraz minimum dla każdej nieparzystej wielokrotności <math>\pi,</math> czyli <math>\dots, -5\pi, -3\pi, -\pi, \pi, 3\pi, 5\pi, \dots.</math> Są to lokalne ekstrema właściwe i jednocześnie ekstrema globalne (ale nie globalne ekstrema właściwe!).
grafikaPlik:Function x^2.svg|[[Funkcja kwadratowa]] <math>f(x)=x^2\,</math> osiąga właściwe minimum (lokalne i globalne) dla <math>x=0\,.</math> Nie ma maksimum, nawet lokalnego. Dla każdego argumentu można w jego bezpośrednim sąsiedztwie wskazać punkt w którym funkcja przyjmuje większą wartość.
grafikaPlik:Floor function.svg|Funkcja [[podłoga i sufit|entier]] osiąga w każdym punkcie maksimum lokalne niewłaściwe. Minimum lokalne występuje jednak tylko dla liczb niecałkowitych. W każdym otoczeniu [[Liczbyliczby całkowite|liczby całkowitej]]j z lewej strony występują mniejsze wartości funkcji. Nie ma ekstremów globalnych.
grafikaPlik:Non-strict minimum.svg|Funkcja <math>f(x)=\left\{\begin{array}{l}\scriptstyle{x^2(1+\sin\frac{1}{x}),\; x\neq 0}\\\scriptstyle{0,\; x=0}\end{array}\right.</math> ma w punkcie <math>x_0=0\,</math> minimum lokalne, jednak nie jest to minimum właściwe – w dowolnej bliskości tego punktu można znaleźć inne punkty, w których przyjmuje ona tę samą wartość (oprócz tego posiada nieskończoną liczbę minimów i maksimów właściwych).
</gallery>
 
=== Przykład – właściwe minimum lokalne w każdym punkcie dziedziny ===
[[Plik:Strict minimum everywhere.png|350px|thumb|right350px|Fragment wykresu funkcji <math>\scriptstyle{f\colon \mathbb{Q}\ni \frac{p}{q}\mapsto \left| \frac{q}{\operatorname{NWD}(p,q)} \right| },</math> mającej właściwe minimum w każdym punkcie swojej dziedziny. Kropki – punkty <math>\scriptstyle{\left( \frac{p}{q},q \right)}</math> odpowiadają nieskracalnym ułamkom <math>\scriptstyle{\frac{p}{q}}</math>]]
Niech funkcja&nbsp; <math>f</math> &nbsp;przyporządkowuje każdej [[liczby wymierne|liczbie wymiernej]] wartość mianownika wyrażającego ją [[ułamek|ułamka]] [[skracanieUłamek#Działania ułamkana ułamkach|skróconego]]. Formalnie:
: <math>f\colon \mathbb{Q}\ni \frac{p}{q}\mapsto \left| \frac{q}{\operatorname{NWD}(p,q)} \right| </math>
gdzie NWD oznacza [[największy wspólny dzielnik]].
 
Dla dowolnego wymiernego&nbsp; <math>x</math> &nbsp;istnieje otoczenie otwarte w którym wszystkie inne liczby wymierne mają większy mianownik, a więc większą wartość funkcji&nbsp; <math>f</math>.<ref>
Stwierdzenie to wynika z następującej obserwacji: jeżeli <math>\tfrac{p}{q}</math> jest ułamkiem nieskracalnym, to każdy ułamek <math>\tfrac{a}{b}\neq \tfrac{p}{q}</math> różniący się od <math>\tfrac{p}{q}</math> o mniej niż <math>\tfrac{1}{q^2},</math> ma mianownik większy od ''q''. Nierówność
: <math>\scriptstyle{\left|\frac{p}{q}-\frac{a}{b}\right|< \frac{1}{q^2}}</math>
 
=== Warunek wystarczający ekstremum globalnego (twierdzenie Weierstrassa) ===
Z '''[[Twierdzenie Bolzano-Weierstrassa#Wniosek: twierdzenie Weierstrassa|twierdzenia Weierstrassa]]''' wiadomo, że [[funkcja ciągła]] o wartościach rzeczywistych, określona na [[zbiórprzestrzeń zwartyzwarta|zbiorze zwartym]] (a więc np. na [[Przedział (matematyka)|przedziale domkniętym]]), osiąga ekstrema globalne. Twierdzenie to jest prawdziwe w pełnej ogólności - a więc nie tylko dla funkcji liczbowych, a dla dowolnych funkcji ciągłych, określonych na zwartych podzbiorach dowolnych przestrzeni topologicznych.
 
=== Funkcje różniczkowalne ===
W dalszej części sekcji rozważane będą funkcje <math>f\colon [a,b] \to \mathbb R</math> [[funkcja ciągła|ciągłe]] oraz [[funkcja różniczkowalna|różniczkowalne]] w przedziale <math>(a,b).\,</math>
Geometrycznie oznacza to, że ich wykres jest "nieprzerwany" i "gładki", czyli ma w każdym punkcie [[styczna|styczną]].
 
==== Warunek konieczny ekstremum lokalnego (twierdzenie Fermata) ====
[[Plik:Extrema2.gif|thumb|right|250px|Funkcja <math>\scriptstyle{g(x)=x^3}</math> nie ma dla <math>x=0\,</math> ekstremum lokalnego, mimo że jej pochodna w tym punkcie jest równa zero]]
[[warunek konieczny|Warunkiem koniecznym]] istnienia ekstremów lokalnych funkcji <math>f\,</math> w pewnym punkcie <math>x_0\in (a,b)</math> jest
: <math>f^\prime (x_0)=0</math>
Zatem <math>f'(x_0) =\; 0</math>. ∎
 
Warunek Fermata nie jest jednak [[warunek wystarczający|wystarczający]]. Np. funkcja <math>g(x)=x^3\,</math> nie ma ekstremum, chociaż jej pochodna <math>g^\prime(x)=3x^2\,</math> zeruje się dla <math>x_0=0.\,</math> Ekstremum może natomiast istnieć w punktach, w których nie istnieje (obustronna) pochodna skończona - funkcja <math>h(x)=x^{\frac{2}{3}}</math> ma na przykład, minimum w punkcie <math>x_0=0,\,</math> podczas gdy jej pochodna lewostronna w tym punkcie równa się <math>-\infty,</math> a prawostronna <math>+\infty.</math> Podobnie funkcja [[wartość bezwzględna]] ma w punkcie <math>x_0=0\,</math> minimum globalne, chociaż w tym punkcie nie jest różniczkowalna.
 
==== Warunek konieczny i wystarczający istnienia ekstremum lokalnego ====
==== Inne warunki wystarczające istnienia ekstremów ====
Jeśli o funkcji <math>f,\,</math> określonej jak wyżej, założy się dodatkowo, że jest dwukrotnie różniczkowalna w przedziale <math>(a,b)\,</math> oraz jej [[druga pochodna]] jest ciągła, to jeżeli <math>f^\prime(x_0)=0</math> i <math>f^{\prime\prime}(x_0)\neq 0,</math> to funkcja <math>f\,</math> ma w punkcie <math>x_0\,</math> ekstremum, przy czym, gdy <math>f^{\prime\prime}(x_0)<0,</math> to jest to maksimum lokalne, a gdy <math>f^{\prime\prime}(x_0)>0,</math> to minimum lokalne<ref>'''Dowód:''' Ze [[wzór Taylora|wzoru Taylora]] dla <math>\scriptstyle{n=2}</math> wynika:
: <math>\scriptstyle{f(x_0+h)=f(x_0)+hf^\prime(x_0)+\frac{1}{2}h^2f^{\prime\prime}(x_0+\theta h)}</math>
gdzie
: <math>\scriptstyle{0<\theta<1}</math>
więc z:
: <math>\scriptstyle{f^\prime(x_0)=0}</math>
wynika:
: <math>\scriptstyle{f(x_0+h)-f(x_0)=\frac{1}{2}h^2f^{\prime\prime}(x_0+\theta h)}</math>
Dla <math>\scriptstyle{h\neq 0}</math> prawa strona ma ten sam znak, co <math>\scriptstyle{f^{\prime\prime}(x_0+\theta h).}</math> Gdy <math>\scriptstyle{ f^{\prime\prime}(x_0)<0,}</math> to z ciągłości <math>\scriptstyle{f^{\prime\prime}}</math> wynika <math>\scriptstyle{f^{\prime\prime}(x)<0}</math> w pewnym otoczeniu punktu <math>\scriptstyle{x_0,}</math> więc w tym otoczeniu
: <math>\scriptstyle{f(x_0+h)-f(x_0)=f(x)-f(x_0)<0}</math> dla <math>\scriptstyle{x\neq x_0,}</math>
zatem istnieje maksimum w punkcie <math>\scriptstyle{x_0.}</math> Analogicznie, istnieje minimum gdy <math>\scriptstyle{f^{\prime\prime}(x_0)>0.}</math></ref>.
Powyższe kryterium nie rozstrzyga przypadku, gdy druga pochodna jest równa zero.
Jeżeli założy się dodatkowo o funkcji <math>f,\,</math> że jest <math>n\,</math>-krotnie razy różniczkowalna i <math>n\,</math>-ta pochoda jest ciągła w <math>(a,b),\,</math> to prawdziwe jest następujące twierdzenie:
 
Jeżeli
: <math>f^\prime(x_0)=f^{\prime\prime}(x_0)=\ldots=f^{(n-1)}(x_0)=0</math>
tj. wszystkie pochodne do <math>(n-1)\,</math>-ej zerują się w punkcie <math>x_0,\,</math> a <math>n\,</math>-ta pochodna jest różna od zera, to
* gdy <math>n\,</math> jest liczbą [[LiczbyParzystość parzyste i nieparzysteliczb|parzystą]], to <math>f\,</math> ma ekstremum w punkcie <math>x_0,\,</math> przy czym jest to maksimum, gdy <math>f^{(n)}(x_0)<0\,</math> lub minimum, gdy <math>f^{(n)}(x_0)>0,\,</math>
* gdy <math>n\,</math> jest liczbą [[LiczbyParzystość parzyste i nieparzysteliczb|nieparzystą]], ekstremum nie istnieje.
 
Z założenia zerowania się pochodnych do <math>(n-1),\,</math> można wyprowadzić korzystając ze [[wzór Taylora|wzoru Taylora]]:
 
=== Proste zagadnienia optymalizacyjne ===
[[Plik:Pudelko.png|thumb|right|200px|Siatka prostopadłościennego pudełka wykonana z kwadratu o boku długości <math>\scriptstyle{a.}</math>]]
Zagadnienie wyznaczania ekstremów funkcji występuje często w fizyce i technice. Oto przykład:
 
; Problem: Z kwadratowego arkusza blachy o boku <math>a\,</math> wycinane są przy wierzchołkach [[przystawanie (geometria)|przystające]] kwadraty i po zagięciu brzegów tworzone jest [[prostopadłościan|prostopadłościenne]] pudełko. Jak otrzymać pudełko o największej objętości?
 
; Rozwiązanie 1: Jeśli przez <math>x</math> oznaczyć długość boku wyciętego kwadratu, to objętość <math>V</math> pudełka będzie równa
:: <math>V(x) = x(a-2x)^2</math>
: przy czym
:: <math>0 \leqslant x \leqslant \tfrac{1}{2}a</math>
: Zadanie sprowadza się do znalezienia ekstremum funkcji <math>V</math> w przedziale <math>[0, \tfrac{1}{2}a],</math> przy czym wartości krańcowe reprezentują pudełko odpowiednio bez ścianek oraz bez podstawki, a więc o zerowej (minimalnej) objętości.
: Pochodna
:: <math>V^\prime(x) = (a-2x)(a-6x)</math>
: zeruje się na tym przedziale w punktach <math>x_0 := \tfrac{a}{6}</math> oraz <math>x_1 := \tfrac{a}{2}</math> (w tym przypadku objętość jest zerowa). Ponieważ funkcja objętości jest dodatnia wewnątrz przedziału, 0 na jego końcach i ma we wnętrzu nie więcej niż jedno ekstremum lokalne, to ma ona dokładnie jedno maksimum, które jest zarazem lokalne i globalne ([[twierdzenie Rolle'a]]); osiągane jest ono w <math>x_0</math>. Dlatego największa objętość pudełka wynosi
:: <math>V(x_0) = \frac{2}{27} a^3</math>
 
: jest stałe i dodatnie, więc stała i dodatnia jest też [[średnia arytmetyczna]] nieujemnych liczb <math>A, B, C.</math>
 
: <math>W(x)</math> jest natomiast sześcianem ich [[średnia geometryczna|średniej geometrycznej]]. Wiadomo, że średnia geometryczna liczb nieujemnych jest zawsze mniejsza lub równa od arytmetycznej, przy czym równość między tymi średnimi zajdzie tylko, gdy <math>A=B=C</math> (zob. [[nierówność między średnimi potęgowymi|nierówności między średnimi potęgowymi]]), czyli gdy
:: <math>4x = a - 2x,</math>
: czyli dla
:: <math>x= \frac{a}{6}</math>
: Zatem dla tej właśnie wartości <math>x,</math> <math>V(x)</math> przyjmuje wartość maksymalną:
:: <math>V\left( \frac{a}{6}\right) = \frac{2}{27} a^3</math>
: Przyrównując pochodną <math>f^\prime</math> do zera mamy:
:: <math>2bv-\tfrac{a}{v^2}=0,</math> skąd <math>v=\sqrt[3]{\tfrac{a}{2b}}</math>
: Ponieważ druga pochodna
:: <math>f^{\prime\prime}(v)=2b+2\tfrac{a}{v^3}>0</math>
: więc koszty rzeczywiście osiągną najmniejszą wartość dla znalezionej wartości <math>v.\,</math>
Pewne wyniki związane z istnieniem ekstremów, otrzymane dla funkcji argumentów rzeczywistych, przenoszą się na funkcje określone na [[podzbiór|podzbiorach]] [[przestrzeń unormowana|przestrzeni unormowanych]].
 
[[Plik:HyperbolicParaboloid2.png|thumb|right|200px|[[Paraboloida hiperboliczna]] – w pobliżu początku układu współrzędnych ma ona kształt podobny do siodła (zob. [[punkt siodłowy]])]]
W dalszej części tego paragrafu przez <math>X\,</math> rozumiana jest dowolna przestrzeń unormowana, zaś przez <math>D\,</math> pewien jej [[zbiór otwarty|otwarty]]<ref>por. [[Różniczka#Różniczkowalność a otwartość zbioru|Różniczkowalność a otwartość zbioru]]</ref> podzbiór. Funkcja <math>f\colon D\to\mathbb{R}</math> musi być [[różniczka|różniczkowalna (w sensie Frécheta)]] w zbiorze <math>D.\,</math> Przez zapis <math>f^\prime(x_0)</math> lub <math>df(x_0)\,</math> rozumie się [[różniczka|różniczkę]] funkcji <math>f,\,</math> która jest [[odwzorowaniePrzekształcenie liniowe|odwzorowaniem liniowym]] i ciągłym przestrzeni <math>X\,</math> o wartościach w <math>\mathbb{R}.</math> Pochodna <math>n\,</math>-tego rzędu funkcji (<math>n\,</math>-krotnie różniczkowalnej) jest [[odwzorowaniePrzekształcenie wieloliniowe|odwzorowaniem <math>n\,</math>-liniowym]] przestrzeni <math>X\times \ldots \times X</math> o wartościach rzeczywistych i oznaczana jest przez <math>f^{(n)}(x_0)\,</math> lub <math>df^n(x_0).\,</math>
 
Podobnie jak dla funkcji rzeczywistych, warunkiem koniecznym istnienia ekstremum w punkcie <math>x_0\in D</math> jest, aby wartość funkcji będącej różniczką w <math>x_0\in D</math> wynosiła zero dla wszystkich punktów w pewnym otoczeniu <math>x_0</math> (<math>\, f^\prime(x_0)\equiv 0\,</math>).
Punkt, w którym różniczka się zeruje (jest funkcją stale równą zero w pewnym otoczeniu <math>x_0</math>), nazywany jest '''punktem stacjonarnym'''.
 
Tak jak w przypadku funkcji jednej zmiennej, w punkcie stacjonarnym wcale nie musi być ekstremum. Na przykład dla funkcji <math>g\colon \mathbb{R}^2\to \mathbb{R}\,</math> danej wzorem <math>g(x,y)=xy,\,</math> której wykresem jest [[paraboloida hiperboliczna]], [[pochodna cząstkowa|pochodne cząstkowe]] <math>g^\prime_x(x,y)=x,\; g^\prime_y(x,y)=y\,</math> są jednocześnie równe zeru<ref>Jeśli którakolwiek pochodna kierunkowa, w tym pochodna cząstkowa, jest różna od zera, to również różniczka jest niezerowa (o ile istnieje). W tym przykładzie obie pochodne cząstkowe są ciągłe, <!-- a więc korzystając z twierdzenia ??? - z lematu Schwarza --> istnieje również pochodna Frécheta i <math>\scriptstyle{ f^\prime(x_0)\equiv 0}</math>.</ref> tylko w punkcie <math>(0,0),\,</math> w którym <math>f(x,y)=0.\,</math> Jednocześnie widać (por. rysunek obok), że w dowolnym otoczeniu zera funkcja przybiera zarówno wartości dodanie jak i ujemne, a więc nie może być w nim ekstremum.
 
=== Definicje pomocnicze ===
Na potrzeby dalszych twierdzeń, konieczne będzie wprowadzenie kilku definicji:
 
[[Funkcjonał dwuliniowy]] <math>\varphi\colon X\times X\to \mathbb{R}\,</math> jest '''nieujemny, niedodatni, dodatni, ujemny''' jeśli odpowiednio <math>\varphi(h,h)\geqslant 0,\; \varphi(h,h)\leqslant 0,\; \varphi(h,h)> 0,\; \varphi(h,h)< 0\,</math> dla wszelkich <math>0\neq h\in X.\,</math>
 
Funkcjonał dwuliniowy <math>\,\varphi\colon X\times X\to \mathbb{R}\,</math> jest
* '''dodatnio określony''', jeśli
: <math>\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\geqslant c\|h\|^2</math>
f^\prime_x(x_0,y_0)=0 \\
f^\prime_y(x_0,y_0)=0 \\
\end{matrix}\right. </math> (rozwiązując ten układ równań)<ref>W przypadku funkcji różniczkowalnej <math>\scriptstyle{z=f(x,y)}</math> równości te mają prosty sens geometryczny: [[płaszczyzna styczna]] do powierzchni <math>\scriptstyle{z=f(x,y)}</math> w jej punkcie odpowiadającym ekstremum powinna być równoległa do płaszczyzny <math>\scriptstyle{xy.}</math></ref><br />
# Dla każdego punktu z osobna badamy znak [[hesjan|wyznacznika Hessego]]<br /><br /><math>\delta(x_0,y_0)=\left|\begin{array}{ll}f^{\prime\prime}_{xx}(x_0,y_0) & f^{\prime\prime}_{xy}(x_0,y_0) \\ f^{\prime\prime}_{yx}(x_0,y_0) & f^{\prime\prime}_{yy}(x_0,y_0)\end{array}\right|</math><br /><br />Na mocy [[lemat Schwarza|lematu Schwarza]] <math>f^{\prime\prime}_{xy}(x_0,y_0)=f^{\prime\prime}_{yx}(x_0,y_0),\,</math> więc<br /><br /><math>\delta(x_0,y_0)=f^{\prime\prime}_{xx}(x_0,y_0)f^{\prime\prime}_{yy}(x_0,y_0)-(f^{\prime\prime}_{xy}(x_0,y_0))^2.</math><br /><br />
# Jeżeli w danym punkcie <math>(x_0, y_0)\,</math> wyznacznik <math>\delta(x_0,y_0)<0,\,</math> to w tym punkcie nie ma ekstremum, jeśli <math>\delta(x_0,y_0)=0,\,</math> to w pewnych przypadkach może istnieć ekstremum, a pewnych nie<ref>np. funkcja <math>\scriptstyle{f(x,y)=x^4+y^4}</math> ma w punkcie <math>\scriptstyle{(0,0)}</math> minimum, natomiast funkcja <math>\scriptstyle{g(x,y)=x^3+y^2}</math> nie ma w punkcie <math>\scriptstyle{(0,0)}</math> ekstremum lokalnego</ref>. I ostatecznie, jeżeli <math>\delta(x_0,y_0)>0,\,</math> to istnieje ekstremum lokalne w tym punkcie, przy czym:
:* jeśli <math>f^{\prime\prime}_{xx}(x_0,y_0)>0\,</math> co dla <math>\delta(x_0,y_0)>0\,</math> jest równoważne <math>f^{\prime\prime}_{yy}(x_0,y_0)>0,\,</math> to jest to minimum lokalne,
:* jeśli <math>f^{\prime\prime}_{xx}(x_0,y_0)<0\,</math> co dla <math>\delta(x_0,y_0)>0\,</math> jest równoważne <math>f^{\prime\prime}_{yy}(x_0,y_0)<0\,</math> to jest to maksimum lokalne.
 
=== Przykład ===
[[Plik:Extrema3.gif|thumb|right|250px|Wykres funkcji <math>\scriptstyle{f\left( {x,y} \right) = 2x^3 - y^3 + 12x^2 + 27y}</math> z zaznaczonymi ekstremami lokalnymi i punktami siodłowymi]]
Znaleźć ekstrema funkcji
: <math>f\left( {x,y} \right) = 2x^3 - y^3 + 12x^2 + 27y\,</math>
Obliczamy pierwsze pochodne cząstkowe funkcji <math>f</math> i przyrównujemy do zera:
: <math>
\left\{ \begin{matrix}
f^\prime_x(x,y) = 0 \Leftrightarrow 6x^2 + 24x = 0 \\
f^\prime_y(x,y) = 0 \Leftrightarrow -3y^2 + 27 = 0 \\
\end{matrix} \right.
</math>
Układ równań ma dokładnie 4 rozwiązania, którymi są punkty
: <math>a=(0,3),\ b=(0,-3),\ c=(-4,-3),\ d=(-4,3)\, </math>
 
* <math>\delta(a)<0\,</math> i <math>\delta(c)<0\, </math> – zatem w tych punktach nie ma ekstremów (na wykresie zaznaczono je na pomarańczowo, są to tzw. [[punkt siodłowy|punkty siodłowe]] funkcji <math>f</math>).
* <math>\delta(b)>0\, </math> – w tym punkcie jest minimum lokalne (zaznaczono na czerwono).
* <math>\delta(d)>0\, </math> – w tym punkcie jest maksimum lokalne (zaznaczono na zielono).
 
pozwala wyznaczyć ekstrema funkcji <math>y\,</math> uwikłanej w równaniu
<math>F(x,y)=0\,</math><ref>Wzór ten można otrzymać różniczkując tożsamość <math>\scriptstyle{F^\prime_x+F^\prime_yy^\prime(x)=0}</math> dla <math>\scriptstyle{x\in (x_0-\delta, x_0+\delta)}</math></ref>. W tym celu należy wyznaczyć punkty, w których
: <math>F(x,y)=0, y^\prime=0, y^{\prime\prime}\neq 0\,</math>
Dwa ostatnie warunki równoważne są poniższym, tj.
: <math>F^\prime_x=0, -\frac{F^{\prime\prime}_{xx}}{F^\prime_y}\neq 0\,</math>
 
=== Przykład ===
Znaleźć ekstrema funkcji <math>y,</math> określonej równaniem
: <math>F(x,y)=x^2-2xy-3y^2+4=0\,</math>
 
Ponieważ
: <math>F^\prime_x(x,y)=2x-2y=0</math>
tylko gdy <math>x=y,</math> więc wstawiając to do równania
: <math>F(x,y)=0\,</math>
otrzymujemy jako jedyne rozwiązania punkty <math>(1,1), (-1,-1).</math>
 
Ponieważ
: <math>F^\prime_y(x,y)=-2x-6y</math>
oraz
: <math>F^{\prime\prime}_{xx}(x,y)=2</math>
zatem w punkcie <math>(1,1)</math> druga pochodna
: <math>y^{\prime}(x)=-\tfrac{2}{-8}=\tfrac{1}{4}>0</math>
czyli w tym punkcie jest minimum lokalne, natomiast w punkcie <math>(-1,-1),</math>
: <math>y^{\prime\prime}(-1)=\tfrac{-2}{8}=-\tfrac{1}{4}<0,</math>
czyli w tym punkcie jest maksimum lokalne funkcji <math>y.</math>
 
== Rachunek wariacyjny ==
{{main|Rachunek wariacyjny}}
[[Plik:Braquistócrona.gif|rightthumb|260px|thumb|Na czerwono zaznaczono fragment [[cykloida|cykloidy]] - brachistochronę. [[Punkt materialny]] stacza się od punktu <math>\scriptstyle{A}</math> do punktu <math>\scriptstyle{B}</math> w najkrótszym czasie właśnie po tej krzywej.]]
Ważnymi obiektami matematycznymi są te [[funkcjonał]]y, które danej funkcji przypisują liczbę rzeczywistą, np. długość [[łuk (matematyka)|łuku]] jej wykresu. Przestrzeń funkcyjna jest przestrzenią unormowaną, opisywaną w jednej z wcześniejszych sekcji, jednak badanie ekstremów tych funkcjonałów jest szczególnie istotne ze względu na zastosowania w fizyce i technice – przykładowo jeśli funkcja będąca argumentem funkcjonału opisuje kształt [[śmigło|śmigła]] samolotu, a wartości funkcjonału opisują wydajność śmigła, to znalezienie globalnego maksimum jest równoważne wyliczeniu jaki kształt śmigła zapewni największą wydajność.
 
Badania funkcjonałów zapoczątkował [[Leonhard Euler|Leonard Euler]]. Klasycznym problemem, prowadzącym do znalezienia ekstremów pewnego funkcjonału jest [[brachistochrona|zagadnienie brachistochrony]], postawione w [[1696]] przez [[JanJohann Bernoulli|Jana Bernoulliego]] w periodyku ''Acta Eroditorium''. Sprowadza się ono do znalezienia takiej krzywej łączącej dwa punkty <math>A</math> i <math>B,</math> aby ciało staczające się po niej od punktu <math>A</math> do <math>B</math> pokonało tę drogę w najkrótszym czasie<ref>Problem brachistochrony został rozwiązany przez [[Isaac Newton|Newtona]], [[Gottfried Wilhelm Leibniz|Leibniza]], [[Guillaume Francois Antoine de l'Hospital|de l’Hospitala]] (ucznia Jana Bernoulliego) oraz [[JakubJakob Bernoulli|Jakuba Bernoulliego]].</ref>.
 
=== Ekstrema mocne i słabe ===
Rachunek wariacyjny bada ekstrema funkcjonałów, często zadanych w postaci [[całka Lebesgue'a|całek]]. W [[mechanika klasyczna|mechanice klasycznej]] ważne są równania, pozwalające na znajdowanie torów cząstek <math>q_k,</math> jeśli znana jest funkcja <math>L</math> ([[lagranżjan]]), opisująca ten układ. Równania te zostały wprowadzone w [[1750]] roku przez [[Leonhard Euler|Leonharda Eulera]] oraz [[Joseph Louis Lagrange|Josepha Louisa Lagrange'a]] i zwane są dziś nazwiskami ich odkrywców. Równania Eulera-Lagrange'a mają ścisły związek z metodami rachunku wariacyjnego.
 
Formalnie, o funkcji <math>L</math> zakłada się że jest określona na <math>\mathbb{R}^{2n+1}</math> oraz jest dwukrotnie różniczkowalna w sposób ciągły. Dalej, o funkcji
: <math>[a,b]\ni t \mapsto q(t)=(q_1(t), \ldots, q_n(t))\in \mathbb{R}^n</math>
zakłada się, że jest funkcją o wartościach wektorowych, dwukrotnie różniczkowalną w sposób ciągły. W celu wyznaczenia toru cząstki, określa się funkcjonał
: <math>F(q)=\int\limits_a^b L\left(t, q_1(t), \ldots, q_n(t), \frac{dq_1}{dt}(t), \ldots, \frac{dq_n}{dt}(t)\right)dt</math>
Ekstremów tego funkcjonału szuka się w klasie funkcji dwukrotnie różniczkowalnych, przyjmujących na końcach przedziału <math>[a,b]</math> wartości
: <math>q_1(a), q_1(b), \ldots, q_n(a), q_n(b)</math>
Jest to problem z tzw. [[Zagadnienie brzegowe|ustalonym brzegiem]]. Okazuje się, że funkcje <math>q_i,</math> dla których funkcjonał <math>F</math> przyjmuje ekstremum, spełniają układ [[Równanie różniczkowe cząstkowe|równań różniczkowych cząstkowych]], zwanych '''równaniami Eulera-Lagrange'a''', postaci:
: <math>\frac{\partial L}{\partial q _{k}} - \frac{d}{dt} \left (\frac{\partial L}{\partial \dot{q} _{k}}\right ) = 0,\;\; 1\leqslant k \leqslant n</math>
gdzie
: <math>\dot{q} _{k}=\frac{dq_k}{dt}.</math>
 
== Ekstrema warunkowe ==
W matematyce i fizyce zachodzi często potrzeba badania ekstremów funkcji przy pewnych dodatkowych warunkach. Chcąc np. znaleźć odległość punktu <math>(x_0, y_0, z_0)\in\mathbb{R}^3</math> od [[hiperpowierzchniaRozmaitość topologiczna|hiperpowierzchni]] zadanej równaniem <math>g(x,y,z)=0</math> należy zbadać minima funkcji
: <math>f(x,y,z)=(x-x_0)^2+(y-y_0)^2+(z-z_0)^2\,</math>
przy warunku dodatkowym
: <math>g(x,y,z)=0\,</math>
W paragrafie tym podamy ogólną definicję ekstremum warunkowego i ogólne wyniki tej teorii, badanie ekstremów warunkowych funkcji tylko dwóch zmiennych zostanie omówione w następnym ustępie.
# <math>X</math> i <math>Y</math> są [[przestrzeń Banacha|przestrzeniami Banacha]],
# <math>G\colon X\to Y</math> jest różniczkowalne w sposób ciągły w pewnym otoczeniu punktu <math>x_0\in X,</math>
# <math>x_0\in X</math> jest [[punkt regularny#Teoria różniczkowania|punktem regularnym]] zbioru <math>M=G^{-1}(\{0\}),</math> tj. <math>G^\prime(x_0)</math> jest [[suriekcjaFunkcja "na"|suriekcją]] <math>X</math> na <math>Y,</math>
# <math>X_1:=(G^\prime(x_0))^{-1}(\{0\}),</math> to znaczy <math>X_1</math> jest [[Jądro (algebra)|jądrem]] <math>G^\prime(x_0),</math>
# <math>X=X_1\oplus X_2</math> (rozkład przestrzeni <math>X</math> na [[topologiczna suma prosta|topologiczną sumę prostą]]).
 
Niech <math>f</math> będzie funkcją określoną na otwartym podzbiorze <math>U</math> przestrzeni Banacha <math>X</math> o wartościach w <math>\mathbb{R}</math> oraz niech <math>x_0\in X</math> będzie punktem regularnym zbioru <math>M=G^{-1}(0).</math> Jeżeli funkcja <math>f</math> jest różniczkowalna w punkcie <math>x_0</math> i ma w tym punkcie ekstremum warunkowe, to
: <math>f^\prime(x_0)x_1=0</math>
dla każdego <math>x_1\in X_1.</math>
 
jest dodatnio (ujemnie) określona dla <math>h\in X_1=\ker G^\prime(x_0),</math> to funkcja <math>f</math> ma w punkcie <math>x_0</math> minimum (maksimum) warunkowe.
 
Twierdzenie to można udowodnić korzystając z twierdzenia Lusternika i odpowiednio wykorzystując [[wzór Taylora|twierdzenia Taylora]]. Daje się ono łatwo uogólnić na przypadek pochodnych wyższych rzędów - w tym przypadku dodatkowo zakłada się że odwzorowania <math>f</math> i <math>G</math> są różniczkowalne <math>2n</math> razy w sposób ciągły w pewnym otoczeniu punktu <math>x_0.</math> Wówczas, jeżeli istnieje funkcjonał <math>\Lambda\in Y^\star</math> taki, że
: <math>f^{(k)}(x_0)=\Lambda\circ G^{(k)}(x_0)</math>
dla <math>k=1,2,\ldots, 2n-1</math> oraz odwzorowanie
: <math>\left(f^{(2n)}(x_0)-\Lambda\circ G^{(2n)}(x_0)\right)(h)</math>
jest dodatnio<ref>Uwaga: w tym wypadku pojęcie dodatniej (ujemnej) określoności zostaje rozszerzone na [[odwzorowaniePrzekształcenie wieloliniowe|funkcjonały ''n''-liniowe]], tj. powiemy że funkcjonał <math>\scriptstyle{n}</math>-liniowy <math>\scriptstyle{\varphi\colon X\times\ldots\times X\to \mathbb{R}}</math> jest dodatnio (ujemnie) określony, jeśli istnieje takie <math>\scriptstyle{c>0,}</math> że <math>\scriptstyle{\varphi(h,\ldots, h)\geqslant c\|h\|^n \; (\leqslant -c\|h\|^n)}</math> dla wszelkich <math>\scriptstyle{h\in X.}</math></ref> (ujemnie) określona dla <math>h\in X_1,</math> to funkcja <math>f</math> ma w punkcie <math>x_0</math> minimum (maksimum) warunkowe.
 
=== Ekstrema warunkowe w <math>\mathbb{R}^n</math> ===
Badanie ekstremów warunkowych przekształceń dowolnych przestrzeni Banacha jest rzeczą trudną. Już samo spełnienie założeń twierdzenia Lusternika może okazać się niemożliwe, gdyż nie każdą przestrzeń unormowaną da się rozłożyć na topologiczną sumę prostą jej podprzestrzeni<ref>Da się to zrobić w przypadku [[przestrzeń Hilberta|przestrzeni Hilberta]] - [[twierdzenie o rozkładzie ortogonalnym]] mówi, że dla każdej [[zbiór domknięty|domkniętej]] podprzestrzeni przestrzeni Hilberta istnieje [[dopełnienie ortogonalne]]. W szczególności, rozkład taki jest możliwy jeżeli <math>\scriptstyle{X}</math> jest przestrzenią skończenie wymiarową.</ref>. Duża część zagadnień praktycznych sprowadza się do badania ekstremów warunkowych w przypadku gdy <math>X=\mathbb{R}^n,\; Y=\mathbb{R}^m,\; n\geqslant m,</math> a odwzorowanie <math>G\colon \mathbb{R}^n\to \mathbb{R}^m</math> reprezentowane jest przez układ <math>m</math> funkcji o <math>n</math> zmiennych, tj. <math>G=(G_1,\ldots, G_m).</math>
 
Szukanie ekstremów warunkowych funkcji <math>f\colon \mathbb{R}^n\to\mathbb{R},</math> będących zarazem punktami regularnymi<ref name="punktreg">por. [[Punkt regularny#Szczególne przypadki|punkt regularny (szczególne przypadki)]].</ref>, sprowadza się do rozwiązania układu równań operatorowych
gdzie <math>\Lambda\in (\mathbb{R}^m)^\star.</math> Wiadomo, że każdy taki funkcjonał <math>\Lambda</math> jest reprezentowany przez układ <math>m</math> [[liczby rzeczywiste|liczb rzeczywistych]] <math>\lambda_1,\ldots,\lambda_m</math> a pochodna <math>G^\prime(x)</math> jest [[macierz]]ą wymiaru <math>m\times n</math> [[rząd macierzy|rzędu]] <math>m</math><ref name="punktreg"/>. Układ równań operatorowych sprowadza się więc do układu <math>m+n</math> równań skalarnych:
: <math>\left\{\begin{array}{l}\frac{\partial f(x)}{\partial x_j}=\sum_{i=1}^m\lambda_i\frac{\partial G_i(x)}{\partial x_j},\; j=1,\ldots,n\\G_k(x_1,\ldots, x_n)=0,\; k=1,\ldots, m\end{array}\right.</math>
gdzie <math>x=(x_1,\ldots,x_n)</math> o <math>n+m</math> zmiennych <math>\lambda_i, x_k, \; i\leqslant m, k\leqslant n.</math> Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby <math>\lambda_i</math> spełniają tylko rolę pomocniczą i nazywane są często [[mnożnikMnożniki Lagrange'a|mnożnikami Lagrange'a]]. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, należy odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną określoność)
: <math>f^{\prime\prime}(x)-\Lambda\circ G^{\prime\prime}(x)</math>
dla
: <math>h\in X_1=\ker G^\prime(x_0)</math>
co sprowadza się do badania [[forma kwadratowa|formy kwadratowej]]
: <math>\sum_{i,j=1}^n\left(\frac{\partial^2f(x)}{\partial x_i\partial x_j}-\sum_{k=1}^m\lambda_k\frac{\partial^2 G_k(x)}{\partial x_j\partial x_j}\right)h_ih_j</math>
gdzie
: <math>h\in X_1, h=(h_1, \ldots, h_n).</math>
Warunek <math>h\in X_1</math> jest równoważny równaniu
: <math>G^\prime(x)h=0</math>
które w postaci macierzowej przybiera formę
 
W praktyce, gdy <math>X=\mathbb{R}^2, Y=\mathbb{R}</math> wprowadzamy funkcję pomocniczą
: <math>F(x,y)=f(x,y)+\lambda G(x,y)\,</math>
i szukamy dla niej warunków koniecznych na istnienie jej ekstremów, jako funkcji dwóch zmiennych<ref>por. ustęp [[ekstremum#Funkcje określone na podzbiorach płaszczyzny|Funkcje określone na podzbiorach płaszczyzny]]</ref>, tj. rozwiązaniu układu równań <math>F^\prime_x=0, F^\prime_y=0,</math> a następnie wyrugowaniu z tego układu równań czynnika nieoznaczonego <math>\lambda.</math><br />Do otrzymanego warunku dołączamy warunek <math>G(x,y)=0.</math> Równoważnie, wszystkie punkty, które mogą być ekstremami warunkowymi można wyznaczyć z układu równań
: <math>\left\{\begin{array}{l}\frac{D(f,G)}{D(x,y)}=0\\G(x,y)=0\end{array}\right.</math>
 
=== Przykład – ekstrema funkcji na okręgu ===
[[Plik:Lagrange very simple.jpg|thumb|right|300px|Wykresem funkcji <math>f(x,y)=x+y\,</math> jest [[płaszczyzna]]. W przestrzeni trójwymiarowej, równanie <math>x^2+y^2=1\,</math> opisuje [[Walec (bryła)|walec]] (u którego podstawy, na płaszczyźnie <math>xy\,</math> leży okrąg jednostkowy). Szukanie ekstremów warunkowych sprowadza się w tym wypadku do badania punktów ekstremalnych [[Przekrój zbiorów|części wspólnej]] walca i płaszczyzny.]]
Ilustracją zastosowania metody mnożników Lagrange'a jest problem wyznaczenia ekstremów funkcji:
: <math>f(x,y)=x+y\,</math>
na kole jednostkowym, tj. przy warunku
: <math>x^2+y^2=1\,</math>
Zatem funkcja <math>G</math> jest postaci
: <math>G(x,y)=x^2+y^2-1\,</math>
a więc funkcja <math>F</math> wyraża się wzorem:
: <math>F(x,y)=f(x,y)+\lambda G(x,y)=\,</math>
G(x,y) = x^2 + y^2 - 1 &= 0\end{array}\right.</math>
 
Podstawiając <math>x=y, x\neq 0\,</math> do pierwszego równania uzyskujemy: <math>\lambda=-\tfrac{1}{2x}.\,</math> Stosując podobne podstawienie do trzeciego równania, dostaje się warunek <math>2x^2=1,\,</math> skąd wynika <math>x=\pm\tfrac{\sqrt{2}}{2}.</math> Funkcja <math>f\,</math> może zatem przyjmować ekstrema tylko w punktach <math>\left( -\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right) , \left( \tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}\right).</math> Ponieważ okrąg jest zbiorem domkniętym i ograniczonym (czyli [[zbiórprzestrzeń zwartyzwarta|zwartym]]<ref>Na mocy [[twierdzenie Heinego-Borela|twierdzenia Heinego-Borela]]</ref>), więc na mocy twierdzenia Weierstrassa, funkcja <math>f\,</math> osiąga w tych punktach ekstrema (warunkowe):
* minimum warunkowe: <math>f\left( -\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right) =-\sqrt{2}</math>
* maksimum warunkowe: <math>f\left( \tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}\right) =\sqrt{2}</math>
 
 
=== Przykład – problem maksymalnej entropii ===
Problem polega na znalezieniu [[Dyskretny rozkład dyskretnyprawdopodobieństwa|dyskretnego rozkładu zmiennej losowej]] maksymalizującego [[Entropia (teoria informacji)|entropię]]. Funkcja entropii [[prawdopodobieństwo|prawdopodobieństw]] <math>p_1, \ldots, p_n\,</math> wyraża się wzorem
: <math>f(p_1,p_2,\ldots,p_n) = -\sum_{k=1}^n p_k\log_2 p_k</math>
 
Ciekawym praktycznym zastosowaniem ekstremum lokalnego w przestrzeni par permutacji jest algorytm [[gradacyjna analiza danych|statystyczny]], zwany [[gradacyjna analiza odpowiedniości|gradacyjną analizą odpowiedniości]] (''Grade Correspondence Analysis''; GCA).
 
Algorytm ma na celu przekształcenie badanych [[zmiennaskala nominalna|nominalnych cech statystycznych]] w [[zmiennaSkala porządkowa|cechy porządkowe]] tak, aby [[korelacja rangowa]] pomiędzy nimi w [[zbiórSprawdzian uczącykrzyżowy|zbiorze uczącym]] była maksymalna<ref>Podobny problem ze zwykłą korelacją Pearsona rozwiązuje klasyczna [[analiza odpowiedniości]]</ref>.
 
Algorytm GCA był stosowany m.in. do tabeli, w której wiersze odpowiadają [[okręg wyborczy|okręgom wyborczym]], kolumny [[partia polityczna|partiom politycznym]], a liczby w komórkach macierzy liczbie głosów oddanych na poszczególne partie w poszczególnych okręgach<ref>w [[Wybory parlamentarne w Polsce w 1997 roku|wyborach do Sejmu w 1997 roku]]</ref> GCA rozmieściło zarówno okręgi wyborcze, jak i partie na skali, która po zbadaniu okazała się odpowiadać continuum [[lewica]]-[[prawica]].
 
Ściśle: danymi wejściowymi jest tzw. [[macierz kontyngencji]], której wiersze odpowiadają możliwym wartościom (tzw. etykietom) pewnej [[zmiennaskala nominalna|nominalnej cechy statystycznej]] (zwanej zmienną wierszową), a kolumny możliwym wartościom innej cechy nominalnej (zwanej zmienną kolumnową). Wartości elementów macierzy reprezentują liczebność [[obserwacja statystyczna|obserwacji]] w [[próba statystyczna|próbie]], dla których rozważane dwie cechy mają wartości przypisane do danego wiersza i kolumny<ref>Choć GCA można też stosować do innych [[zbiór danych|zbiorów danych]], np. takich gdzie każda kolumna reprezentuje inną zmienną.</ref>.
 
Celem algorytmu jest znalezienie takiej [[permutacja|permutacji]] wierszy i kolumn macierzy (czyli etykiet zmiennych wierszowej i kolumnowej), aby współczynnik [[Współczynnik korelacji rang Spearmana|rho Spearmana]] dla powstałego rozkładu dwuwymiarowego był największy. Odpowiada to znalezieniu takiego uszeregowania etykiet zmiennych nominalnych, aby powstałe w ten sposób [[zmiennaSkala porządkowa|zmienne porządkowe]] wykazywały możliwie dużą [[zależność zmiennych losowych|zależność statystyczną]] w sensie [[korelacja rangowa|korelacji rangowej]].
 
GCA jest algorytmem iteracyjnym, który wielokrotnie startując od losowych permutacji wierszy i kolumn macierzy, dochodzi do różnych lokalnych maksimów rho Spearmana. Maksima są lokalne w tym sensie, że aby uzyskać większą wartość trzeba zmienić jednocześnie kolejność wierszy i kolumn macierzy. Zmiana wyłącznie kolejności wierszy lub wyłącznie kolejności kolumn nie da wyższej wartości rho.
 
== Bibliografia ==
# {{cytuj książkę|imię=Grigorij Michajłowicz|nazwisko=Fichtenholz|autor link=Grigorij Michajłowicz Fichtenholz|tytuł=Rachunek różniczkowy i całkowy, t.1|miejsce=Warszawa|wydawca=PWN|rok=1966}}
# {{cytuj książkę|imię=Witold|nazwisko=Kołodziej|tytuł=Analiza matematyczna|miejsce=Warszawa|wydawca=PWN|rok=1979}}
# {{cytuj książkę|nazwisko=Kowalczyk|imię=Teresa|nazwisko2=Pleszczyńska|imię2=Elżbieta|autor link2=Elżbieta Pleszczyńska|nazwisko3=Ruland|imię3=Fred (red.)|rok=2004|tytuł=Grade Models and Methods for Data Analysis with Applications for the Analysis of Data Populations|wydawca=seria: ''Studies in Fuzziness and Soft Computing'', vol. 151, Springer Verlag|stron=477|miejsce=Berlin Heidelberg New York}}
# {{cytuj książkę|imię=Franciszek|nazwisko=Leja|autor link=Franciszek Leja|tytuł=Rachunek różniczkowy i całkowy|miejsce=Warszawa|wydawca=PWN|rok=1976}}
# {{cytuj książkę|imię=Krzysztof|nazwisko=Maurin|autor link=Krzysztof Maurin|tytuł=Analiza - Część I - Elementy|miejsce=Warszawa|wydawca=PWN|rok=1976|isbn = 978-83-01-09939-8}}
 
== Zobacz też ==
50 082

edycje