Ekstremum funkcji: Różnice pomiędzy wersjami

[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
AndrzeiBOT (dyskusja | edycje)
m Drobne redakcyjne - poprawki linków, apostrofów, cudzysłowów...
Linia 2:
'''Ekstremum''' (l. mn. ''ekstrema''; z {{łac.|extrēmum}} – koniec) – maksymalna lub minimalna wartość [[Funkcja|funkcji]].
 
* Funkcja <math>f(x)\,</math> przyjmuje w punkcie <math>x_0\,</math> '''maksimum lokalne''' (odpowiednio: '''minimum lokalne'''), jeśli w pewnym [[zbiór otwarty|otwartym]]<ref>Czasem uogólnia się to na dowolne [[zbiór pusty|niepuste]] [[zbiór otwarty|zbiory otwarte]]; Zbiór musi być otwarty, żeby wykluczyć patologiczny przypadek, gdy wybierzemy punkt <math>\scriptstyle{x_0\,}</math> na [[brzeg (matematyka)|brzegu]] tego zbioru. Wówczas np. funkcja <math>\scriptstyle{f(x)=x\,}</math> mogłaby mieć minimum i maksimum właściwe w każdym swoim punkcie.</ref> [[otoczenie (matematyka)|otoczeniu]] tego punktu (np. w pewnym [[przedział (matematyka)|przedziale otwartym]]) funkcja nigdzie nie ma wartości większych (odpowiednio: mniejszych).
* Jeśli dodatkowo w pewnym otwartym [[otoczenie (matematyka)|sąsiedztwie]] punktu <math>x_0\,</math> funkcja nie ma również wartości równych <math>f(x_0),\,</math> to jest to '''maksimum''' (odpowiednio: '''minimum''') '''lokalne właściwe'''.
* Minima i maksima lokalne są zbiorczo nazywane '''ekstremami lokalnymi'''.
* Największa i najmniejsza wartość funkcji w całej [[Dziedzina (matematyka)|dziedzinie]] nazywane są odpowiednio '''maksimum i minimum globalnym''', a zbiorczo '''ekstremami globalnymi'''.
 
'''Obrazowo:''' Na powierzchni Ziemi maksimum globalne [[wysokość bezwzględna|wysokości nad poziomem morza]] występuje na szczycie [[Mount Everest]]u, maksimum lokalnym jest szczyt każdego pagórka. Jeśli szczyt pagórka jest poziomy i płaski (a także niekiedy w innych przypadkach<ref>Ekstremum może nie być właściwe, nawet jeśli funkcja nie posiada odcinka stałego. Wystarczy, że w okolicach rozważanego ekstremum występuje nieskończona liczba ekstremów o tej samej wartości funkcji, tak że w każdym otoczeniu jest przynajmniej jedno. Zobacz sekcja [[#Proste przykłady ekstremów]].</ref>), nie będzie to maksimum lokalne właściwe.
 
Istnieją funkcje nieposiadające ekstremów lokalnych ani globalnych, np. funkcja <math>f(x)=x.\,</math>
 
Poszukiwanie ekstremów jest ważne w praktycznych zastosowaniach matematyki, na przykład w [[technika|technice]] i [[statystyka|statystyce]]. Wiele zagadnień [[optymalizacja|optymalizacyjnych]] sprowadza się do poszukiwania ekstremów odpowiednich funkcji, jak na przykład funkcji kosztu, albo miary jakości dla różnych parametrów danego urządzenia.
Linia 26:
 
== Definicje ==
Funkcja <math>f\,</math> o wartościach w zbiorze uporządkowanym określona na przestrzeni topologicznej ma w punkcie <math>x_0\,</math> tej przestrzeni:
* '''minimum lokalne''', jeśli istnieje [[otoczenie (matematyka)|otoczenie]] otwarte <math>U</math> punktu <math>x_0\,</math> takie, że dla każdego <math>x\in U\,</math>
:: <math>f(x)\geqslant f(x_0)\,</math>
: więc nie występują w okolicy punktu <math>x_0\,</math> wartości funkcji mniejsze od <math>f(x_0)\,</math> (ani nieporównywalne), choć mogą występować wartości równe;
* '''maksimum lokalne''', gdy istnieje otoczenie otwarte <math>U\,</math> punktu <math>x_0\,</math> takie, że dla każdego <math>x\in U\,</math>
:: <math>f(x)\leqslant f(x_0)\,</math>
: więc nie występują w okolicy punktu <math>x_0\,</math> wartości funkcji większe od <math>f(x_0)\,</math> (ani nieporównywalne), choć mogą występować wartości równe;
* '''właściwe minimum lokalne''', jeśli w pewnym otoczeniu otwartym <math>U\,</math> punktu <math>x_0\,</math> funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości większe od <math>f(x_0)\,</math>, czyli nie ma wartości równych dla <math>x\ne x_0,\,</math> formalnie:
:: <math>x=x_0 \vee f(x)> f(x_0)\,</math> dla każdego <math>x\in U\,</math>
* '''właściwe maksimum lokalne''', jeśli w pewnym otoczeniu otwartym <math>U\,</math> punktu <math>x_0\,</math> funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości mniejsze od <math>f(x_0),\,</math> formalnie:
:: <math>x=x_0 \vee f(x)< f(x_0)\,</math> dla każdego <math>x\in U\,</math>
 
Funkcja <math>f\,</math> o wartościach w zbiorze uporządkowanym<ref>dlaDla ekstremów globalnych nie jest potrzebna definicja systemu otoczeń.</ref> ma w punkcie <math>x_0\,</math> swojej dziedziny:
* '''minimum globalne''', jeśli dla każdego <math>x\,</math> należącego do jej dziedziny:
:: <math>f(x)\geqslant f(x_0)\,</math>
* '''maksimum globalne''', jeśli dla każdego <math>x\,</math> należącego do jej dziedziny:
:: <math>f(x)\leqslant f(x_0)\,</math>
* '''właściwe minimum globalne''', jeśli dla każdego <math>x\,</math> należącego do jej dziedziny:
:: <math>x=x_0 \vee f(x)> f(x_0)\,</math>
: czyli funkcja przyjmuje wszędzie z wyjątkiem punktu <math>x_0\,</math> wartości większe od <math>f(x_0)\,</math>
* '''właściwe maksimum globalne''', jeśli dla każdego <math>x\,</math> należącego do jej dziedziny:
:: <math>x=x_0 \vee f(x)< f(x_0)\,</math>
: czyli funkcja przyjmuje wszędzie z wyjątkiem punktu <math>x_0\,</math> wartości mniejsze od <math>f(x_0)\,</math>
 
Nie każda funkcja posiada ekstrema. Jeśli funkcja nie jest [[funkcja ograniczona|ograniczona]] (np. <math>f(x)=x\,</math>), to nie ma maksimum ani minimum globalnego – jeżeli nie jest ograniczona od góry, to nie ma maksimum globalnego; a jeżeli od dołu, to nie ma minimum globalnego.
 
Można też mówić o maksimach i minimach w [[podzbiór|podzbiorze]] dziedziny – są to wówczas największe lub najmniejsze wartości funkcji dla argumentów z tego podzbioru.
Linia 57:
=== Proste przykłady ekstremów ===
<gallery widths="350px" heights="250px" perrow="2">
Plik:Cosinus.svg|Funkcja [[Funkcje trygonometryczne|cosinus]] osiąga maksimum dla każdej parzystej wielokrotności <math>\pi,</math>, czyli <math>\dots, -4\pi, -2\pi, 0, 2\pi, 4\pi, \dots</math> oraz minimum dla każdej nieparzystej wielokrotności <math>\pi,</math>, czyli <math>\dots, -5\pi, -3\pi, -\pi, \pi, 3\pi, 5\pi, \dots.</math> Są to lokalne ekstrema właściwe i jednocześnie ekstrema globalne (ale nie globalne ekstrema właściwe!).
Plik:Function x^2.svg|[[Funkcja kwadratowa]] <math>f(x)=x^2\,</math> osiąga właściwe minimum (lokalne i globalne) dla <math>x=0\,.</math> Nie ma maksimum, nawet lokalnego. Dla każdego argumentu można w jego bezpośrednim sąsiedztwie wskazać punkt w którym funkcja przyjmuje większą wartość.
Plik:Floor function.svg|Funkcja [[podłoga i sufit|entier]] osiąga w każdym punkcie maksimum lokalne niewłaściwe. Minimum lokalne występuje jednak tylko dla liczb niecałkowitych. W każdym otoczeniu [[liczby całkowite]]j z lewej strony występują mniejsze wartości funkcji. Nie ma ekstremów globalnych.
Plik:Non-strict minimum.svg|Funkcja <math>f(x)=\left\{\begin{array}{l}\scriptstyle{x^2(1+\sin\frac{1}{x}),\; x\neq 0}\\\scriptstyle{0,\; x=0}\end{array}\right.</math> ma w punkcie <math>x_0=0\,</math> minimum lokalne, jednak nie jest to minimum właściwe – w dowolnej bliskości tego punktu można znaleźć inne punkty, w których przyjmuje ona tę samą wartość (oprócz tego posiada nieskończoną liczbę minimów i maksimów właściwych).
</gallery>
 
Linia 66:
[[Plik:Strict minimum everywhere.png|thumb|350px|Fragment wykresu funkcji <math>\scriptstyle{f\colon \mathbb{Q}\ni \frac{p}{q}\mapsto \left| \frac{q}{\operatorname{NWD}(p,q)} \right| },</math> mającej właściwe minimum w każdym punkcie swojej dziedziny. Kropki – punkty <math>\scriptstyle{\left( \frac{p}{q},q \right)}</math> odpowiadają nieskracalnym ułamkom <math>\scriptstyle{\frac{p}{q}}</math>]]
Niech funkcja&nbsp; <math>f</math> &nbsp;przyporządkowuje każdej [[liczby wymierne|liczbie wymiernej]] wartość mianownika wyrażającego ją [[ułamek|ułamka]] [[Ułamek#Działania na ułamkach|skróconego]]. Formalnie:
: <math>f\colon \mathbb{Q}\ni \frac{p}{q}\mapsto \left| \frac{q}{\operatorname{NWD}(p,q)} \right| </math>
gdzie NWD oznacza [[największy wspólny dzielnik]].
 
Linia 74:
prowadzi bowiem do
: <math>\scriptstyle{\left|\frac{pb-aq}{qb}\right|=\frac{|pb-aq|}{qb}<\frac{1}{q^2},}</math>
a wobec <math>\scriptstyle{|pb-aq|\geqslant 1}</math> jest <math>\scriptstyle{b>q.}</math>.</ref>. A zatem funkcja ta ma dla każdej liczby wymiernej (czyli dla każdego punktu swojej dziedziny) właściwe minimum lokalne.
 
=== Warunek wystarczający ekstremum globalnego (twierdzenie Weierstrassa) ===
Linia 80:
 
=== Funkcje różniczkowalne ===
W dalszej części sekcji rozważane będą funkcje <math>f\colon [a,b] \to \mathbb R</math> [[funkcja ciągła|ciągłe]] oraz [[funkcja różniczkowalna|różniczkowalne]] w przedziale <math>(a,b).\,</math>
Geometrycznie oznacza to, że ich wykres jest „nieprzerwany” i „gładki”, czyli ma w każdym punkcie [[styczna|styczną]].
 
==== Warunek konieczny istnienia ekstremum lokalnego (twierdzenie Fermata) ====
[[Plik:Extrema2.gif|thumb|250px|Funkcja <math>\scriptstyle{g(x)=x^3}</math> nie ma dla <math>x=0\,</math> ekstremum lokalnego, mimo że jej pochodna w tym punkcie jest równa zero]]
[[warunek konieczny|Warunkiem koniecznym]] istnienia ekstremów lokalnych funkcji <math>f\,</math> w pewnym punkcie <math>x_0\in (a,b)</math> jest
: <math>f^\prime (x_0)=0</math>
Geometrycznie oznacza to, że [[styczna]] do [[wykres funkcji|wykresu funkcji]] jest w tym punkcie prostą poziomą. Jest to tzw. '''twierdzenie Fermata'''. Udowodnijmy je:
 
jeśli <math>\ f</math>&nbsp; ma w punkcie <math>x_0\,</math> ekstremum lokalne, to istnieje takie&nbsp; <math>\ \epsilon > 0</math>,&nbsp; że dla każdej liczby rzeczywistej <math>\ h</math>, &nbsp;spełniającej <math>\ 0 < |h| < \epsilon</math>,&nbsp; zachodzi:
 
:: <math>(f(x_0-h) - f(x_0)) \cdot (f(x_0+h) - f(x_0)) \;\ge\; 0</math>
Linia 97:
:: <math>\frac{f(x_0-h) - f(x_0)}{-h} \cdot \frac{f(x_0+h) - f(x_0)}{h} \;\le\; 0</math>
 
Po przejściu do granicy, dla <math>\ h \rightarrow 0</math>,&nbsp; otrzymujemy:
 
:: <math>(f'(x_0))^2 \;\le\; 0</math>
 
Zatem <math>f'(x_0) =\; 0</math>.
 
Warunek Fermata nie jest jednak [[warunek wystarczający|wystarczający]]. Np. funkcja <math>g(x)=x^3\,</math> nie ma ekstremum, chociaż jej pochodna <math>g^\prime(x)=3x^2\,</math> zeruje się dla <math>x_0=0.\,</math> Ekstremum może natomiast istnieć w punktach, w których nie istnieje (obustronna) pochodna skończona – funkcja <math>h(x)=x^{\frac{2}{3}}</math> ma na przykład, minimum w punkcie <math>x_0=0,\,</math> podczas gdy jej pochodna lewostronna w tym punkcie równa się <math>-\infty,</math> a prawostronna <math>+\infty.</math> Podobnie funkcja [[wartość bezwzględna]] ma w punkcie <math>x_0=0\,</math> minimum globalne, chociaż w tym punkcie nie jest różniczkowalna.
 
==== Warunek konieczny i wystarczający istnienia ekstremum lokalnego ====
Funkcja ciągła <math>f\colon [a,b]\to \mathbb{R},</math> różniczkowalna w przedziale <math>(a,b)\,</math> i mająca skończoną liczbę [[punkt stacjonarny|punktów stacjonarnych]] (tj. takich, w których zeruje się jej pierwsza pochodna)<ref>Założenie o skończonej liczbie punktów stacjonarnych można zastąpić słabszym żądaniem, by każdy punkt stacjonarny był izolowany. Zobacz przykład funkcji <math>\scriptstyle{f(x)=\left\{\begin{array}{l}\scriptstyle{x^2(1+\sin\frac{1}{x}),\; x\neq 0}\\\scriptstyle{0,\; x=0}\end{array}\right.,}</math> której wykres pokazano w sekcji [[Ekstremum#Proste przykłady ekstremów|Proste przykłady ekstremów]].</ref> ma w punkcie <math>x_0\in (a,b)\,</math>:
* minimum lokalne wtedy i tylko wtedy, gdy istnieje takie <math>\delta >0,\,</math> że:
** <math>f^\prime(x_0)=0</math>
** <math>f^\prime(x)< 0</math> dla <math>x\in (x_0-\delta, x_0)</math>
** <math>f^\prime(x)> 0</math> dla <math>x\in (x_0,x_0+\delta)</math>
 
* maksimum lokalne wtedy i tylko wtedy, gdy istnieje takie <math>\delta >0,\,</math> że
** <math>f^\prime(x_0)=0</math>
** <math>f^\prime(x)> 0</math> dla <math>x\in (x_0-\delta, x_0)</math>
Linia 118:
 
==== Inne warunki wystarczające istnienia ekstremów ====
Jeśli o funkcji <math>f,\,</math> określonej jak wyżej, założy się dodatkowo, że jest dwukrotnie różniczkowalna w przedziale <math>(a,b)\,</math> oraz jej [[Pochodna|druga pochodna]] jest ciągła, to jeżeli <math>f^\prime(x_0)=0</math> i <math>f^{\prime\prime}(x_0)\neq 0,</math> to funkcja <math>f\,</math> ma w punkcie <math>x_0\,</math> ekstremum, przy czym, gdy <math>f^{\prime\prime}(x_0)<0,</math> to jest to maksimum lokalne, a gdy <math>f^{\prime\prime}(x_0)>0,</math> to minimum lokalne<ref>'''Dowód:''' Ze [[wzór Taylora|wzoru Taylora]] dla <math>\scriptstyle{n=2}</math> wynika:
: <math>\scriptstyle{f(x_0+h)=f(x_0)+hf^\prime(x_0)+\frac{1}{2}h^2f^{\prime\prime}(x_0+\theta h)}</math>
gdzie
Linia 128:
Dla <math>\scriptstyle{h\neq 0}</math> prawa strona ma ten sam znak, co <math>\scriptstyle{f^{\prime\prime}(x_0+\theta h).}</math> Gdy <math>\scriptstyle{ f^{\prime\prime}(x_0)<0,}</math> to z ciągłości <math>\scriptstyle{f^{\prime\prime}}</math> wynika <math>\scriptstyle{f^{\prime\prime}(x)<0}</math> w pewnym otoczeniu punktu <math>\scriptstyle{x_0,}</math> więc w tym otoczeniu
: <math>\scriptstyle{f(x_0+h)-f(x_0)=f(x)-f(x_0)<0}</math> dla <math>\scriptstyle{x\neq x_0,}</math>
zatem istnieje maksimum w punkcie <math>\scriptstyle{x_0.}</math> Analogicznie, istnieje minimum gdy <math>\scriptstyle{f^{\prime\prime}(x_0)>0.}</math>.</ref>.
Powyższe kryterium nie rozstrzyga przypadku, gdy druga pochodna jest równa zero.
 
==== Kryterium istnienia ekstremów funkcji ''n''-krotnie różniczkowalnych ====
Jeżeli założy się dodatkowo o funkcji <math>f,\,</math> że jest <math>n\,</math>-krotnie razy różniczkowalna i <math>n\,</math>-ta pochodna jest ciągła w <math>(a,b),\,</math> to prawdziwe jest następujące twierdzenie:
 
Jeżeli
: <math>f^\prime(x_0)=f^{\prime\prime}(x_0)=\ldots=f^{(n-1)}(x_0)=0</math>
tj. wszystkie pochodne do <math>(n-1)\,</math>-ej zerują się w punkcie <math>x_0,\,</math> a <math>n\,</math>-ta pochodna jest różna od zera, to
* gdy <math>n\,</math> jest liczbą [[Parzystość liczb|parzystą]], to <math>f\,</math> ma ekstremum w punkcie <math>x_0,\,</math> przy czym jest to maksimum, gdy <math>f^{(n)}(x_0)<0\,</math> lub minimum, gdy <math>f^{(n)}(x_0)>0,\,</math>
* gdy <math>n\,</math> jest liczbą [[Parzystość liczb|nieparzystą]], ekstremum nie istnieje.
 
Z założenia zerowania się pochodnych do <math>(n-1),\,</math> można wyprowadzić korzystając ze [[wzór Taylora|wzoru Taylora]]:
: <math>f(x_0+h)-f(x_0)=\frac{h^n}{n!}f^{(n)}(x_0+\theta h)</math>
dla pewnego <math>0<\theta<1.\,</math>
 
Jeśli <math>n\,</math> jest parzyste, rozumowanie przebiega jak poprzednio. Gdy <math>n\,</math> jest nieparzyste, prawa strona równości zmienia znak, gdy <math>h\,</math> zmienia znak, a funkcja <math>f^{(n)}\,</math> zachowuje w pewnym otoczeniu punktu <math>x_0\,</math> ten sam znak co <math>x_0.\,</math> Czyli <math>f(x_0+h)-f(x_0)\,</math> ma dla <math>h<0\,</math> inny znak niż dla <math>h>0,\,</math> więc nie istnieje ekstremum w punkcie <math>x_0.\,</math>
 
=== Proste zagadnienia optymalizacyjne ===
Linia 151:
 
==== Pudełko o największej objętości ====
; Problem: Z kwadratowego arkusza blachy o boku <math>a\,</math> wycinane są przy wierzchołkach [[przystawanie (geometria)|przystające]] kwadraty i po zagięciu brzegów tworzone jest [[prostopadłościan|prostopadłościenne]] pudełko. Jak otrzymać pudełko o największej objętości?
 
; Rozwiązanie 1: Jeśli przez <math>x</math> oznaczyć długość boku wyciętego kwadratu, to objętość <math>V</math> pudełka będzie równa
Linia 177:
 
==== Koszt eksploatacji statku ====
; Problem: Wiadomo, że koszt eksploatacji statku w ciągu godziny pływania wyraża się wzorem empirycznym <math>a+bv^3,\,</math> gdzie <math>v\,</math> oznacza prędkość statku w [[Węzeł (jednostka prędkości)|węzłach]] (1 węzeł = 1 [[mila morska|Mm]]/[[godzina|h]] ≈ 1,85 [[kilometr na godzinę|km/h]]), natomiast <math>a\,</math> i <math>b\,</math> są stałymi, które powinny być obliczone dla każdego statku z osobna (część stała kosztu <math>a\,</math> pochodzi od [[amortyzacja|amortyzacji]] i kosztów utrzymania załogi, a część <math>bv^3\,</math> od kosztów paliwa). Przy jakiej prędkości statek przebędzie dowolną odległość z najmniejszymi kosztami?
 
; Rozwiązanie: Przebycie 1 mili morskiej trwa 1/''v'' godziny, więc kosztuje:
Linia 185:
: Ponieważ druga pochodna
:: <math>f^{\prime\prime}(v)=2b+2\tfrac{a}{v^3}>0</math>
: więc koszty rzeczywiście osiągną najmniejszą wartość dla znalezionej wartości <math>v.\,</math>
 
== Funkcje określone na podzbiorach przestrzeni unormowanych ==
Linia 191:
 
[[Plik:HyperbolicParaboloid2.png|thumb|200px|[[Paraboloida hiperboliczna]] – w pobliżu początku układu współrzędnych ma ona kształt podobny do siodła (zob. [[punkt siodłowy]])]]
W dalszej części tego paragrafu przez <math>X\,</math> rozumiana jest dowolna przestrzeń unormowana, zaś przez <math>D\,</math> pewien jej [[zbiór otwarty|otwarty]]<ref>porPor. [[Różniczka#Różniczkowalność a otwartość zbioru|Różniczkowalność a otwartość zbioru]].</ref> podzbiór. Funkcja <math>f\colon D\to\mathbb{R}</math> musi być [[pochodna Frécheta|różniczkowalna (w sensie Frécheta)]] w zbiorze <math>D.\,</math> Przez zapis <math>f^\prime(x_0)</math> lub <math>df(x_0)\,</math> rozumie się [[różniczka|różniczkę]] funkcji <math>f,\,</math> która jest [[Przekształcenie liniowe|odwzorowaniem liniowym]] i ciągłym przestrzeni <math>X\,</math> o wartościach w <math>\mathbb{R}.</math> Pochodna <math>n\,</math>-tego rzędu funkcji (<math>n\,</math>-krotnie różniczkowalnej) jest [[Przekształcenie wieloliniowe|odwzorowaniem <math>n\,</math>-liniowym]] przestrzeni <math>X\times \ldots \times X</math> o wartościach rzeczywistych i oznaczana jest przez <math>f^{(n)}(x_0)\,</math> lub <math>df^n(x_0).\,</math>
 
Podobnie jak dla funkcji rzeczywistych, warunkiem koniecznym istnienia ekstremum w punkcie <math>x_0\in D</math> jest, aby wartość funkcji będącej różniczką w <math>x_0\in D</math> wynosiła zero dla wszystkich punktów w pewnym otoczeniu <math>x_0</math> (<math>\, f^\prime(x_0)\equiv 0\,</math>).
Punkt, w którym różniczka się zeruje (jest funkcją stale równą zero w pewnym otoczeniu <math>x_0</math>), nazywany jest '''punktem stacjonarnym'''.
 
Tak jak w przypadku funkcji jednej zmiennej, w punkcie stacjonarnym wcale nie musi być ekstremum. Na przykład dla funkcji <math>g\colon \mathbb{R}^2\to \mathbb{R}\,</math> danej wzorem <math>g(x,y)=xy,\,</math> której wykresem jest [[paraboloida hiperboliczna]], [[pochodna cząstkowa|pochodne cząstkowe]] <math>g^\prime_x(x,y)=x,\; g^\prime_y(x,y)=y\,</math> są jednocześnie równe zeru<ref>Jeśli którakolwiek pochodna kierunkowa, w tym pochodna cząstkowa, jest różna od zera, to również różniczka jest niezerowa (o ile istnieje). W tym przykładzie obie pochodne cząstkowe są ciągłe, <!-- a więc korzystając z twierdzenia ??? – z lematu Schwarza --> istnieje również pochodna Frécheta i <math>\scriptstyle{ f^\prime(x_0)\equiv 0}</math>.</ref> tylko w punkcie <math>(0,0),\,</math> w którym <math>f(x,y)=0.\,</math> Jednocześnie widać (por. rysunek obok), że w dowolnym otoczeniu zera funkcja przybiera zarówno wartości dodanie, jak i ujemne, a więc nie może być w nim ekstremum.
 
=== Definicje pomocnicze ===
Na potrzeby dalszych twierdzeń, konieczne będzie wprowadzenie kilku definicji:
 
[[Forma dwuliniowa|Funkcjonał dwuliniowy]] <math>\varphi\colon X\times X\to \mathbb{R}\,</math> jest '''nieujemny, niedodatni, dodatni, ujemny''' jeśli odpowiednio <math>\varphi(h,h)\geqslant 0,\; \varphi(h,h)\leqslant 0,\; \varphi(h,h)> 0,\; \varphi(h,h)< 0\,</math> dla wszelkich <math>0\neq h\in X.\,</math>
 
Funkcjonał dwuliniowy <math>\,\varphi\colon X\times X\to \mathbb{R}\,</math> jest
* '''dodatnio określony''', jeśli
: <math>\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\geqslant c\|h\|^2</math>
Linia 209:
: <math>\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\leqslant -c\|h\|^2</math>
 
W szczególności, każda [[Macierz|macierz kwadratowa]] może być interpretowana jako macierz funkcjonału dwuliniowego przestrzeni <math>X=\mathbb{R}^m\,</math> (por. [[Określoność formy|macierz dodatnio określona]]). Prawdziwe jest twierdzenie, które mówi, że każdy dodatni (lub ujemny) funkcjonał dwuliniowy tej przestrzeni jest dodatnio określony (ujemnie określony). Do badania dodatniej (ujemnej) określoności macierzy służy [[kryterium Sylvestera]].
 
=== Ekstrema a druga pochodna ===
Jeżeli funkcja <math>f\,</math> jest dwukrotnie różniczkowalna w pewnym otoczeniu <math>E\subseteq D\,</math> punktu <math>x_0,\,</math> przy czym <math>f^\prime(x_0)=0,\,</math> a [[różniczka|pochodna]] <math>f^{\prime\prime}\,</math> jest ciągła w <math>x_0,\,</math> to
* jeżeli <math>f\,</math> ma w <math>x_0\,</math> minimum lokalne, to <math>f^{\prime\prime}(x_0)\,</math> jest nieujemna,
* jeżeli <math>f\,</math> ma w <math>x_0\,</math> maksimum lokalne, to <math>f^{\prime\prime}(x_0)\,</math> jest niedodatnia.
 
=== Warunek konieczny i wystarczający istnienia ekstremum ===
Niech, jak poprzednio, funkcja <math>f\,</math> będzie dwukrotnie różniczkowalna w pewnym otoczeniu <math>U\subseteq D\,</math> punktu <math>x_0,\,</math> przy czym <math>f^\prime(x_0)=0,\,</math> a [[różniczka|pochodna]] <math>f^{\prime\prime}\,</math> jest ciągła w <math>x_0.\,</math>
* Jeżeli <math>f^{\prime\prime}(x_0)\,</math> jest dodatnio określona, to <math>f\,</math> ma minimum lokalne właściwe w punkcie <math>x_0.\,</math>
* Jeżeli <math>f^{\prime\prime}(x_0)\,</math> jest ujemnie określona, to <math>f\,</math> ma maksimum lokalne właściwe w punkcie <math>x_0.\,</math>
 
== Funkcje określone na podzbiorach płaszczyzny ==
Ważnym przypadkiem są funkcje określone na podzbiorach <math>X=\mathbb{R}^2.\,</math> Przypadek ten zasługuje na wyróżnienie ponieważ funkcje tego typu szczególnie często pojawiają się w zastosowaniach. Korzystając z własności [[pochodna cząstkowa|pochodnych cząstkowych]] takich funkcji można podać następujący [[algorytm]] badania istnienia ekstremów funkcji <math>f\colon D\to \mathbb{R},\,</math> gdzie <math>D\,</math> jest otwartym podzbiorem płaszczyzny. O funkcji <math>f\,</math> wiadomo, że jest dwukrotnie różniczkowalna i jej druga pochodna jest ciągła.
# Wyznaczamy wszystkie punkty <math>(x_0,y_0)\in D\,</math> takie, że pochodne cząstkowe<br /><br /><math>\left\{ \begin{matrix}
f^\prime_x(x_0,y_0)=0 \\
f^\prime_y(x_0,y_0)=0 \\
\end{matrix}\right. </math> (rozwiązując ten układ równań)<ref>W przypadku funkcji różniczkowalnej <math>\scriptstyle{z=f(x,y)}</math> równości te mają prosty sens geometryczny: [[płaszczyzna styczna]] do powierzchni <math>\scriptstyle{z=f(x,y)}</math> w jej punkcie odpowiadającym ekstremum powinna być równoległa do płaszczyzny <math>\scriptstyle{xy.}</math>.</ref>
# Dla każdego punktu z osobna badamy znak [[hesjanMacierz Hessego|wyznacznika Hessego]]<br /><br /><math>\delta(x_0,y_0)=\left|\begin{array}{ll}f^{\prime\prime}_{xx}(x_0,y_0) & f^{\prime\prime}_{xy}(x_0,y_0) \\ f^{\prime\prime}_{yx}(x_0,y_0) & f^{\prime\prime}_{yy}(x_0,y_0)\end{array}\right|</math><br /><br />Na mocy [[lemat Schwarza|lematu Schwarza]] <math>f^{\prime\prime}_{xy}(x_0,y_0)=f^{\prime\prime}_{yx}(x_0,y_0),\,</math> więc<br /><br /><math>\delta(x_0,y_0)=f^{\prime\prime}_{xx}(x_0,y_0)f^{\prime\prime}_{yy}(x_0,y_0)-(f^{\prime\prime}_{xy}(x_0,y_0))^2.</math>
# Jeżeli w danym punkcie <math>(x_0, y_0)\,</math> wyznacznik <math>\delta(x_0,y_0)<0,\,</math> to w tym punkcie nie ma ekstremum, jeśli <math>\delta(x_0,y_0)=0,\,</math> to w pewnych przypadkach może istnieć ekstremum, a pewnych nie<ref>npNp. funkcja <math>\scriptstyle{f(x,y)=x^4+y^4}</math> ma w punkcie <math>\scriptstyle{(0,0)}</math> minimum, natomiast funkcja <math>\scriptstyle{g(x,y)=x^3+y^2}</math> nie ma w punkcie <math>\scriptstyle{(0,0)}</math> ekstremum lokalnego.</ref>. I ostatecznie, jeżeli <math>\delta(x_0,y_0)>0,\,</math> to istnieje ekstremum lokalne w tym punkcie, jeśli:
:* <math>f^{\prime\prime}_{xx}(x_0,y_0)>0\,</math> co dla <math>\delta(x_0,y_0)>0\,</math> jest równoważne <math>f^{\prime\prime}_{yy}(x_0,y_0)>0,\,</math> to jest to minimum lokalne,
:* <math>f^{\prime\prime}_{xx}(x_0,y_0)<0\,</math> co dla <math>\delta(x_0,y_0)>0\,</math> jest równoważne <math>f^{\prime\prime}_{yy}(x_0,y_0)<0\,</math> to jest to maksimum lokalne.
 
=== Przykład ===
[[Plik:Extrema3.gif|thumb|250px|Wykres funkcji <math>\scriptstyle{f\left( {x,y} \right) = 2x^3 - y^3 + 12x^2 + 27y}</math> z zaznaczonymi ekstremami lokalnymi i punktami siodłowymi]]
Znaleźć ekstrema funkcji
: <math>f\left( {x,y} \right) = 2x^3 - y^3 + 12x^2 + 27y\,</math>
 
Obliczamy pierwsze pochodne cząstkowe funkcji <math>f</math> i przyrównujemy do zera:
: <math>
\left\{ \begin{matrix}
f^\prime_x(x,y) = 0 \Leftrightarrow 6x^2 + 24x = 0 \\
f^\prime_y(x,y) = 0 \Leftrightarrow -3y^2 + 27 = 0 \\
\end{matrix} \right.
</math>
Układ równań ma dokładnie 4 rozwiązania, którymi są punkty
: <math>a=(0,3),\ b=(0,-3),\ c=(-4,-3),\ d=(-4,3)\, </math>
 
* <math>\delta(a)<0\,</math> i <math>\delta(c)<0\, </math> – zatem w tych punktach nie ma ekstremów (na wykresie zaznaczono je na pomarańczowo, są to tzw. [[punkt siodłowy|punkty siodłowe]] funkcji <math>f</math>).
* <math>\delta(b)>0\, </math> – w tym punkcie jest minimum lokalne (zaznaczono na czerwono).
* <math>\delta(d)>0\, </math> – w tym punkcie jest maksimum lokalne (zaznaczono na zielono).
 
== Funkcje uwikłane ==
W tej sekcji rozważane będą ekstrema funkcji <math>y(x),\,</math> dla której nie znamy jednak bezpośredniej zależności <math>y\,</math> od <math>x,\,</math> mając jedynie równanie postaci <math>F(x,y)=0\,.</math>
 
Podobnie jak w poprzednim przypadku, o funkcji <math>F</math> zakładamy, że jest dwukrotnie różniczkowalna w pewnym otwartym podzbiorze <math>D\subset\mathbb{R}^2\,\,</math> oraz <math>E\,</math> jest zbiorem punktów <math>(x,y)\,</math> obszaru, w których
: <math>F(x,y)=0\,</math>
Na mocy [[Funkcja uwikłana#Funkcje rzeczywiste|twierdzenia o funkcji uwikłanej]], wzór
: <math>y^\prime(x)=-\frac{F^\prime_x(x,y)}{F^\prime_y(x,y)}\,</math>
gdzie <math>y=y(x),\,</math>, a w konsekwencji także
: <math>y^{\prime\prime}=-\frac{F^{\prime\prime}_{xx}(F^{\prime}_{y})^2-2F^{\prime\prime}_{xy}F^\prime_xF^\prime_y+F^{\prime\prime}_{yy}(F^{\prime}_{x})^2}{(F^\prime_y)^3}\,</math>
pozwala wyznaczyć ekstrema funkcji <math>y\,</math> uwikłanej w równaniu
<math>F(x,y)=0\,</math><ref>Wzór ten można otrzymać różniczkując tożsamość <math>\scriptstyle{F^\prime_x+F^\prime_yy^\prime(x)=0}</math> dla <math>\scriptstyle{x\in (x_0-\delta, x_0+\delta)}</math>.</ref>. W tym celu należy wyznaczyć punkty, w których
: <math>F(x,y)=0, y^\prime=0, y^{\prime\prime}\neq 0\,</math>
Dwa ostatnie warunki równoważne są poniższym, tj.
: <math>F^\prime_x=0, -\frac{F^{\prime\prime}_{xx}}{F^\prime_y}\neq 0\,</math>
 
=== Przykład ===
Znaleźć ekstrema funkcji <math>y,</math> określonej równaniem
: <math>F(x,y)=x^2-2xy-3y^2+4=0\,</math>
 
Ponieważ
: <math>F^\prime_x(x,y)=2x-2y=0</math>
tylko gdy <math>x=y,</math> więc wstawiając to do równania
: <math>F(x,y)=0\,</math>
otrzymujemy jako jedyne rozwiązania punkty <math>(1,1), (-1,-1).</math>
 
Linia 298:
=== Przykład – równania Eulera-Lagrange’a ===
{{osobny artykuł|Równania Eulera-Lagrange’a|Zasada minimum energii potencjalnej}}
Rachunek wariacyjny bada ekstrema funkcjonałów, często zadanych w postaci [[całkaCałka Lebesgue'aLebesgue’a|całek]]. W [[mechanika klasyczna|mechanice klasycznej]] ważne są równania, pozwalające na znajdowanie torów cząstek <math>q_k,</math> jeśli znana jest funkcja <math>L</math> ([[lagranżjan]]), opisująca ten układ. Równania te zostały wprowadzone w [[1750]] roku przez [[Leonhard Euler|Leonharda Eulera]] oraz [[Joseph Louis Lagrange|Josepha Louisa Lagrange’a]] i zwane są dziś nazwiskami ich odkrywców. Równania Eulera-Lagrange’a mają ścisły związek z metodami rachunku wariacyjnego.
 
Formalnie, o funkcji <math>L</math> zakłada się, że jest określona na <math>\mathbb{R}^{2n+1}</math> oraz jest dwukrotnie różniczkowalna w sposób ciągły. Dalej, o funkcji
: <math>[a,b]\ni t \mapsto q(t)=(q_1(t), \ldots, q_n(t))\in \mathbb{R}^n</math>
zakłada się, że jest funkcją o wartościach wektorowych, dwukrotnie różniczkowalną w sposób ciągły. W celu wyznaczenia toru cząstki, określa się funkcjonał
Linia 313:
== Ekstrema warunkowe ==
W matematyce i fizyce zachodzi często potrzeba badania ekstremów funkcji przy pewnych dodatkowych warunkach. Chcąc np. znaleźć odległość punktu <math>(x_0, y_0, z_0)\in\mathbb{R}^3</math> od [[Rozmaitość topologiczna|hiperpowierzchni]] zadanej równaniem <math>g(x,y,z)=0</math> należy zbadać minima funkcji
: <math>f(x,y,z)=(x-x_0)^2+(y-y_0)^2+(z-z_0)^2\,</math>
przy warunku dodatkowym
: <math>g(x,y,z)=0\,</math>
W paragrafie tym podamy ogólną definicję ekstremum warunkowego i ogólne wyniki tej teorii, badanie ekstremów warunkowych funkcji tylko dwóch zmiennych zostanie omówione w następnym ustępie.
 
Linia 325:
# <math>X</math> i <math>Y</math> są [[przestrzeń Banacha|przestrzeniami Banacha]],
# <math>G\colon X\to Y</math> jest różniczkowalne w sposób ciągły w pewnym otoczeniu punktu <math>x_0\in X,</math>
# <math>x_0\in X</math> jest [[punkt regularny#Teoria różniczkowania|punktem regularnym]] zbioru <math>M=G^{-1}(\{0\}),</math>, tj. <math>G^\prime(x_0)</math> jest [[Funkcja „na”|suriekcją]] <math>X</math> na <math>Y,</math>
# <math>X_1:=(G^\prime(x_0))^{-1}(\{0\}),</math> to znaczy <math>X_1</math> jest [[Jądro (algebra)|jądrem]] <math>G^\prime(x_0),</math>
# <math>X=X_1\oplus X_2</math> (rozkład przestrzeni <math>X</math> na [[topologicznaPodprzestrzeń suma prostakomplementarna|topologiczną sumę prostą]]).
 
Niech <math>f</math> będzie funkcją określoną na otwartym podzbiorze <math>U</math> przestrzeni Banacha <math>X</math> o wartościach w <math>\mathbb{R}</math> oraz niech <math>x_0\in X</math> będzie punktem regularnym zbioru <math>M=G^{-1}(0).</math> Jeżeli funkcja <math>f</math> jest różniczkowalna w punkcie <math>x_0</math> i ma w tym punkcie ekstremum warunkowe, to
Linia 333:
dla każdego <math>x_1\in X_1.</math>
 
W praktyce, często wykorzystywanym faktem do badania ekstremów warunkowych jest tzw. [[twierdzenie Lusternika (ekstrema warunkowe)|drugie twierdzenie Lusternika]], mówiące o tym, że jeżeli spełnione są założenia twierdzenia Lusternika i funkcja <math>f,</math> określona jak wyżej, jest różniczkowalna w punkcie <math>x_0\in M</math> i ma w tym punkcie ekstremum warunkowe (związane warunkiem <math>M</math>), to istnieje [[Forma liniowa|funkcjonał liniowy]] <math>\Lambda\in Y^\star</math> taki, że
: <math>f^\prime(x_0)=\Lambda\circ G^\prime(x_0)</math>
Funkcjonał <math>\Lambda</math> nazywany jest '''funkcjonałem Lagrange’a''' i ma ścisły związek z metodą szukania ekstremów warunkowych, zwaną '''metodą mnożników Lagrange’a''', opisaną dalej.
Linia 345:
jest dodatnio (ujemnie) określona dla <math>h\in X_1=\ker G^\prime(x_0),</math> to funkcja <math>f</math> ma w punkcie <math>x_0</math> minimum (maksimum) warunkowe.
 
Twierdzenie to można udowodnić korzystając z twierdzenia Lusternika i odpowiednio wykorzystując [[wzór Taylora|twierdzenia Taylora]]. Daje się ono łatwo uogólnić na przypadek pochodnych wyższych rzędów – w tym przypadku dodatkowo zakłada się, że odwzorowania <math>f</math> i <math>G</math> są różniczkowalne <math>2n</math> razy w sposób ciągły w pewnym otoczeniu punktu <math>x_0.</math> Wówczas, jeżeli istnieje funkcjonał <math>\Lambda\in Y^\star</math> taki, że
: <math>f^{(k)}(x_0)=\Lambda\circ G^{(k)}(x_0)</math>
dla <math>k=1,2,\ldots, 2n-1</math> oraz odwzorowanie
: <math>\left(f^{(2n)}(x_0)-\Lambda\circ G^{(2n)}(x_0)\right)(h)</math>
jest dodatnio<ref>Uwaga: w tym wypadku pojęcie dodatniej (ujemnej) określoności zostaje rozszerzone na [[Przekształcenie wieloliniowe|funkcjonały ''n''-liniowe]], tj. powiemy że funkcjonał <math>\scriptstyle{n}</math>-liniowy <math>\scriptstyle{\varphi\colon X\times\ldots\times X\to \mathbb{R}}</math> jest dodatnio (ujemnie) określony, jeśli istnieje takie <math>\scriptstyle{c>0,}</math> że <math>\scriptstyle{\varphi(h,\ldots, h)\geqslant c\|h\|^n \; (\leqslant -c\|h\|^n)}</math> dla wszelkich <math>\scriptstyle{h\in X.}</math>.</ref> (ujemnie) określona dla <math>h\in X_1,</math> to funkcja <math>f</math> ma w punkcie <math>x_0</math> minimum (maksimum) warunkowe.
 
=== Ekstrema warunkowe w <math>\mathbb{R}^n</math> ===
Badanie ekstremów warunkowych przekształceń dowolnych przestrzeni Banacha jest rzeczą trudną. Już samo spełnienie założeń twierdzenia Lusternika może okazać się niemożliwe, gdyż nie każdą przestrzeń unormowaną da się rozłożyć na topologiczną sumę prostą jej podprzestrzeni<ref>Da się to zrobić w przypadku [[przestrzeń Hilberta|przestrzeni Hilberta]] – [[twierdzenie o rozkładzie ortogonalnym]] mówi, że dla każdej [[zbiór domknięty|domkniętej]] podprzestrzeni przestrzeni Hilberta istnieje [[dopełnienie ortogonalne]]. W szczególności, rozkład taki jest możliwy jeżeli <math>\scriptstyle{X}</math> jest przestrzenią skończenie wymiarową.</ref>. Duża część zagadnień praktycznych sprowadza się do badania ekstremów warunkowych w przypadku gdy <math>X=\mathbb{R}^n,\; Y=\mathbb{R}^m,\; n\geqslant m,</math> a odwzorowanie <math>G\colon \mathbb{R}^n\to \mathbb{R}^m</math> reprezentowane jest przez układ <math>m</math> funkcji o <math>n</math> zmiennych, tj. <math>G=(G_1,\ldots, G_m).</math>
 
Szukanie ekstremów warunkowych funkcji <math>f\colon \mathbb{R}^n\to\mathbb{R},</math> będących zarazem punktami regularnymi<ref name="punktreg">porPor. [[Punkt regularny#Szczególne przypadki|punkt regularny (szczególne przypadki)]].</ref>, sprowadza się do rozwiązania układu równań operatorowych
: <math>\left\{\begin{array}{l}f^\prime(x)=\Lambda\circ G^\prime(x)\\G(x)=0\end{array}\right.</math>
gdzie <math>\Lambda\in (\mathbb{R}^m)^\star.</math> Wiadomo, że każdy taki funkcjonał <math>\Lambda</math> jest reprezentowany przez układ <math>m</math> [[liczby rzeczywiste|liczb rzeczywistych]] <math>\lambda_1,\ldots,\lambda_m</math> a pochodna <math>G^\prime(x)</math> jest [[macierz]]ą wymiaru <math>m\times n</math> [[rząd macierzy|rzędu]] <math>m</math><ref name="punktreg" />. Układ równań operatorowych sprowadza się więc do układu <math>m+n</math> równań skalarnych:
: <math>\left\{\begin{array}{l}\frac{\partial f(x)}{\partial x_j}=\sum_{i=1}^m\lambda_i\frac{\partial G_i(x)}{\partial x_j},\; j=1,\ldots,n\\G_k(x_1,\ldots, x_n)=0,\; k=1,\ldots, m\end{array}\right.</math>
gdzie <math>x=(x_1,\ldots,x_n)</math> o <math>n+m</math> zmiennych <math>\lambda_i, x_k, \; i\leqslant m, k\leqslant n.</math> Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby <math>\lambda_i</math> spełniają tylko rolę pomocniczą i nazywane są często [[Mnożniki Lagrange’a|mnożnikami Lagrange’a]]. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, należy odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną określoność)
Linia 373:
 
W praktyce, gdy <math>X=\mathbb{R}^2, Y=\mathbb{R}</math> wprowadzamy funkcję pomocniczą
: <math>F(x,y)=f(x,y)+\lambda G(x,y)\,</math>
i szukamy dla niej warunków koniecznych na istnienie jej ekstremów, jako funkcji dwóch zmiennych<ref>porPor. ustęp [[ekstremum#Funkcje określone na podzbiorach płaszczyzny|Funkcje określone na podzbiorach płaszczyzny]].</ref>, tj. rozwiązaniu układu równań <math>F^\prime_x=0, F^\prime_y=0,</math>, a następnie wyrugowaniu z tego układu równań czynnika nieoznaczonego <math>\lambda.</math><br />Do otrzymanego warunku dołączamy warunek <math>G(x,y)=0.</math> Równoważnie, wszystkie punkty, które mogą być ekstremami warunkowymi można wyznaczyć z układu równań
: <math>\left\{\begin{array}{l}\frac{D(f,G)}{D(x,y)}=0\\G(x,y)=0\end{array}\right.</math>
gdzie <math>\tfrac{D(f,G)}{D(x,y)}</math> oznacza [[Macierz Jacobiego|jakobian]] funkcji <math>f</math> i <math>G.</math>
 
=== Przykład – ekstrema funkcji na okręgu ===
[[Plik:Lagrange very simple.jpg|thumb|300px|Wykresem funkcji <math>f(x,y)=x+y\,</math> jest [[płaszczyzna]]. W przestrzeni trójwymiarowej, równanie <math>x^2+y^2=1\,</math> opisuje [[Walec (bryła)|walec]] (u którego podstawy, na płaszczyźnie <math>xy\,</math> leży okrąg jednostkowy). Szukanie ekstremów warunkowych sprowadza się w tym wypadku do badania punktów ekstremalnych [[PrzekrójCzęść zbiorówwspólna|części wspólnej]] walca i płaszczyzny.]]
Ilustracją zastosowania metody mnożników Lagrange’a jest problem wyznaczenia ekstremów funkcji:
: <math>f(x,y)=x+y\,</math>
na kole jednostkowym, tj. przy warunku
: <math>x^2+y^2=1\,</math>
Zatem funkcja <math>G</math> jest postaci
: <math>G(x,y)=x^2+y^2-1\,</math>
a więc funkcja <math>F</math> wyraża się wzorem:
: <math>F(x,y)=f(x,y)+\lambda G(x,y)=\,</math>
:: <math>=x+y + \lambda (x^2 + y^2 - 1)\,</math>
 
Wszystkie punkty, które mogą być ekstremami warunkowymi są rozwiązaniami układu równań
Linia 394:
F^\prime_x(x,y)= 1 + 2 \lambda x &= 0 \\
F^\prime_y(x,y)= 1 + 2 \lambda y &= 0 \\
G(x,y) = x^2 + y^2 - 1 &= 0\end{array}\right.</math>
 
Podstawiając <math>x=y, x\neq 0\,</math> do pierwszego równania uzyskujemy: <math>\lambda=-\tfrac{1}{2x}.\,</math> Stosując podobne podstawienie do trzeciego równania, dostaje się warunek <math>2x^2=1,\,</math> skąd wynika <math>x=\pm\tfrac{\sqrt{2}}{2}.</math> Funkcja <math>f\,</math> może zatem przyjmować ekstrema tylko w punktach <math>\left( -\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right) , \left( \tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}\right).</math> Ponieważ okrąg jest zbiorem domkniętym i ograniczonym (czyli [[przestrzeń zwarta|zwartym]]<ref>Na mocy [[twierdzenie Heinego-Borela|twierdzenia Heinego-Borela]].</ref>), więc na mocy twierdzenia Weierstrassa, funkcja <math>f\,</math> osiąga w tych punktach ekstrema (warunkowe):
* minimum warunkowe: <math>f\left( -\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right) =-\sqrt{2}</math>
* maksimum warunkowe: <math>f\left( \tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}\right) =\sqrt{2}</math>
Linia 403:
 
=== Przykład – problem maksymalnej entropii ===
Problem polega na znalezieniu [[Dyskretny rozkład prawdopodobieństwa|dyskretnego rozkładu zmiennej losowej]] maksymalizującego [[Entropia (teoria informacji)|entropię]]. Funkcja entropii [[prawdopodobieństwo|prawdopodobieństw]] <math>p_1, \ldots, p_n\,</math> wyraża się wzorem
: <math>f(p_1,p_2,\ldots,p_n) = -\sum_{k=1}^n p_k\log_2 p_k</math>
 
Oczywiście, suma prawdopodobieństw <math>p_1, \ldots, p_n\,</math> jest równa jeden, więc warunek na <math>G\,</math> przyjmuje postać
 
: <math>G(p_1,p_2,\ldots,p_n)=\sum_{k=1}^n p_k-1</math>
Linia 418:
Różniczkując każde równanie <math>n</math>-krotnie, powyższy układ sprowadza się do poniższego:
 
: <math>-\left(\frac{1}{\ln 2}+\log_2 p_k \right) + \lambda = 0,\;\; 1\leqslant k\leqslant n</math>
Z powyższego wynika, że wszystkie prawdopodobieństwa są równe, tj. <math>p_1=\ldots=p_n,\,</math>, a ponieważ ich suma jest równa jeden, wynika stąd, że dla dowolnego <math>1\leqslant k\leqslant n\,</math> :
: <math>p_k=\frac{1}{n}</math>
 
Linia 425:
Ciekawym praktycznym zastosowaniem ekstremum lokalnego w przestrzeni par permutacji jest algorytm [[gradacyjna analiza danych|statystyczny]], zwany [[gradacyjna analiza odpowiedniości|gradacyjną analizą odpowiedniości]] (''Grade Correspondence Analysis''; GCA).
 
Algorytm ma na celu przekształcenie badanych [[skala nominalna|nominalnych cech statystycznych]] w [[Skala porządkowa|cechy porządkowe]] tak, aby [[korelacja rangowa]] pomiędzy nimi w [[Sprawdzian krzyżowy|zbiorze uczącym]] była maksymalna<ref>Podobny problem ze zwykłą korelacją Pearsona rozwiązuje klasyczna [[analiza odpowiedniości]].</ref>.
 
Algorytm GCA był stosowany m.in. do tabeli, w której wiersze odpowiadają [[okręg wyborczy|okręgom wyborczym]], kolumny [[partia polityczna|partiom politycznym]], a liczby w komórkach macierzy liczbie głosów oddanych na poszczególne partie w poszczególnych okręgach<ref>wW [[Wybory parlamentarne w Polsce w 1997 roku|wyborach do Sejmu w 1997 roku]].</ref> GCA rozmieściło zarówno okręgi wyborcze, jak i partie na skali, która po zbadaniu okazała się odpowiadać continuum [[lewica]]-[[prawica]].
 
Ściśle: danymi wejściowymi jest tzw. [[Tabele krzyżowe|macierz kontyngencji]], której wiersze odpowiadają możliwym wartościom (tzw. etykietom) pewnej [[skala nominalna|nominalnej cechy statystycznej]] (zwanej zmienną wierszową), a kolumny możliwym wartościom innej cechy nominalnej (zwanej zmienną kolumnową). Wartości elementów macierzy reprezentują liczebność [[obserwacja statystyczna|obserwacji]] w [[próba statystyczna|próbie]], dla których rozważane dwie cechy mają wartości przypisane do danego wiersza i kolumny<ref>Choć GCA można też stosować do innych [[zbiór danych|zbiorów danych]], np. takich gdzie każda kolumna reprezentuje inną zmienną.</ref>.
 
Celem algorytmu jest znalezienie takiej [[permutacja|permutacji]] wierszy i kolumn macierzy (czyli etykiet zmiennych wierszowej i kolumnowej), aby współczynnik [[Współczynnik korelacji rang Spearmana|rho Spearmana]] dla powstałego rozkładu dwuwymiarowego był największy. Odpowiada to znalezieniu takiego uszeregowania etykiet zmiennych nominalnych, aby powstałe w ten sposób [[Skala porządkowa|zmienne porządkowe]] wykazywały możliwie dużą [[zależność zmiennych losowych|zależność statystyczną]] w sensie [[korelacja rangowa|korelacji rangowej]].
Linia 443:
 
== Bibliografia ==
#* {{cytuj książkę |nazwisko=Fichtenholz |imię=Grigorij Michajłowicz|nazwisko=Fichtenholz |autor link=Grigorij Michajłowicz Fichtenholz |tytuł=Rachunek różniczkowy i całkowy, t. 1 |miejsce=Warszawa |wydawca=PWN |rok=1966}}
#* {{cytuj książkę|imię=Witold |nazwisko=Kołodziej |imię=Witold |tytuł=Analiza matematyczna |miejsce=Warszawa |wydawca=PWN |rok=1979}}
#* {{cytuj książkę |nazwisko=Kowalczyk |imię=Teresa |nazwisko2=Pleszczyńska |imię2=Elżbieta |autor link2=Elżbieta Pleszczyńska |nazwisko3=Ruland |imię3=Fred (red.)|rok=2004 |tytuł=Grade Models and Methods for Data Analysis with Applications for the Analysis of Data Populations |rok=2004 |wydawca=seria: ''Studies in Fuzziness and Soft Computing'', vol. 151, Springer Verlag |stronstrony=477 |miejsce=Berlin Heidelberg New York}}
#* {{cytuj książkę|imię=Franciszek |nazwisko=Leja |imię=Franciszek |autor link=Franciszek Leja |tytuł=Rachunek różniczkowy i całkowy |miejsce=Warszawa |wydawca=PWN |rok=1976}}
#* {{cytuj książkę|imię=Krzysztof |nazwisko=Maurin |imię=Krzysztof |autor link=Krzysztof Maurin |tytuł=Analiza – Część I – Elementy |miejsce=Warszawa |wydawca=PWN |rok=1976 |isbn = 978-83-01-09939-8}}
 
[[Kategoria:Analiza matematyczna]]