Ekstremum funkcji: Różnice pomiędzy wersjami

[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
Linia 27:
== Definicje ==
Funkcja <math>f</math> o wartościach w zbiorze uporządkowanym określona na przestrzeni topologicznej ma w punkcie <math>x_0</math> tej przestrzeni:
* '''minimum lokalne''', jeśli istnieje [[otoczenie (matematyka)|otoczenie]] otwarte <math>U</math> punktu <math>x_0</math> takie, że dla każdego <math>x\in U,</math>
:: <math>f(x)\geqslant f(x_0),</math>
: więc nie występują w okolicy punktu <math>x_0</math> wartości funkcji mniejsze od <math>f(x_0)</math> (ani nieporównywalne), choć mogą występować wartości równe;,
* '''maksimum lokalne''', gdy istnieje otoczenie otwarte <math>U</math> punktu <math>x_0</math> takie, że dla każdego <math>x\in U,</math>
:: <math>f(x)\leqslant f(x_0),</math>
: więc nie występują w okolicy punktu <math>x_0</math> wartości funkcji większe od <math>f(x_0)</math> (ani nieporównywalne), choć mogą występować wartości równe;,
* '''właściwe minimum lokalne''', jeśli w pewnym otoczeniu otwartym <math>U</math> punktu <math>x_0</math> funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości większe od <math>f(x_0),</math> czyli nie ma wartości równych dla <math>x\ne x_0,</math> formalnie:
:: <math>x=x_0 \vee f(x)> f(x_0)</math> dla każdego <math>x\in U,</math>
* '''właściwe maksimum lokalne''', jeśli w pewnym otoczeniu otwartym <math>U</math> punktu <math>x_0</math> funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości mniejsze od <math>f(x_0),</math> formalnie:
:: <math>x=x_0 \vee f(x)< f(x_0)</math> dla każdego <math>x\in U.</math>
 
Funkcja <math>f</math> o wartościach w zbiorze uporządkowanym<ref>Dla ekstremów globalnych nie jest potrzebna definicja systemu otoczeń.</ref> ma w punkcie <math>x_0</math> swojej dziedziny:
* '''minimum globalne''', jeśli dla każdego <math>x</math> należącego do jej dziedziny:
:: <math>f(x)\geqslant f(x_0),</math>
* '''maksimum globalne''', jeśli dla każdego <math>x</math> należącego do jej dziedziny:
:: <math>f(x)\leqslant f(x_0),</math>
* '''właściwe minimum globalne''', jeśli dla każdego <math>x</math> należącego do jej dziedziny:
:: <math>x=x_0 \vee f(x)> f(x_0),</math>
: czyli funkcja przyjmuje wszędzie z wyjątkiem punktu <math>x_0</math> wartości większe od <math>f(x_0)</math>
* '''właściwe maksimum globalne''', jeśli dla każdego <math>x</math> należącego do jej dziedziny:
:: <math>x=x_0 \vee f(x)< f(x_0),</math>
: czyli funkcja przyjmuje wszędzie z wyjątkiem punktu <math>x_0</math> wartości mniejsze od <math>f(x_0).</math>
 
Nie każda funkcja posiada ekstrema. Jeśli funkcja nie jest [[funkcja ograniczona|ograniczona]] (np. <math>f(x)=x</math>), to nie ma maksimum ani minimum globalnego – jeżeli nie jest ograniczona od góry, to nie ma maksimum globalnego; a jeżeli od dołu, to nie ma minimum globalnego.
Linia 87:
[[Plik:Extrema2.gif|thumb|250px|Funkcja <math>g(x)=x^3</math> nie ma dla <math>x=0</math> ekstremum lokalnego, mimo że jej pochodna w tym punkcie jest równa zero]]
[[warunek konieczny|Warunkiem koniecznym]] istnienia ekstremów lokalnych różniczkowawalnych funkcji <math>f</math> w pewnym punkcie <math>x_0\in (a,b)</math> jest
: <math>f^\prime (x_0)=0.</math>
 
Geometrycznie oznacza to, że [[styczna]] do [[wykres funkcji|wykresu funkcji]] jest w tym punkcie prostą poziomą. Jest to tzw. '''twierdzenie Fermata'''. Udowodnijmy je:
 
jeśli <math>f</math> ma w punkcie <math>x_0</math> ekstremum lokalne, to istnieje takie <math>\epsilon > 0,</math> że dla każdej liczby rzeczywistej <math>h,</math> spełniającej <math>0 < |h| < \epsilon,</math> zachodzi:
:: <math>(f(x_0-h) - f(x_0)) \cdot (f(x_0+h) - f(x_0)) \gegeqslant 0,</math>
 
a więc:
:: <math>\frac{f(x_0-h) - f(x_0)}{-h} \cdot \frac{f(x_0+h) - f(x_0)}{h} \leleqslant 0.</math>
 
Po przejściu do granicy, dla <math>h \rightarrow 0,</math> otrzymujemy:
:: <math>(f'(x_0))^2 \leleqslant 0.</math>
 
Zatem <math>f'(x_0) = 0.</math>
Linia 105:
 
==== Warunek konieczny i wystarczający istnienia ekstremum lokalnego ====
Funkcja ciągła <math>f\colon [a,b]\to \mathbb{R},</math> różniczkowalna w przedziale <math>(a,b)</math> i mająca skończoną liczbę [[punkt stacjonarny|punktów stacjonarnych]] (tj. takich, w których zeruje się jej pierwsza pochodna)<ref>Założenie o skończonej liczbie punktów stacjonarnych można zastąpić słabszym żądaniem, by każdy punkt stacjonarny był izolowany. Zobacz przykład funkcji <math>f(x)=\left\{\begin{array}{l}{x^2(1+\sin\frac{1}{x}),\; x\neq 0}\\{0,\; x=0}\end{array}\right.,</math> której wykres pokazano w sekcji [[Ekstremum#Proste przykłady ekstremów|Proste przykłady ekstremów]].</ref> ma w punkcie <math>x_0\in (a,b){:}</math>:
* minimum lokalne wtedy i tylko wtedy, gdy istnieje takie <math>\delta >0,</math> że:
** <math>f^\prime(x_0)=0,</math>
** <math>f^\prime(x)< 0</math> dla <math>x\in (x_0-\delta, x_0),</math>
** <math>f^\prime(x)> 0</math> dla <math>x\in (x_0,x_0+\delta);</math>
 
* maksimum lokalne wtedy i tylko wtedy, gdy istnieje takie <math>\delta >0,</math> że
** <math>f^\prime(x_0)=0,</math>
** <math>f^\prime(x)> 0</math> dla <math>x\in (x_0-\delta, x_0),</math>
** <math>f^\prime(x)< 0</math> dla <math>x\in (x_0, x_0+\delta).</math>
 
==== Inne warunki wystarczające istnienia ekstremów ====
Linia 139:
Jeżeli założy się dodatkowo o funkcji <math>f,</math> że jest <math>n</math>-krotnie razy różniczkowalna i <math>n</math>-ta pochodna jest ciągła w <math>(a,b),</math> to prawdziwe jest następujące twierdzenie:
 
jeżeli
Jeżeli
: <math>f^\prime(x_0)=f^{\prime\prime}(x_0)=\ldots=f^{(n-1)}(x_0)=0,</math>
 
Linia 161:
 
; Rozwiązanie 1: Jeśli przez <math>x</math> oznaczyć długość boku wyciętego kwadratu, to objętość <math>V</math> pudełka będzie równa
:: <math>V(x) = x(a-2x)^2,</math>
: przy czym
:: <math>0 \leqslant x \leqslant \tfrac{1}{2}a.</math>
: Zadanie sprowadza się do znalezienia ekstremum funkcji <math>V</math> w przedziale <math>[0, \tfrac{1}{2}a],</math> przy czym wartości krańcowe reprezentują pudełko odpowiednio bez ścianek oraz bez podstawki, a więc o zerowej (minimalnej) objętości.
: Pochodna
:: <math>V^\prime(x) = (a-2x)(a-6x)</math>
: zeruje się na tym przedziale w punktach <math>x_0 := \tfrac{a}{6}</math> oraz <math>x_1 := \tfrac{a}{2}</math> (w tym przypadku objętość jest zerowa). Ponieważ funkcja objętości jest dodatnia wewnątrz przedziału, 0 na jego końcach i ma we wnętrzu nie więcej niż jedno ekstremum lokalne, to ma ona dokładnie jedno maksimum, które jest zarazem lokalne i globalne ([[twierdzenie Rolle’a]]); osiągane jest ono w <math>x_0.</math> Dlatego największa objętość pudełka wynosi
:: <math>V(x_0) = \frac{2}{27} a^3.</math>
 
; Rozwiązanie 2: Wielkość <math>W(x) := 4V(x) = ABC,\quad{}</math> gdzie
:: <math>A := 4x</math> oraz <math>B:=C:=a-2x</math>
: są nieujemne, przyjmuje wartość maksymalną dla tego samego <math>x</math> co <math>V(x).</math> Ponieważ
Linia 179:
:: <math>4x = a - 2x,</math>
: czyli dla
:: <math>x= \frac{a}{6}.</math>
: Zatem dla tej właśnie wartości <math>x,</math> <math>V(x)</math> przyjmuje wartość maksymalną:
:: <math>V\left( \frac{a}{6}\right) = \frac{2}{27} a^3.</math>
 
==== Koszt eksploatacji statku ====
Linia 187:
 
; Rozwiązanie: Przebycie 1 mili morskiej trwa 1/''v'' godziny, więc kosztuje:
:: <math>f(v):=\tfrac{1}{v}(a+bv^3)=bv^2+\tfrac{a}{v}.</math>
: Przyrównując pochodną <math>f^\prime</math> do zera, mamy:
:: <math>2bv-\tfrac{a}{v^2}=0,</math> skąd <math>v=\sqrt[3]{\tfrac{a}{2b}}.</math>
: Ponieważ druga pochodna
:: <math>f^{\prime\prime}(v)=2b+2\tfrac{a}{v^3}>0,</math>
: więc koszty rzeczywiście osiągną najmniejszą wartość dla znalezionej wartości <math>v.</math>
 
Linia 211:
Funkcjonał dwuliniowy <math>\varphi\colon X\times X\to \mathbb{R}</math> jest
* '''dodatnio określony''', jeśli
: <math>\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\geqslant c\|h\|^2,</math>
* '''ujemnie określony''', jeśli
: <math>\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\leqslant -c\|h\|^2.</math>
 
W szczególności, każda [[Macierz|macierz kwadratowa]] może być interpretowana jako macierz funkcjonału dwuliniowego przestrzeni <math>X=\mathbb{R}^m</math> (por. [[Określoność formy|macierz dodatnio określona]]). Prawdziwe jest twierdzenie, które mówi, że każdy dodatni (lub ujemny) funkcjonał dwuliniowy tej przestrzeni jest dodatnio określony (ujemnie określony). Do badania dodatniej (ujemnej) określoności macierzy służy [[kryterium Sylvestera]].
Linia 232:
f^\prime_x(x_0,y_0)=0 \\
f^\prime_y(x_0,y_0)=0
\end{matrix}\right.</math> (rozwiązując ten układ równań)<ref>W przypadku funkcji różniczkowalnej <math>z=f(x,y)</math> równości te mają prosty sens geometryczny: [[płaszczyzna styczna]] do powierzchni <math>z=f(x,y)</math> w jej punkcie odpowiadającym ekstremum powinna być równoległa do płaszczyzny <math>xy.</math></ref>.
# Dla każdego punktu z osobna badamy znak [[Macierz Hessego|wyznacznika Hessego]]<br /><br /><math>\delta(x_0,y_0)=\left|\begin{array}{ll}f^{\prime\prime}_{xx}(x_0,y_0) & f^{\prime\prime}_{xy}(x_0,y_0) \\ f^{\prime\prime}_{yx}(x_0,y_0) & f^{\prime\prime}_{yy}(x_0,y_0)\end{array}\right|</math><br /><br />Na mocy [[lemat Schwarza|lematu Schwarza]] <math>f^{\prime\prime}_{xy}(x_0,y_0)=f^{\prime\prime}_{yx}(x_0,y_0),</math> więc<br /><br /><math>\delta(x_0,y_0)=f^{\prime\prime}_{xx}(x_0,y_0)f^{\prime\prime}_{yy}(x_0,y_0)-(f^{\prime\prime}_{xy}(x_0,y_0))^2.</math>
# Jeżeli w danym punkcie <math>(x_0, y_0)</math> wyznacznik <math>\delta(x_0,y_0)<0,</math> to w tym punkcie nie ma ekstremum, jeśli <math>\delta(x_0,y_0)=0,</math> to w pewnych przypadkach może istnieć ekstremum, a pewnych nie<ref>Np. funkcja <math>f(x,y)=x^4+y^4</math> ma w punkcie <math>(0,0)</math> minimum, natomiast funkcja <math>g(x,y)=x^3+y^2</math> nie ma w punkcie <math>(0,0)</math> ekstremum lokalnego.</ref>. I ostatecznie, jeżeli <math>\delta(x_0,y_0)>0,</math> to istnieje ekstremum lokalne w tym punkcie, jeśli:
Linia 250:
 
Układ równań ma dokładnie 4 rozwiązania, którymi są punkty
: <math>a=(0,3),\ b=(0,-3),\ c=(-4,-3),\ d=(-4,3),</math>
 
* <math>\delta(a)<0</math> i <math>\delta(c)<0</math> – zatem w tych punktach nie ma ekstremów (na wykresie zaznaczono je na pomarańczowo, są to tzw. [[punkt siodłowy|punkty siodłowe]] funkcji <math>f</math>).,
* <math>\delta(b)>0</math> – w tym punkcie jest minimum lokalne (zaznaczono na czerwono).,
* <math>\delta(d)>0</math> – w tym punkcie jest maksimum lokalne (zaznaczono na zielono).
 
Linia 263:
 
Na mocy [[Funkcja uwikłana#Funkcje rzeczywiste|twierdzenia o funkcji uwikłanej]], wzór
: <math>y^\prime(x)= -\frac{F^\prime_x(x,y)}{F^\prime_y(x,y)},</math>
 
gdzie <math>y=y(x),</math> a w konsekwencji także
: <math>y^{\prime\prime}= -\frac{F^{\prime\prime}_{xx}(F^\prime_y)^2-2F^{\prime\prime}_{xy}F^\prime_xF^\prime_y+F^{\prime\prime}_{yy}(F^\prime_x)^2}{(F^\prime_y)^3}</math>
 
pozwala wyznaczyć ekstrema funkcji <math>y</math> uwikłanej w równaniu <math>F(x,y)=0</math><ref>Wzór ten można otrzymać różniczkując tożsamość <math>F^\prime_x+F^\prime_yy^\prime(x)=0</math> dla <math>x\in (x_0-\delta, x_0+\delta).</math></ref>. W tym celu należy wyznaczyć punkty, w których
Linia 287:
 
Ponieważ
: <math>F^\prime_y(x,y)= -2x-6y</math>
 
oraz
Linia 293:
 
zatem w punkcie <math>(1,1)</math> druga pochodna
: <math>y^{\prime\prime}(-1)= -\tfrac{2}{-8}=\tfrac{1}{4}>0,</math>
 
czyli w tym punkcie jest minimum lokalne, natomiast w punkcie <math>(-1,-1),</math>
: <math>y^{\prime\prime}(-1)=\tfrac{-2}{8}= -\tfrac{1}{4}<0,</math>
 
czyli w tym punkcie jest maksimum lokalne funkcji <math>y.</math>
Linia 315:
 
Formalnie, o funkcji <math>L</math> zakłada się, że jest określona na <math>\mathbb{R}^{2n+1}</math> oraz jest dwukrotnie różniczkowalna w sposób ciągły. Dalej, o funkcji
: <math>[a,b]\ni t \mapsto q(t)=(q_1(t), \ldotsdots, q_n(t))\in \mathbb{R}^n</math>
 
zakłada się, że jest funkcją o wartościach wektorowych, dwukrotnie różniczkowalną w sposób ciągły. W celu wyznaczenia toru cząstki, określa się funkcjonał
: <math>F(q)=\int\limits_a^b L\left(t, q_1(t), \ldotsdots, q_n(t), \frac{dq_1}{dt}(t), \ldotsdots, \frac{dq_n}{dt}(t)\right)dt.</math>
 
Ekstremów tego funkcjonału szuka się w klasie funkcji dwukrotnie różniczkowalnych, przyjmujących na końcach przedziału <math>[a,b]</math> wartości
: <math>q_1(a), q_1(b), \ldotsdots, q_n(a), q_n(b).</math>
 
Jest to problem z tzw. [[Zagadnienie brzegowe|ustalonym brzegiem]]. Okazuje się, że funkcje <math>q_i,</math> dla których funkcjonał <math>F</math> przyjmuje ekstremum, spełniają układ [[Równanie różniczkowe cząstkowe|równań różniczkowych cząstkowych]], zwanych '''równaniami Eulera-Lagrange’a''', postaci:
Linia 353:
 
W praktyce, często wykorzystywanym faktem do badania ekstremów warunkowych jest tzw. [[twierdzenie Lusternika (ekstrema warunkowe)|drugie twierdzenie Lusternika]], mówiące o tym, że jeżeli spełnione są założenia twierdzenia Lusternika i funkcja <math>f,</math> określona jak wyżej, jest różniczkowalna w punkcie <math>x_0\in M</math> i ma w tym punkcie ekstremum warunkowe (związane warunkiem <math>M</math>), to istnieje [[Forma liniowa|funkcjonał liniowy]] <math>\Lambda\in Y^\star</math> taki, że
: <math>f^\prime(x_0)=\Lambda\circ G^\prime(x_0).</math>
 
Funkcjonał <math>\Lambda</math> nazywany jest '''funkcjonałem Lagrange’a''' i ma ścisły związek z metodą szukania ekstremów warunkowych, zwaną '''metodą mnożników Lagrange’a''', opisaną dalej.
Linia 370:
: <math>f^{(k)}(x_0)=\Lambda\circ G^{(k)}(x_0)</math>
 
dla <math>k=1,2,\ldotsdots, 2n-1</math> oraz odwzorowanie
: <math>\left(f^{(2n)}(x_0)-\Lambda\circ G^{(2n)}(x_0)\right)(h)</math>
 
jest dodatnio<ref>Uwaga: w tym wypadku pojęcie dodatniej (ujemnej) określoności zostaje rozszerzone na [[Przekształcenie wieloliniowe|funkcjonały ''n''-liniowe]], tj. powiemy że funkcjonał <math>n</math>-liniowy <math>\varphi\colon X\times\ldots\times X\to \mathbb{R}</math> jest dodatnio (ujemnie) określony, jeśli istnieje takie <math>c>0,</math> że <math>\varphi(h,\ldotsdots, h)\geqslant c\|h\|^n \; (\leqslant -c\|h\|^n)</math> dla wszelkich <math>h\in X.</math></ref> (ujemnie) określona dla <math>h\in X_1,</math> to funkcja <math>f</math> ma w punkcie <math>x_0</math> minimum (maksimum) warunkowe.
 
=== Ekstrema warunkowe w <math>\mathbb{R}^n</math> ===
Badanie ekstremów warunkowych przekształceń dowolnych przestrzeni Banacha jest rzeczą trudną. Już samo spełnienie założeń twierdzenia Lusternika może okazać się niemożliwe, gdyż nie każdą przestrzeń unormowaną da się rozłożyć na topologiczną sumę prostą jej podprzestrzeni<ref>Da się to zrobić w przypadku [[przestrzeń Hilberta|przestrzeni Hilberta]] – [[twierdzenie o rozkładzie ortogonalnym]] mówi, że dla każdej [[zbiór domknięty|domkniętej]] podprzestrzeni przestrzeni Hilberta istnieje [[dopełnienie ortogonalne]]. W szczególności, rozkład taki jest możliwy jeżeli <math>X</math> jest przestrzenią skończenie wymiarową.</ref>. Duża część zagadnień praktycznych sprowadza się do badania ekstremów warunkowych w przypadku gdy <math>X=\mathbb{R}^n,\; Y=\mathbb{R}^m,\; n\geqslant m,</math> a odwzorowanie <math>G\colon \mathbb{R}^n\to \mathbb{R}^m</math> reprezentowane jest przez układ <math>m</math> funkcji o <math>n</math> zmiennych, tj. <math>G=(G_1,\ldotsdots, G_m).</math>
 
Szukanie ekstremów warunkowych funkcji <math>f\colon \mathbb{R}^n\to\mathbb{R},</math> będących zarazem punktami regularnymi<ref name="punktreg">Por. [[Punkt regularny#Szczególne przypadki|punkt regularny (szczególne przypadki)]].</ref>, sprowadza się do rozwiązania układu równań operatorowych
: <math>\left\{\begin{array}{l}f^\prime(x)=\Lambda\circ G^\prime(x)\\G(x)=0\end{array}\right.</math>
 
gdzie <math>\Lambda\in (\mathbb{R}^m)^\star.</math> Wiadomo, że każdy taki funkcjonał <math>\Lambda</math> jest reprezentowany przez układ <math>m</math> [[liczby rzeczywiste|liczb rzeczywistych]] <math>\lambda_1,\ldotsdots,\lambda_m</math> a pochodna <math>G^\prime(x)</math> jest [[macierz]]ą wymiaru <math>m\times n</math> [[rząd macierzy|rzędu]] <math>m</math><ref name="punktreg" />. Układ równań operatorowych sprowadza się więc do układu <math>m+n</math> równań skalarnych:
: <math>\left\{\begin{array}{l}\frac{\partial f(x)}{\partial x_j}=\sum_{i=1}^m\lambda_i\frac{\partial G_i(x)}{\partial x_j},\; j=1,\ldotsdots,n\\G_k(x_1,\ldotsdots, x_n)=0,\; k=1,\ldotsdots, m\end{array}\right.</math>
 
gdzie <math>x=(x_1,\ldotsdots,x_n)</math> o <math>n+m</math> zmiennych <math>\lambda_i, x_k, \; i\leqslant m, k\leqslant n.</math> Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby <math>\lambda_i</math> spełniają tylko rolę pomocniczą i nazywane są często [[Mnożniki Lagrange’a|mnożnikami Lagrange’a]]. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, należy odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną określoność)
: <math>f^{\prime\prime}(x)-\Lambda\circ G^{\prime\prime}(x)</math>
 
Linia 391:
 
co sprowadza się do badania [[forma kwadratowa|formy kwadratowej]]
: <math>\sum_{i,j=1}^n\left(\frac{\partial^2f(x)}{\partial x_i\partial x_j}-\sum_{k=1}^m\lambda_k\frac{\partial^2 G_k(x)}{\partial x_j\partial x_j}\right)h_ih_j,</math>
 
gdzie:
: <math>h\in X_1, h=(h_1, \ldotsdots, h_n).</math>
 
Warunek <math>h\in X_1</math> jest równoważny równaniu
Linia 400:
 
które w postaci macierzowej przybiera formę
: <math>\sum_{i=1}^n\frac{\partial G_k(x)}{\partial x_i}h_i=0,\; k=1,2,\ldotsdots, m.</math>
 
Do badania określoności tej macierzy można stosować kryterium Sylvestera.
Linia 424:
 
a więc funkcja <math>F</math> wyraża się wzorem:
: <math>F(x,y)=f(x,y)+\lambda G(x,y) = x+y + \lambda (x^2 + y^2 - 1).</math>
:: <math>=x+y + \lambda (x^2 + y^2 - 1).</math>
 
Wszystkie punkty, które mogą być ekstremami warunkowymi są rozwiązaniami układu równań
Linia 433 ⟶ 432:
G(x,y) = x^2 + y^2 - 1 &= 0\end{array}\right.</math>
 
Podstawiając <math>x=y, x\neq 0</math> do pierwszego równania uzyskujemy: <math>\lambda= -\tfrac{1}{2x}.</math> Stosując podobne podstawienie do trzeciego równania, dostaje się warunek <math>2x^2=1,</math> skąd wynika <math>x=\pm\tfrac{\sqrt{2}}{2}.</math> Funkcja <math>f</math> może zatem przyjmować ekstrema tylko w punktach <math>\left( -\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right) , \left( \tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}\right).</math> Ponieważ okrąg jest zbiorem domkniętym i ograniczonym (czyli [[przestrzeń zwarta|zwartym]]<ref>Na mocy [[twierdzenie Heinego-Borela|twierdzenia Heinego-Borela]].</ref>), więc na mocy twierdzenia Weierstrassa, funkcja <math>f</math> osiąga w tych punktach ekstrema (warunkowe):
* minimum warunkowe: <math>f\left( -\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right) = -\sqrt{2},</math>
* maksimum warunkowe: <math>f\left( \tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}\right) =\sqrt{2}.</math>
 
Linia 440 ⟶ 439:
 
=== Przykład – problem maksymalnej entropii ===
Problem polega na znalezieniu [[Dyskretny rozkład prawdopodobieństwa|dyskretnego rozkładu zmiennej losowej]] maksymalizującego [[Entropia (teoria informacji)|entropię]]. Funkcja entropii [[prawdopodobieństwo|prawdopodobieństw]] <math>p_1, \ldotsdots, p_n</math> wyraża się wzorem
: <math>f(p_1,p_2,\ldotsdots,p_n) = -\sum_{k=1}^n p_k\log_2 p_k.</math>
 
Oczywiście, suma prawdopodobieństw <math>p_1, \ldotsdots, p_n</math> jest równa jeden, więc warunek na <math>G</math> przyjmuje postać
: <math>G(p_1,p_2,\ldotsdots,p_n)=\sum_{k=1}^n p_k-1.</math>
 
Stosując metodę mnożników Lagrange’a, dostajemy [[układ równań|układ]] <math>n</math> równań:
: <math>\frac{\partial}{\partial p_k}(f(p_1,p_2,\ldotsdots,p_n)+\lambda (G(p_1,p_2,\ldotsdots,p_n)-1))=0,\;\;quad 1\leqslant k\leqslant n,</math>
 
który sprowadza się do układu
: <math>\frac{\partial}{\partial p_k}\left(-\sum_{k=1}^n p_k \log_2 p_k + \lambda \left(\sum_{k=1}^n p_k - 1\right) \right) = 0,\;\;quad 1\leqslant k\leqslant n.</math>
 
Różniczkując każde równanie <math>n</math>-krotnie, powyższy układ sprowadza się do poniższego:
: <math>-\left(\frac{1}{\ln 2}+\log_2 p_k \right) + \lambda = 0,\;\;quad 1\leqslant k\leqslant n.</math>
 
Z powyższego wynika, że wszystkie prawdopodobieństwa są równe, tj. <math>p_1=\ldots=p_n,</math> a ponieważ ich suma jest równa jeden, wynika stąd, że dla dowolnego <math>1\leqslant k\leqslant n{:}</math>:
: <math>p_k=\frac{1}{n}.</math>