Ekstremum funkcji: Różnice pomiędzy wersjami

Usunięte 934 bajty ,  10 miesięcy temu
m
m (WP:SK+Bn)
m (WP:SK+Bn)
[[Plik:Extrema2.gif|thumb|250px|Funkcja <math>g(x)=x^3</math> nie ma dla <math>x=0</math> ekstremum lokalnego, mimo że jej pochodna w tym punkcie jest równa zero]]
[[warunek konieczny|Warunkiem koniecznym]] istnienia ekstremów lokalnych różniczkowawalnych funkcji <math>f</math> w pewnym punkcie <math>x_0\in (a,b)</math> jest
: <math>f^\prime' (x_0)=0.</math>
 
Geometrycznie oznacza to, że [[styczna]] do [[wykres funkcji|wykresu funkcji]] jest w tym punkcie prostą poziomą. Jest to tzw. '''twierdzenie Fermata'''. Udowodnijmy je:
:: <math>\frac{f(x_0-h) - f(x_0)}{-h} \cdot \frac{f(x_0+h) - f(x_0)}{h} \leqslant 0.</math>
 
Po przejściu do granicy, dla <math>h \rightarrowto 0,</math> otrzymujemy:
:: <math>(f'(x_0))^2 \leqslant 0.</math>
 
Zatem <math>f'(x_0) = 0.</math>
 
Warunek Fermata nie jest jednak [[warunek wystarczający|wystarczający]]. Np. funkcja <math>g(x)=x^3</math> nie ma ekstremum, chociaż jej pochodna <math>g^\prime'(x)=3x^2</math> zeruje się dla <math>x_0=0.</math> Ekstremum może natomiast istnieć w punktach, w których nie istnieje (obustronna) pochodna skończona – funkcja <math>h(x)=x^{\frac{2}{3}}</math> ma na przykład, minimum w punkcie <math>x_0=0,</math> podczas gdy jej pochodna lewostronna w tym punkcie równa się <math>-\infty,</math> a prawostronna <math>+\infty.</math> Podobnie funkcja [[wartość bezwzględna]] ma w punkcie <math>x_0=0</math> minimum globalne, chociaż w tym punkcie nie jest różniczkowalna.
 
==== Warunek konieczny i wystarczający istnienia ekstremum lokalnego ====
Funkcja ciągła <math>f\colon [a,b]\to \mathbb{R},</math> różniczkowalna w przedziale <math>(a,b)</math> i mająca skończoną liczbę [[punkt stacjonarny|punktów stacjonarnych]] (tj. takich, w których zeruje się jej pierwsza pochodna)<ref>Założenie o skończonej liczbie punktów stacjonarnych można zastąpić słabszym żądaniem, by każdy punkt stacjonarny był izolowany. Zobacz przykład funkcji <math>f(x)=\left\{\begin{array}{l}{x^2(1+\sin\frac{1}{x}),\; x\neq 0}\\{0,\; x=0}\end{array}\right.,</math> której wykres pokazano w sekcji [[Ekstremum#Proste przykłady ekstremów|Proste przykłady ekstremów]].</ref> ma w punkcie <math>x_0\in (a,b){:}</math>
* minimum lokalne wtedy i tylko wtedy, gdy istnieje takie <math>\delta >0,</math> że:
** <math>f^\prime'(x_0)=0,</math>
** <math>f^\prime'(x)< 0</math> dla <math>x\in (x_0-\delta, x_0),</math>
** <math>f^\prime'(x)> 0</math> dla <math>x\in (x_0,x_0+\delta);</math>
 
* maksimum lokalne wtedy i tylko wtedy, gdy istnieje takie <math>\delta >0,</math> że
** <math>f^\prime'(x_0)=0,</math>
** <math>f^\prime'(x)> 0</math> dla <math>x\in (x_0-\delta, x_0),</math>
** <math>f^\prime'(x)< 0</math> dla <math>x\in (x_0, x_0+\delta).</math>
 
==== Inne warunki wystarczające istnienia ekstremów ====
Jeśli o funkcji <math>f,</math> określonej jak wyżej, założy się dodatkowo, że jest dwukrotnie różniczkowalna w przedziale <math>(a,b)</math> oraz jej [[Pochodna funkcji|druga pochodna]] jest ciągła, to jeżeli <math>f^\prime'(x_0)=0</math> i <math>f^{\prime\prime}''(x_0)\neq 0,</math> to funkcja <math>f</math> ma w punkcie <math>x_0</math> ekstremum, przy czym, gdy <math>f^{\prime\prime}''(x_0)<0,</math> to jest to maksimum lokalne, a gdy <math>f^{\prime\prime}''(x_0)>0,</math> to minimum lokalne<ref>'''Dowód:''' Ze [[wzór Taylora|wzoru Taylora]] dla <math>n=2</math> wynika:
: <math>f(x_0+h)=f(x_0)+hf^\prime'(x_0)+\frac{1}{2}h^2f^{\prime\prime}''(x_0+\theta h),</math>
 
gdzie:
 
więc z:
: <math>f^\prime'(x_0)=0</math>
 
wynika:
: <math>f(x_0+h)-f(x_0)=\frac{1}{2}h^2f^{\prime\prime}''(x_0+\theta h).</math>
 
Dla <math>h\neq 0</math> prawa strona ma ten sam znak, co <math>f^{\prime\prime}''(x_0+\theta h).</math> Gdy <math>f^{\prime\prime}''(x_0)<0,</math> to z ciągłości <math>f^{\prime\prime}''</math> wynika <math>f^{\prime\prime}''(x)<0</math> w pewnym otoczeniu punktu <math>x_0,</math> więc w tym otoczeniu
: <math>f(x_0+h)-f(x_0)=f(x)-f(x_0)<0</math> dla <math>x\neq x_0,</math>
 
zatem istnieje maksimum w punkcie <math>x_0.</math> Analogicznie, istnieje minimum gdy <math>f^{\prime\prime}''(x_0)>0.</math></ref>.
 
Powyższe kryterium nie rozstrzyga przypadku, gdy druga pochodna jest równa zero.
 
jeżeli
: <math>f^\prime'(x_0)=f^{\prime\prime}''(x_0)=\ldots=f^{(n-1)}(x_0)=0,</math>
 
tj. wszystkie pochodne do <math>(n-1)</math>-ej zerują się w punkcie <math>x_0,</math> a <math>n</math>-ta pochodna jest różna od zera, to
: Zadanie sprowadza się do znalezienia ekstremum funkcji <math>V</math> w przedziale <math>[0, \tfrac{1}{2}a],</math> przy czym wartości krańcowe reprezentują pudełko odpowiednio bez ścianek oraz bez podstawki, a więc o zerowej (minimalnej) objętości.
: Pochodna
:: <math>V^\prime'(x) = (a-2x)(a-6x)</math>
: zeruje się na tym przedziale w punktach <math>x_0 := \tfrac{a}{6}</math> oraz <math>x_1 := \tfrac{a}{2}</math> (w tym przypadku objętość jest zerowa). Ponieważ funkcja objętości jest dodatnia wewnątrz przedziału, 0 na jego końcach i ma we wnętrzu nie więcej niż jedno ekstremum lokalne, to ma ona dokładnie jedno maksimum, które jest zarazem lokalne i globalne ([[twierdzenie Rolle’a]]); osiągane jest ono w <math>x_0.</math> Dlatego największa objętość pudełka wynosi
:: <math>V(x_0) = \frac{2}{27} a^3.</math>
; Rozwiązanie: Przebycie 1 mili morskiej trwa 1/''v'' godziny, więc kosztuje:
:: <math>f(v):=\tfrac{1}{v}(a+bv^3)=bv^2+\tfrac{a}{v}.</math>
: Przyrównując pochodną <math>f^\prime'</math> do zera, mamy:
:: <math>2bv-\tfrac{a}{v^2}=0,</math> skąd <math>v=\sqrt[3]\tfrac{a}{2b}.</math>
: Ponieważ druga pochodna
:: <math>f^{\prime\prime}''(v)=2b+2\tfrac{a}{v^3}>0,</math>
: więc koszty rzeczywiście osiągną najmniejszą wartość dla znalezionej wartości <math>v.</math>
 
 
[[Plik:HyperbolicParaboloid2.png|thumb|200px|[[Paraboloida hiperboliczna]] – w pobliżu początku układu współrzędnych ma ona kształt podobny do siodła (zob. [[punkt siodłowy]])]]
W dalszej części tego paragrafu przez <math>X</math> rozumiana jest dowolna przestrzeń unormowana, zaś przez <math>D</math> pewien jej [[zbiór otwarty|otwarty]]<ref>Por. [[Różniczka#Różniczkowalność a otwartość zbioru|Różniczkowalność a otwartość zbioru]].</ref> podzbiór. Funkcja <math>f\colon D\to\mathbb{R}</math> musi być [[pochodna Frécheta|różniczkowalna (w sensie Frécheta)]] w zbiorze <math>D.</math> Przez zapis <math>f^\prime'(x_0)</math> lub <math>df(x_0)</math> rozumie się [[różniczka|różniczkę]] funkcji <math>f,</math> która jest [[Przekształcenie liniowe|odwzorowaniem liniowym]] i ciągłym przestrzeni <math>X</math> o wartościach w <math>\mathbb{R}.</math> Pochodna <math>n</math>-tego rzędu funkcji (<math>n</math>-krotnie różniczkowalnej) jest [[Przekształcenie wieloliniowe|odwzorowaniem <math>n</math>-liniowym]] przestrzeni <math>X\times \ldots \times X</math> o wartościach rzeczywistych i oznaczana jest przez <math>f^{(n)}(x_0)</math> lub <math>df^n(x_0).</math>
 
Podobnie jak dla funkcji rzeczywistych, warunkiem koniecznym istnienia ekstremum w punkcie <math>x_0\in D</math> jest, aby wartość funkcji będącej różniczką w <math>x_0\in D</math> wynosiła zero dla wszystkich punktów w pewnym otoczeniu <math>x_0</math> <math>(f^\prime'(x_0)\equiv 0).</math> Punkt, w którym różniczka się zeruje (jest funkcją stale równą zero w pewnym otoczeniu <math>x_0</math>), nazywany jest '''punktem stacjonarnym'''.
 
Tak jak w przypadku funkcji jednej zmiennej, w punkcie stacjonarnym wcale nie musi być ekstremum. Na przykład dla funkcji <math>g\colon \mathbb{R}^2\to \mathbb{R}</math> danej wzorem <math>g(x,y)=xy,</math> której wykresem jest [[paraboloida hiperboliczna]], [[pochodna cząstkowa|pochodne cząstkowe]] <math>g^\prime_x'_x(x,y)=x,\; g^\prime_y'_y(x,y)=y</math> są jednocześnie równe zeru<ref>Jeśli którakolwiek pochodna kierunkowa, w tym pochodna cząstkowa, jest różna od zera, to również różniczka jest niezerowa (o ile istnieje). W tym przykładzie obie pochodne cząstkowe są ciągłe, <!-- a więc korzystając z twierdzenia??? – z lematu Schwarza --> istnieje również pochodna Frécheta i <math>{ f^\prime'(x_0)\equiv 0}.</math></ref> tylko w punkcie <math>(0,0),</math> w którym <math>f(x,y)=0.</math> Jednocześnie widać (por. rysunek obok), że w dowolnym otoczeniu zera funkcja przybiera zarówno wartości dodanie, jak i ujemne, a więc nie może być w nim ekstremum.
 
=== Definicje pomocnicze ===
 
=== Ekstrema a druga pochodna ===
Jeżeli funkcja <math>f</math> jest dwukrotnie różniczkowalna w pewnym otoczeniu <math>E\subseteq D</math> punktu <math>x_0,</math> przy czym <math>f^\prime'(x_0)=0,</math> a [[różniczka|pochodna]] <math>f^{\prime\prime}''</math> jest ciągła w <math>x_0,</math> to
* jeżeli <math>f</math> ma w <math>x_0</math> minimum lokalne, to <math>f^{\prime\prime}''(x_0)</math> jest nieujemna,
* jeżeli <math>f</math> ma w <math>x_0</math> maksimum lokalne, to <math>f^{\prime\prime}''(x_0)</math> jest niedodatnia.
 
=== Warunek konieczny i wystarczający istnienia ekstremum ===
Niech, jak poprzednio, funkcja <math>f</math> będzie dwukrotnie różniczkowalna w pewnym otoczeniu <math>U\subseteq D</math> punktu <math>x_0,</math> przy czym <math>f^\prime'(x_0)=0,</math> a [[różniczka|pochodna]] <math>f^{\prime\prime}''</math> jest ciągła w <math>x_0.</math>
* Jeżeli <math>f^{\prime\prime}''(x_0)</math> jest dodatnio określona, to <math>f</math> ma minimum lokalne właściwe w punkcie <math>x_0.</math>
* Jeżeli <math>f^{\prime\prime}''(x_0)</math> jest ujemnie określona, to <math>f</math> ma maksimum lokalne właściwe w punkcie <math>x_0.</math>
 
== Funkcje określone na podzbiorach płaszczyzny ==
Ważnym przypadkiem są funkcje określone na podzbiorach <math>X=\mathbb{R}^2.</math> Przypadek ten zasługuje na wyróżnienie ponieważ funkcje tego typu szczególnie często pojawiają się w zastosowaniach. Korzystając z własności [[pochodna cząstkowa|pochodnych cząstkowych]] takich funkcji można podać następujący [[algorytm]] badania istnienia ekstremów funkcji <math>f\colon D\to \mathbb{R},</math> gdzie <math>D</math> jest otwartym podzbiorem płaszczyzny. O funkcji <math>f</math> wiadomo, że jest dwukrotnie różniczkowalna i jej druga pochodna jest ciągła.
# Wyznaczamy wszystkie punkty <math>(x_0,y_0)\in D</math> takie, że pochodne cząstkowe<br /><br /><math>\left\{ \begin{matrix}
f^\prime_x'_x(x_0,y_0)=0 \\
f^\prime_y'_y(x_0,y_0)=0
\end{matrix}\right.</math> (rozwiązując ten układ równań)<ref>W przypadku funkcji różniczkowalnej <math>z=f(x,y)</math> równości te mają prosty sens geometryczny: [[płaszczyzna styczna]] do powierzchni <math>z=f(x,y)</math> w jej punkcie odpowiadającym ekstremum powinna być równoległa do płaszczyzny <math>xy.</math></ref>.
# Dla każdego punktu z osobna badamy znak [[Macierz Hessego|wyznacznika Hessego]]<br /><br /><math>\delta(x_0,y_0)=\left|\begin{array}{ll}f^{\prime\prime}''_{xx}(x_0,y_0) & f^{\prime\prime}''_{xy}(x_0,y_0) \\ f^{\prime\prime}''_{yx}(x_0,y_0) & f^{\prime\prime}''_{yy}(x_0,y_0)\end{array}\right|</math><br /><br />Na mocy [[lemat Schwarza|lematu Schwarza]] <math>f^{\prime\prime}''_{xy}(x_0,y_0)=f^{\prime\prime}''_{yx}(x_0,y_0),</math> więc<br /><br /><math>\delta(x_0,y_0)=f^{\prime\prime}''_{xx}(x_0,y_0)f^{\prime\prime}''_{yy}(x_0,y_0)-(f^{\prime\prime}''_{xy}(x_0,y_0))^2.</math>
# Jeżeli w danym punkcie <math>(x_0, y_0)</math> wyznacznik <math>\delta(x_0,y_0)<0,</math> to w tym punkcie nie ma ekstremum, jeśli <math>\delta(x_0,y_0)=0,</math> to w pewnych przypadkach może istnieć ekstremum, a pewnych nie<ref>Np. funkcja <math>f(x,y)=x^4+y^4</math> ma w punkcie <math>(0,0)</math> minimum, natomiast funkcja <math>g(x,y)=x^3+y^2</math> nie ma w punkcie <math>(0,0)</math> ekstremum lokalnego.</ref>. I ostatecznie, jeżeli <math>\delta(x_0,y_0)>0,</math> to istnieje ekstremum lokalne w tym punkcie, jeśli:
:* <math>f^{\prime\prime}''_{xx}(x_0,y_0)>0</math> co dla <math>\delta(x_0,y_0)>0</math> jest równoważne <math>f^{\prime\prime}''_{yy}(x_0,y_0)>0,</math> to jest to minimum lokalne,
:* <math>f^{\prime\prime}''_{xx}(x_0,y_0)<0</math> co dla <math>\delta(x_0,y_0)>0</math> jest równoważne <math>f^{\prime\prime}''_{yy}(x_0,y_0)<0</math> to jest to maksimum lokalne.
 
=== Przykład ===
Obliczamy pierwsze pochodne cząstkowe funkcji <math>f</math> i przyrównujemy do zera:
: <math>\left\{ \begin{matrix}
f^\prime_x'_x(x,y) = 0 \Leftrightarrow 6x^2 + 24x = 0 \\
f^\prime_y'_y(x,y) = 0 \Leftrightarrow -3y^2 + 27 = 0
\end{matrix} \right.</math>
 
 
Na mocy [[Funkcja uwikłana#Funkcje rzeczywiste|twierdzenia o funkcji uwikłanej]], wzór
: <math>y^\prime'(x)= -\frac{F^\prime_x'_x(x,y)}{F^\prime_y'_y(x,y)},</math>
 
gdzie <math>y=y(x),</math> a w konsekwencji także
: <math>y^{\prime\prime}''= -\frac{F^{\prime\prime}''_{xx}(F^\prime_y'_y)^2-2F^{\prime\prime}''_{xy}F^\prime_xF^\prime_y'_xF'_y+F^{\prime\prime}''_{yy}(F^\prime_x'_x)^2}{(F^\prime_y'_y)^3}</math>
 
pozwala wyznaczyć ekstrema funkcji <math>y</math> uwikłanej w równaniu <math>F(x,y)=0</math><ref>Wzór ten można otrzymać różniczkując tożsamość <math>F^\prime_x'_x+F^\prime_yy^\prime'_yy'(x)=0</math> dla <math>x\in (x_0-\delta, x_0+\delta).</math></ref>. W tym celu należy wyznaczyć punkty, w których
: <math>F(x,y)=0, y^\prime'=0, y^{\prime\prime}''\neq 0.</math>
 
Dwa ostatnie warunki równoważne są poniższym, tj.
: <math>F^\prime_x'_x=0, -\frac{F^{\prime\prime}''_{xx}}{F^\prime_y'_y}\neq 0.</math>
 
=== Przykład ===
 
Ponieważ
: <math>F^\prime_x'_x(x,y)=2x-2y=0,</math>
 
tylko gdy <math>x=y,</math> więc wstawiając to do równania
 
Ponieważ
: <math>F^\prime_y'_y(x,y)= -2x-6y</math>
 
oraz
: <math>F^{\prime\prime}''_{xx}(x,y)=2,</math>
 
zatem w punkcie <math>(1,1)</math> druga pochodna
: <math>y^{\prime\prime}''(-1)= -\tfrac{2}{-8}=\tfrac{1}{4}>0,</math>
 
czyli w tym punkcie jest minimum lokalne, natomiast w punkcie <math>(-1,-1),</math>
: <math>y^{\prime\prime}''(-1)=\tfrac{-2}{8}= -\tfrac{1}{4}<0,</math>
 
czyli w tym punkcie jest maksimum lokalne funkcji <math>y.</math>
# <math>X</math> i <math>Y</math> są [[przestrzeń Banacha|przestrzeniami Banacha]],
# <math>G\colon X\to Y</math> jest różniczkowalne w sposób ciągły w pewnym otoczeniu punktu <math>x_0\in X,</math>
# <math>x_0\in X</math> jest [[punkt regularny#Teoria różniczkowania|punktem regularnym]] zbioru <math>M=G^{-1}(\{0\}),</math> tj. <math>G^\prime'(x_0)</math> jest [[Funkcja „na”|suriekcją]] <math>X</math> na <math>Y,</math>
# <math>X_1:=(G^\prime'(x_0))^{-1}(\{0\}),</math> to znaczy <math>X_1</math> jest [[Jądro (algebra)|jądrem]] <math>G^\prime'(x_0),</math>
# <math>X=X_1\oplus X_2</math> (rozkład przestrzeni <math>X</math> na [[Podprzestrzeń komplementarna|topologiczną sumę prostą]]).
 
Niech <math>f</math> będzie funkcją określoną na otwartym podzbiorze <math>U</math> przestrzeni Banacha <math>X</math> o wartościach w <math>\mathbb{R}</math> oraz niech <math>x_0\in X</math> będzie punktem regularnym zbioru <math>M=G^{-1}(0).</math> Jeżeli funkcja <math>f</math> jest różniczkowalna w punkcie <math>x_0</math> i ma w tym punkcie ekstremum warunkowe, to
: <math>f^\prime'(x_0)x_1=0</math> &emsp; dla każdego <math>x_1\in X_1.</math>
 
W praktyce, często wykorzystywanym faktem do badania ekstremów warunkowych jest tzw. [[twierdzenie Lusternika (ekstrema warunkowe)|drugie twierdzenie Lusternika]], mówiące o tym, że jeżeli spełnione są założenia twierdzenia Lusternika i funkcja <math>f,</math> określona jak wyżej, jest różniczkowalna w punkcie <math>x_0\in M</math> i ma w tym punkcie ekstremum warunkowe (związane warunkiem <math>M</math>), to istnieje [[Forma liniowa|funkcjonał liniowy]] <math>\Lambda\in Y^\star</math> taki, że
: <math>f^\prime'(x_0)=\Lambda\circ G^\prime'(x_0).</math>
 
Funkcjonał <math>\Lambda</math> nazywany jest '''funkcjonałem Lagrange’a''' i ma ścisły związek z metodą szukania ekstremów warunkowych, zwaną '''metodą mnożników Lagrange’a''', opisaną dalej.
{{osobny artykuł|mnożniki Lagrange’a}}
W dalszym ciągu, podtrzymując powyższe założenia i zakładając dodatkowo, że funkcje <math>f</math> i <math>G</math> są dwukrotnie różniczkowalne w sposób ciągły w pewnych otoczeniach punktu <math>x_0,</math> można sformułować warunek wystarczający istnienia ekstremum warunkowego. Mianowicie, jeżeli istnieje funkcjonał liniowy <math>\Lambda\in Y^\star</math> taki, że
: <math>f^\prime'(x_0)=\Lambda\circ G^\prime'(x_0)</math>
 
oraz
: <math>(f^{\prime\prime}''(x_0)-\Lambda\circ G^{\prime\prime}''(x_0))(h)</math>
 
jest dodatnio (ujemnie) określona dla <math>h\in X_1=\ker G^\prime'(x_0),</math> to funkcja <math>f</math> ma w punkcie <math>x_0</math> minimum (maksimum) warunkowe.
 
Twierdzenie to można udowodnić korzystając z twierdzenia Lusternika i odpowiednio wykorzystując [[wzór Taylora|twierdzenia Taylora]]. Daje się ono łatwo uogólnić na przypadek pochodnych wyższych rzędów – w tym przypadku dodatkowo zakłada się, że odwzorowania <math>f</math> i <math>G</math> są różniczkowalne <math>2n</math> razy w sposób ciągły w pewnym otoczeniu punktu <math>x_0.</math> Wówczas, jeżeli istnieje funkcjonał <math>\Lambda\in Y^\star</math> taki, że
 
Szukanie ekstremów warunkowych funkcji <math>f\colon \mathbb{R}^n\to\mathbb{R},</math> będących zarazem punktami regularnymi<ref name="punktreg">Por. [[Punkt regularny#Szczególne przypadki|punkt regularny (szczególne przypadki)]].</ref>, sprowadza się do rozwiązania układu równań operatorowych
: <math>\left\{\begin{array}{l}f^\prime'(x)=\Lambda\circ G^\prime'(x)\\G(x)=0\end{array}\right.</math>
 
gdzie <math>\Lambda\in (\mathbb{R}^m)^\star.</math> Wiadomo, że każdy taki funkcjonał <math>\Lambda</math> jest reprezentowany przez układ <math>m</math> [[liczby rzeczywiste|liczb rzeczywistych]] <math>\lambda_1,\dots,\lambda_m</math> a pochodna <math>G^\prime'(x)</math> jest [[macierz]]ą wymiaru <math>m\times n</math> [[rząd macierzy|rzędu]] <math>m</math><ref name="punktreg" />. Układ równań operatorowych sprowadza się więc do układu <math>m+n</math> równań skalarnych:
: <math>\left\{\begin{array}{l}\frac{\partial f(x)}{\partial x_j}=\sum_{i=1}^m\lambda_i\frac{\partial G_i(x)}{\partial x_j},\; j=1,\dots,n\\G_k(x_1,\dots, x_n)=0,\; k=1,\dots, m\end{array}\right.</math>
 
gdzie <math>x=(x_1,\dots,x_n)</math> o <math>n+m</math> zmiennych <math>\lambda_i, x_k, \; i\leqslant m, k\leqslant n.</math> Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby <math>\lambda_i</math> spełniają tylko rolę pomocniczą i nazywane są często [[Mnożniki Lagrange’a|mnożnikami Lagrange’a]]. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, należy odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną określoność)
: <math>f^{\prime\prime}''(x)-\Lambda\circ G^{\prime\prime}''(x)</math>
 
dla
: <math>h\in X_1=\ker G^\prime'(x_0),</math>
 
co sprowadza się do badania [[forma kwadratowa|formy kwadratowej]]
 
Warunek <math>h\in X_1</math> jest równoważny równaniu
: <math>G^\prime'(x)h=0,</math>
 
które w postaci macierzowej przybiera formę
: <math>F(x,y)=f(x,y)+\lambda G(x,y)</math>
 
i szukamy dla niej warunków koniecznych na istnienie jej ekstremów, jako funkcji dwóch zmiennych<ref>Por. ustęp [[ekstremum#Funkcje określone na podzbiorach płaszczyzny|Funkcje określone na podzbiorach płaszczyzny]].</ref>, tj. rozwiązaniu układu równań <math>F^\prime_x'_x=0, F^\prime_y'_y=0,</math> a następnie wyrugowaniu z tego układu równań czynnika nieoznaczonego <math>\lambda.</math><br />Do otrzymanego warunku dołączamy warunek <math>G(x,y)=0.</math> Równoważnie, wszystkie punkty, które mogą być ekstremami warunkowymi można wyznaczyć z układu równań
: <math>\left\{\begin{array}{l}\frac{D(f,G)}{D(x,y)}=0\\G(x,y)=0\end{array}\right.</math>
 
Wszystkie punkty, które mogą być ekstremami warunkowymi są rozwiązaniami układu równań
: <math>\left\{\begin{array}{l}
F^\prime_x'_x(x,y)= 1 + 2 \lambda x &= 0 \\
F^\prime_y'_y(x,y)= 1 + 2 \lambda y &= 0 \\
G(x,y) = x^2 + y^2 - 1 &= 0\end{array}\right.</math>