Ekstremum funkcji: Różnice pomiędzy wersjami

Dodane 54 bajty ,  3 lata temu
m
Drobne redakcyjne - poprawki linków, apostrofów, cudzysłowów...
m (Drobne redakcyjne - poprawki linków, apostrofów, cudzysłowów...)
Pojęcie ekstremum wymaga, by wartości funkcji dało się ze sobą porównywać – w [[Funkcja|przeciwdziedzinie]] funkcji powinien być zatem zdefiniowany jakiś [[Częściowy porządek|porządek]]. Zbiór uporządkowany, i to [[porządek liniowy|liniowo]], tworzą np. [[liczby rzeczywiste]]. Nie ma natomiast powszechnie przyjętego uporządkowania kolorów, zwłaszcza porządku liniowego.
 
W przypadku ekstremum lokalnego konieczne jest ponadto sprecyzowanie pojęcia "lokalności"„lokalności”. Dokonuje się to przez określenie dla każdego argumentu funkcji, które punkty z jej dziedziny są mu "bliskie"„bliskie”. Formalizując to podejście, określamy w każdym punkcie dziedziny funkcji tak zwaną [[baza otoczeń|bazę otoczeń]] punktu. Dla liczby rzeczywistej otoczeniem jest np. [[Przedział (matematyka)|przedział otwarty]], zawierający tę liczbę. Ogólnie, zbiór z systemem otoczeń, spełniającym pewne [[Przestrzeń topologiczna#Określenie systemu otoczeń|naturalne warunki]] tworzy tzw. [[przestrzeń topologiczna|przestrzeń topologiczną]].
 
O ekstremach lokalnych można zatem mówić w przypadku dowolnej funkcji, której dziedzina jest przestrzenią topologiczną, a przeciwdziedzina zbiorem częściowo uporządkowanym. Ze względu na zastosowania najczęściej rozważa się szczególny przypadek – funkcje rzeczywiste, czyli funkcje o wartościach w [[liczby rzeczywiste|liczbach rzeczywistych]], których dziedzina jest podzbiorem skończeniewymiarowej [[Przestrzeń euklidesowa|przestrzeni euklidesowej]].
=== Funkcje różniczkowalne ===
W dalszej części sekcji rozważane będą funkcje <math>f\colon [a,b] \to \mathbb R</math> [[funkcja ciągła|ciągłe]] oraz [[funkcja różniczkowalna|różniczkowalne]] w przedziale <math>(a,b).\,</math>
Geometrycznie oznacza to, że ich wykres jest "nieprzerwany"„nieprzerwany” i "gładki"„gładki”, czyli ma w każdym punkcie [[styczna|styczną]].
 
==== Warunek konieczny istnienia ekstremum lokalnego (twierdzenie Fermata) ====
: Pochodna
:: <math>V^\prime(x) = (a-2x)(a-6x)</math>
: zeruje się na tym przedziale w punktach <math>x_0 := \tfrac{a}{6}</math> oraz <math>x_1 := \tfrac{a}{2}</math> (w tym przypadku objętość jest zerowa). Ponieważ funkcja objętości jest dodatnia wewnątrz przedziału, 0 na jego końcach i ma we wnętrzu nie więcej niż jedno ekstremum lokalne, to ma ona dokładnie jedno maksimum, które jest zarazem lokalne i globalne ([[twierdzenie Rolle'aRolle’a]]); osiągane jest ono w <math>x_0</math>. Dlatego największa objętość pudełka wynosi
:: <math>V(x_0) = \frac{2}{27} a^3</math>
 
Ważnymi obiektami matematycznymi są te [[funkcjonał]]y, które danej funkcji przypisują liczbę rzeczywistą, np. długość [[łuk krzywej|łuku]] jej wykresu. Przestrzeń funkcyjna jest przestrzenią unormowaną, opisywaną w jednej z wcześniejszych sekcji, jednak badanie ekstremów tych funkcjonałów jest szczególnie istotne ze względu na zastosowania w fizyce i technice – przykładowo jeśli funkcja będąca argumentem funkcjonału opisuje kształt [[śmigło|śmigła]] samolotu, a wartości funkcjonału opisują wydajność śmigła, to znalezienie globalnego maksimum jest równoważne wyliczeniu jaki kształt śmigła zapewni największą wydajność.
 
Badania funkcjonałów zapoczątkował [[Leonhard Euler|Leonard Euler]]. Klasycznym problemem, prowadzącym do znalezienia ekstremów pewnego funkcjonału jest [[brachistochrona|zagadnienie brachistochrony]], postawione w [[1696]] przez [[Johann Bernoulli|Jana Bernoulliego]] w periodyku ''Acta Eroditorium''. Sprowadza się ono do znalezienia takiej krzywej łączącej dwa punkty <math>A</math> i <math>B,</math> aby ciało staczające się po niej od punktu <math>A</math> do <math>B</math> pokonało tę drogę w najkrótszym czasie<ref>Problem brachistochrony został rozwiązany przez [[Isaac Newton|Newtona]], [[Gottfried Wilhelm Leibniz|Leibniza]], [[Guillaume François Antoine de l'Hospitall’Hospital|de l’Hospitala]] (ucznia Jana Bernoulliego) oraz [[Jakob Bernoulli|Jakuba Bernoulliego]].</ref>.
 
=== Ekstrema mocne i słabe ===
Szukając lokalnych ekstremów funkcjonałów konieczne jest zdefiniowanie przestrzeni topologicznej. Najprościej zrobić to konstruując bazę coraz węższych otoczeń wokół każdego punktu dziedziny. Rozsądnie jest przyjąć, że ciąg funkcji należących do coraz węższych otoczeń powinien zbiegać do funkcji <math>f</math> odpowiadającej otaczanemu punktowi, jednak nie jest oczywiste, czy także pochodne tych funkcji muszą zbiegać do pochodnej <math>f.</math> Jeśli przyjmiemy, że tak, to mówimy o tzw. '''ekstremum mocnym''', jeśli natomiast dopuszczamy dowolne wartości pochodnej, o '''ekstremum słabym'''. Każde ekstremum mocne jest szczególnym przypadkiem słabego, odwrotnie – niekoniecznie.
 
=== Przykład – równania Eulera-Lagrange'aLagrange’a ===
{{osobny artykuł|Równania Eulera-Lagrange'aLagrange’a|Zasada minimum energii potencjalnej}}
Rachunek wariacyjny bada ekstrema funkcjonałów, często zadanych w postaci [[całka Lebesgue'a|całek]]. W [[mechanika klasyczna|mechanice klasycznej]] ważne są równania, pozwalające na znajdowanie torów cząstek <math>q_k,</math> jeśli znana jest funkcja <math>L</math> ([[lagranżjan]]), opisująca ten układ. Równania te zostały wprowadzone w [[1750]] roku przez [[Leonhard Euler|Leonharda Eulera]] oraz [[Joseph Louis Lagrange|Josepha Louisa Lagrange'aLagrange’a]] i zwane są dziś nazwiskami ich odkrywców. Równania Eulera-Lagrange'aLagrange’a mają ścisły związek z metodami rachunku wariacyjnego.
 
Formalnie, o funkcji <math>L</math> zakłada się że jest określona na <math>\mathbb{R}^{2n+1}</math> oraz jest dwukrotnie różniczkowalna w sposób ciągły. Dalej, o funkcji
Ekstremów tego funkcjonału szuka się w klasie funkcji dwukrotnie różniczkowalnych, przyjmujących na końcach przedziału <math>[a,b]</math> wartości
: <math>q_1(a), q_1(b), \ldots, q_n(a), q_n(b)</math>
Jest to problem z tzw. [[Zagadnienie brzegowe|ustalonym brzegiem]]. Okazuje się, że funkcje <math>q_i,</math> dla których funkcjonał <math>F</math> przyjmuje ekstremum, spełniają układ [[Równanie różniczkowe cząstkowe|równań różniczkowych cząstkowych]], zwanych '''równaniami Eulera-Lagrange'aLagrange’a''', postaci:
: <math>\frac{\partial L}{\partial q _{k}} - \frac{d}{dt} \left (\frac{\partial L}{\partial \dot{q} _{k}}\right ) = 0,\;\; 1\leqslant k \leqslant n</math>
gdzie
# <math>X</math> i <math>Y</math> są [[przestrzeń Banacha|przestrzeniami Banacha]],
# <math>G\colon X\to Y</math> jest różniczkowalne w sposób ciągły w pewnym otoczeniu punktu <math>x_0\in X,</math>
# <math>x_0\in X</math> jest [[punkt regularny#Teoria różniczkowania|punktem regularnym]] zbioru <math>M=G^{-1}(\{0\}),</math> tj. <math>G^\prime(x_0)</math> jest [[Funkcja "na"„na”|suriekcją]] <math>X</math> na <math>Y,</math>
# <math>X_1:=(G^\prime(x_0))^{-1}(\{0\}),</math> to znaczy <math>X_1</math> jest [[Jądro (algebra)|jądrem]] <math>G^\prime(x_0),</math>
# <math>X=X_1\oplus X_2</math> (rozkład przestrzeni <math>X</math> na [[topologiczna suma prosta|topologiczną sumę prostą]]).
W praktyce, często wykorzystywanym faktem do badania ekstremów warunkowych jest tzw. [[twierdzenie Lusternika (ekstrema warunkowe)|drugie twierdzenie Lusternika]], mówiące o tym, że jeżeli spełnione są założenia twierdzenia Lusternika i funkcja <math>f,</math> określona jak wyżej, jest różniczkowalna w punkcie <math>x_0\in M</math> i ma w tym punkcie ekstremum warunkowe (związane warunkiem <math>M</math>), to istnieje [[funkcjonał liniowy]] <math>\Lambda\in Y^\star</math> taki, że
: <math>f^\prime(x_0)=\Lambda\circ G^\prime(x_0)</math>
Funkcjonał <math>\Lambda</math> nazywany jest '''funkcjonałem Lagrange'aLagrange’a''' i ma ścisły związek z metodą szukania ekstremów warunkowych, zwaną '''metodą mnożników Lagrange'aLagrange’a''', opisaną dalej.
 
=== Warunki wystarczające istnienia ekstremum warunkowego ===
{{osobny artykuł|mnożniki Lagrange'aLagrange’a}}
W dalszym ciągu, podtrzymując powyższe założenia i zakładając dodatkowo, że funkcje <math>f</math> i <math>G</math> są dwukrotnie różniczkowalne w sposób ciągły w pewnych otoczeniach punktu <math>x_0,</math> można sformułować warunek wystarczający istnienia ekstremum warunkowego. Mianowicie, jeżeli istnieje funkcjonał liniowy <math>\Lambda\in Y^\star</math> taki, że
: <math>f^\prime(x_0)=\Lambda\circ G^\prime(x_0)</math>
gdzie <math>\Lambda\in (\mathbb{R}^m)^\star.</math> Wiadomo, że każdy taki funkcjonał <math>\Lambda</math> jest reprezentowany przez układ <math>m</math> [[liczby rzeczywiste|liczb rzeczywistych]] <math>\lambda_1,\ldots,\lambda_m</math> a pochodna <math>G^\prime(x)</math> jest [[macierz]]ą wymiaru <math>m\times n</math> [[rząd macierzy|rzędu]] <math>m</math><ref name="punktreg"/>. Układ równań operatorowych sprowadza się więc do układu <math>m+n</math> równań skalarnych:
: <math>\left\{\begin{array}{l}\frac{\partial f(x)}{\partial x_j}=\sum_{i=1}^m\lambda_i\frac{\partial G_i(x)}{\partial x_j},\; j=1,\ldots,n\\G_k(x_1,\ldots, x_n)=0,\; k=1,\ldots, m\end{array}\right.</math>
gdzie <math>x=(x_1,\ldots,x_n)</math> o <math>n+m</math> zmiennych <math>\lambda_i, x_k, \; i\leqslant m, k\leqslant n.</math> Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby <math>\lambda_i</math> spełniają tylko rolę pomocniczą i nazywane są często [[Mnożniki Lagrange'aLagrange’a|mnożnikami Lagrange'aLagrange’a]]. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, należy odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną określoność)
: <math>f^{\prime\prime}(x)-\Lambda\circ G^{\prime\prime}(x)</math>
dla
=== Przykład – ekstrema funkcji na okręgu ===
[[Plik:Lagrange very simple.jpg|thumb|300px|Wykresem funkcji <math>f(x,y)=x+y\,</math> jest [[płaszczyzna]]. W przestrzeni trójwymiarowej, równanie <math>x^2+y^2=1\,</math> opisuje [[Walec (bryła)|walec]] (u którego podstawy, na płaszczyźnie <math>xy\,</math> leży okrąg jednostkowy). Szukanie ekstremów warunkowych sprowadza się w tym wypadku do badania punktów ekstremalnych [[Przekrój zbiorów|części wspólnej]] walca i płaszczyzny.]]
Ilustracją zastosowania metody mnożników Lagrange'aLagrange’a jest problem wyznaczenia ekstremów funkcji:
: <math>f(x,y)=x+y\,</math>
na kole jednostkowym, tj. przy warunku
: <math>G(p_1,p_2,\ldots,p_n)=\sum_{k=1}^n p_k-1</math>
 
Stosując metodę mnożników Lagrange'aLagrange’a, dostajemy [[układ równań|układ]] <math>n</math> równań:
 
: <math>\frac{\partial}{\partial p_k}(f(p_1,p_2,\ldots,p_n)+\lambda (G(p_1,p_2,\ldots,p_n)-1))=0,\;\; 1\leqslant k\leqslant n</math>
 
== Zobacz też ==
* [[twierdzenie Rolle'aRolle’a]]
* [[twierdzenie Lagrange'aLagrange’a (rachunek różniczkowy)|twierdzenie Lagrange'aLagrange’a]]
* [[minimum i maksimum (funkcje)]]
 
311 898

edycji