Funkcja sigmoidalna

Funkcja sigmoidalna – dowolna funkcja matematyczna, której wykres ma charakterystyczny kształt litery S.

Krzywa logistyczna
Wykres funkcji błędu

Typowym przykładem funkcji sigmoidalnej jest funkcja logistyczna pokazana na pierwszym rysunku i opisana wzorem:

Inne przykłady funkcji sigmoidalnych przytoczono poniżej. W niektórych dziedzinach, zwłaszcza w kontekście sztucznych sieci neuronowych, termin „funkcja sigmoidalna” jest używany jako synonim funkcji logistycznej.

Dziedziną funkcji sigmoidalnej jest zbiór wszystkich liczb rzeczywistych. Wartości funkcji zwykle monotonicznie rośną (ale mogą również maleć). Typowym zbiorem wartości funkcji sigmoidalnych jest przedział od 0 do 1 lub od -1 do 1.

Wiele funkcji sigmoidalnych może pełnić rolę funkcji aktywacji sztucznych neuronów w sieciach neuronowych, są to na przykład funkcja logistyczna i tangens hiperboliczny. Krzywe sigmoidalne są również powszechne w statystyce jako dystrybuanty rozkładów prawdopodobieństwa (przyjmujące wartości z przedziału od 0 do 1); przykładem może być całka funkcji gęstości rozkładu logistycznego, rozkładu normalnego czy rozkładu t -Studenta.

Definicja

edytuj

Funkcja sigmoidalna jest ograniczoną, różniczkowalną funkcją rzeczywistą, która jest zdefiniowana dla wszystkich rzeczywistych argumentów, ma nieujemną pochodną w każdym punkcie[1][2] oraz pojedynczy punkt przegięcia.

Własności

edytuj

Ogólnie rzecz biorąc, funkcja sigmoidalna jest monotoniczna i jej pierwsza pochodna ma kształt krzywej dzwonowej. I odwrotnie: całka dowolnej ciągłej, nieujemnej funkcji z wykresem w kształcie dzwonu (z jednym lokalnym maksimum i bez lokalnych minimów) będzie sigmoidalna. Zatem dystrybuanty wielu powszechnie wykorzystywanych rozkładów prawdopodobieństwa są sigmoidalne. Sigmoidalna jest funkcja błędu, która jest powiązana z dystrybuantą rozkładu normalnego i funkcja arcus tangens powiązana z dystrybuantą rozkładu Cauchy’ego .

Funkcja sigmoidalna jest ograniczona parą asymptot poziomych dla   .

Rosnąca funkcja sigmoidalna jest wypukła dla wartości poniżej punktu przegięcia i wklęsła dla wartości powyżej tego punktu. W wielu przykładach punktem przegięcia jest 0.

Przykłady

edytuj
 
Porównanie niektórych funkcji sigmoidalnych. Na rysunku wszystkie funkcje są znormalizowane w taki sposób, że ich nachylenie w początku układu współrzędnych wynosi 1.
  • funkcja logistyczna: 
  • tangens hiperboliczny (przesunięta i przeskalowana wersja funkcji logistycznej):  
  • funkcja arcus tangens: 
  • funkcja Gudermanna: 
  • funkcja błędu: 
  • uogólniona funkcja logistyczna: 
  • funkcja smoothstep: 
  • niektóre funkcje algebraiczne, np.: i w bardziej ogólnej formie[3]: 
  • funkcja płynnego przejścia[4] znormalizowana do (-1,1): ,

gdzie   jest parametrem sterującym nachyleniem wykresu w pobliżu   (  musi być większe lub równe  , ponieważ każda mniejsza wartość prowadzi do krzywej z więcej niż jednym punktem przegięcia, a zatem krzywej nie będącej prawdziwą sigmoidą). Funkcja ta jest nietypowa, ponieważ osiąga wartości graniczne -1 i 1: jej wartość wynosi -1 dla wszystkich   i 1 dla wszystkich   . Niemniej jednak jest ona gładka (nieskończenie różniczkowalna,  ) wszędzie, w tym w   .

Z dokładnością do przesunięcia i skalowania wiele funkcji sigmoidalnych to szczególne przypadki funkcji:  gdzie   jest odwrotnością ujemnego przekształcenia Boxa-Coxa, zaś   i   są parametrami kształtu[5][6].

Zastosowanie

edytuj
 
Odwrócona logistyczna krzywa S do modelowania zależności między plonem pszenicy a zasoleniem gleby

Krzywe sigmoidalne wykorzystuje się w charakterze funkcji aktywacji w sztucznych sieciach neuronowych.

Wiele naturalnych procesów, takich jak krzywe uczenia się w złożonych systemach, wykazuje na początku niewielki wzrost, który z czasem przyspiesza i osiąga punkt kulminacyjny. Gdy brakuje konkretnego modelu matematycznego opisującego proces, często stosuje się funkcję sigmoidalną[7].

Model van Genuchtena-Gupty opiera się na odwróconej krzywej S i stosuje się go do opisu zależności plonów od zasolenia gleby. Przykłady zastosowania logistycznej krzywej S do reakcji plonów roślin uprawnych (pszenicy) zarówno na zasolenie gleby, jak i głębokość zwierciadła wody w glebie pokazano w modelowaniu reakcji upraw w rolnictwie[8][9].

W przetwarzaniu sygnałów dźwiękowych funkcje sigmoidalne służą jako funkcje przejścia modułu kształtowania fali w celu emulacji dźwięku przesterowania obwodów analogowych[10].

W biochemii i farmakologii równania Hilla i Hilla–Langmuira są funkcjami sigmoidalnymi[11].

W grafice komputerowej i renderowaniu w czasie rzeczywistym niektóre funkcje sigmoidalne służą do płynnego łączenia kolorów lub obiektów geometrycznych pomiędzy dwiema wartościami, bez widocznych nieciągłości.

Krzywe miareczkowania pomiędzy mocnymi kwasami i mocnymi zasadami mają kształt sigmoidalny ze względu na logarytmiczny charakter skali pH.

Zobacz też

edytuj

Przypisy

edytuj
  1. Jun Han, Claudio Moraga, The influence of the sigmoid function parameters on the speed of backpropagation learning, José Mira, Francisco Sandoval (red.), t. 930, Berlin, Heidelberg: Springer Berlin Heidelberg, 1995, s. 195–201, DOI10.1007/3-540-59497-3_175, ISBN 978-3-540-59497-0 [dostęp 2024-06-18].
  2. Yibei Ling, Bin He, Entropic analysis of biological growth models, „IEEE Transactions on Biomedical Engineering”, 40 (12), 1993, s. 1193–1200, DOI10.1109/10.250574 [dostęp 2024-06-18].
  3. Andrew J. Dunning i inni, Some extensions in continuous models for immunological correlates of protection, „BMC Medical Research Methodology”, 15 (1), 2015, DOI10.1186/s12874-015-0096-9, ISSN 1471-2288, PMID26707389, PMCIDPMC4692073 [dostęp 2024-06-18] (ang.).
  4. EpsilonDelta: Smooth Transition Function in One Dimension | Smooth Transition Function Series Part 1. 16 August 2022.
  5. Oscar Garcia, ogarciav/grex [online], 23 sierpnia 2023 [dostęp 2024-06-18].
  6. Biman Chakraborty i inni, A Novel Unification Method to Characterize a Broad Class of Growth Curve Models Using Relative Growth Rate, „Bulletin of Mathematical Biology”, 81 (7), 2019, s. 2529–2552, DOI10.1007/s11538-019-00617-w, ISSN 0092-8240 [dostęp 2024-06-18] (ang.).
  7. D.J.C. Mackay, M.N. Gibbs, Variational Gaussian process classifiers, „IEEE Transactions on Neural Networks”, 11 (6), 2000, s. 1458–1464, DOI10.1109/72.883477 [dostęp 2024-06-18].
  8. Crop response to shallow watertable depths [online], www.waterlog.info [dostęp 2024-06-18].
  9. Crop tolerance for soil salinity in farmers' fields [online], www.waterlog.info [dostęp 2024-06-18].
  10. Julius O. Smith, Physical audio signal processing: for virtuell musical instruments and audio effects, Stanford, Calif: Stanford University, CCRMA, 2010, ISBN 978-0-9745607-2-4 [dostęp 2024-06-18].
  11. PROCEEDINGS OF THE PHYSIOLOGICAL SOCIETY: January 22, 1910, „The Journal of Physiology”, 40 (suppl), 1910, DOI10.1113/jphysiol.1910.sp001386, ISSN 0022-3751 [dostęp 2024-06-18] (ang.).