Sieć neuronowa

Sieć neuronowa – system przeznaczony do przetwarzania informacji, którego budowa i zasada działania są w pewnym stopniu wzorowane na funkcjonowaniu fragmentów rzeczywistego (biologicznego) systemu nerwowego. Na przesłankach biologicznych oparte są schematy sztucznych neuronów wchodzących w skład sieci oraz (w pewnym stopniu) jej struktura. Jednak schematy połączeń neuronów w sieci neuronowej są wybierane arbitralnie, a nie stanowią modelu rzeczywistych struktur nerwowych^[1].

Wyróżniającą cechą sieci neuronowej jako narzędzia informatycznego jest możliwość komputerowego rozwiązywania przy jej pomocy praktycznych problemów bez ich uprzedniej matematycznej formalizacji. Dalszą zaletą jest brak konieczności odwoływania się przy stosowaniu sieci do jakichkolwiek teoretycznych założeń na temat rozwiązywanego problemu^[1].

Najbardziej znamienną cechą sieci neuronowej jest jej zdolność uczenia się na podstawie przykładów i możliwość automatycznego uogólniania zdobytej wiedzy (generalizacja)^[1].

Czasem nazwą „sztuczne sieci neuronowe” określa się interdyscyplinarną dziedzinę wiedzy zajmującą się konstrukcją, trenowaniem i badaniem możliwości tego rodzaju sieci.

Sieci neuronowe często określane są jako tzw. czarna skrzynka, z powodu tego że nie jest możliwe zrozumienie jak naprawdę działają, gdy używają dużej ilości parametrów. Były jednak próby opracowania matematycznej teorii jak naprawdę działają sieci neuronowe, z uwzględnieniem modelu GPT^[2].

Typy sieci neuronowych

Cechą wspólną wszystkich sieci neuronowych jest to, że na ich strukturę składają się neurony połączone ze sobą synapsami. Z synapsami związane są wagi, czyli wartości liczbowe, których interpretacja zależy od modelu.

Sieci jednokierunkowe

Sieci jednokierunkowe to sieci neuronowe, w których nie występuje sprzężenie zwrotne, czyli pojedynczy wzorzec lub sygnał przechodzi przez każdy neuron dokładnie raz w swoim cyklu. Najprostszą siecią neuronową jest pojedynczy perceptron progowy, opracowany przez McCullocha i Pittsa w roku 1943.

W bardziej zaawansowanych rozwiązaniach stosuje się funkcje przejścia. Najpopularniejszą klasę funkcji stosowanych w sieciach neuronowych stanowią funkcje sigmoidalne, np. tangens hiperboliczny. Sieć zbudowana z neuronów wyposażonych w nieliniową funkcję przejścia ma zdolność nieliniowej separacji wzorców wejściowych. Jest więc uniwersalnym klasyfikatorem.

Do uczenia perceptronów wielowarstwowych stosuje się algorytmy spadku gradientowego, między innymi algorytm propagacji wstecznej.

Sieci jednokierunkowe dzielą się na jednowarstwowe, dwuwarstwowe i wielowarstwowe. Sieci jednowarstwowe mogą rozwiązać jedynie wąską klasę problemów. Sieci dwu i wielowarstwowe mogą rozwiązać znacznie szerszą klasę i są pod tym względem równoważne, jednak stosuje się do nich inne algorytmy uczenia (dla wielowarstwowych są one prostsze).

Sieci rekurencyjne

Mianem sieci rekurencyjnej określa się sieć, w której połączenia między neuronami stanowią graf z cyklami. Wśród różnorodności modeli rekurencyjnych sztucznych sieci neuronowych wyróżnić można:

sieć Hopfielda – układ gęsto połączonych ze sobą neuronów (każdy z każdym, ale bez połączeń zwrotnych) realizującą dynamikę gwarantującą zbieżność do preferowanych wzorców
maszyna Boltzmanna – opracowana przez Geoffa Hintona i Terry’ego Sejnowskiego stochastyczna modyfikacja sieci Hopfielda; modyfikacja ta pozwoliła na uczenie neuronów ukrytych i likwidację wzorców pasożytniczych kosztem zwiększenia czasu symulacji.

Sieci Hopfielda i maszyny Boltzmanna stosuje się jako pamięci adresowane kontekstowo, do rozpoznawania obrazów, rozpoznawania mowy, a także do rozwiązywania problemów minimalizacji (np. problemu komiwojażera).

Samoorganizujące się mapy

Osobny artykuł: Sieć Kohonena.

Samoorganizujące się mapy (Self Organizing Maps, SOM), zwane też sieciami Kohonena, to sieci neuronów, z którymi są stowarzyszone współrzędne na prostej, płaszczyźnie lub w dowolnej n-wymiarowej przestrzeni.

Uczenie tego rodzaju sieci polega na zmianach współrzędnych neuronów, tak, by dążyły one do wzorca zgodnego ze strukturą analizowanych danych. Sieci zatem „rozpinają się” wokół zbiorów danych, dopasowując do nich swoją strukturę.

Sieci te stosowane są do klasyfikacji wzorców, np. głosek mowy ciągłej, tekstu, muzyki. Do najciekawszych zastosowań należy rozpinanie siatki wokół komputerowego modelu skanowanego obiektu.

Inne

Popularnymi modelami są również maszyny wektorów nośnych (SVM), sieci oparte na radialnych funkcjach bazowych (sieci radialne, RBF) i sieci przesyłające żetony (ang. counter-propagation neural networks). Stosunkowo nowym modelem są sieci oparte na neuronach impulsujących.

Wybrane narzędzia do budowy sieci neuronowych

Matlab

Matlab jest programem komputerowym do wykonania obliczeń naukowych, przeznaczony do numerycznych obliczeń macierzowych. Sieć neuronowa są w zasadzie macierzami, w nich zapisane są przykłady zadań, których sieć ma się nauczyć. Program umożliwia również rysowanie wykresów funkcji dwu i trójwymiarowych, dzięki czemu można wizualizować wyniki obliczeń^[3]. Do tworzenia sieci neuronowej w Matlabie wykorzystuje się funkcję biblioteki Deep Learning Toolbox oraz Fuzzy Logic Toolbox^[4].

Statistica Neural Networks

Wśród narzędzi stosowanych do projektowania i symulacji sieci neuronowych, Statistica Neural Networks jest programem najbardziej rozbudowanym pod kątem dostępnych funkcji. Program cechuje się dużą sprawnością w działaniu oraz dostępnością wielu rzadko spotykanych narzędzi. Jest również łatwy w obsłudze dla mniej doświadczonego użytkownika – posiada m.in. kreator „Automatyczny projektant”, który służy użytkownikowi pomocą na każdym etapie budowy sieci neuronowej. Bardziej doświadczeni użytkownicy znajdą tu duży zestaw typów sieci neuronowych oraz algorytmów uczących te sieci^[4].

Zastosowania

Współcześnie nie ma wątpliwości, że sztuczne sieci neuronowe nie stanowią dobrego modelu mózgu^{[potrzebny przypis]}, choć różne ich postacie wykazują cechy charakterystyczne dla biologicznych układów neuronowych: zdolność do uogólniania wiedzy, uaktualniania kosztem wcześniej poznanych wzorców, dawanie mylnych odpowiedzi po przepełnieniu^{[potrzebny przypis]}. Mimo uproszczonej budowy sztuczne sieci neuronowe stosuje się czasem do modelowania schorzeń mózgu^{[potrzebny przypis]}.

Sztuczne sieci neuronowe znajdują zastosowanie w rozpoznawaniu i klasyfikacji wzorców (przydzielaniu wzorcom kategorii), predykcji szeregów czasowych, analizie danych statystycznych, odszumianiu i kompresji obrazu i dźwięku oraz w zagadnieniach sterowania i automatyzacji.

Magazyn BYTE wymienia między innymi następujące zastosowania tych sieci:

diagnostyka układów elektronicznych
badania psychiatryczne
prognozy giełdowe
prognozowanie sprzedaży
poszukiwania ropy naftowej
interpretacja badań biologicznych
prognozy cen
analiza badań medycznych
planowanie remontów maszyn
planowanie postępów w nauce
analiza problemów produkcyjnych
optymalizacja działalności handlowej
analiza spektralna
optymalizacja utylizacji odpadów
dobór surowców
selekcja celów śledztwa w kryminalistyce
dobór pracowników
sterowanie procesów przemysłowych^[5].

Najpopularniejsze obecnie zastosowanie sieci neuronowych^{[potrzebny przypis]}:

w programach do rozpoznawania pisma (OCR)
na lotniskach do sprawdzania, czy prześwietlony bagaż zawiera niebezpieczne ładunki
do syntezy mowy.

W dziedzinie nauk technicznych sztuczne sieci neuronowe wykorzystuje się m.in. do^[6]:

aproksymacji, prognozowania, przewidywania danych wyjściowych na podstawie danych wejściowych bez konieczności jawnego definiowania związku pomiędzy nimi;
klasyfikacji i rozpoznawania;
kojarzenia danych – sieci neuronowe pozwalają zautomatyzować procesy wnioskowania i pomagają wykrywać istotne powiązania pomiędzy danymi;
analizy danych, czyli poszukiwania związków pomiędzy danymi.

Zobacz też

Przypisy

↑ ^a ^b ^c Ryszard Tadeusiewicz, Maciej Szaleniec: Leksykon sieci neuronowych. s. 94. ISBN 978-83-63270-10-0.
↑ How do neural networks learn? A mathematical formula explains how they detect relevant patterns. phys.org, 2024-03-12. [dostęp 2024-04-11].
↑ PiotrP. Ciskowski PiotrP., Poznawanie własności sieci neuronowych w środowisku MATLAB [online] [dostęp 2023-07-28] (pol.).
↑ ^a ^b KrzysztofK. Różanowski KrzysztofK., SZTUCZNA INTELIGENCJA: ROZWÓJ, SZANSE I ZAGROŻENIA .
↑ Ryszard Tadeusiewicz: Sieci neuronowe. Warszawa: Akademicka Oficyna Wydawnicza RM, 1993, s. 13–14.
↑ Tomasz Cepowski: Badania dotyczące właściwości morskich statku. [w:] Prace Instytutu Nawigacji Morskiej [on-line]. Akademia Morska w Szczecinie. [dostęp 2012-04-17]. [zarchiwizowane z tego adresu (2011-05-24)]. (pol.)., w tym: Application of statistical methods and artificial neural networks for appraximation of ship’s roll in beam.

Linki zewnętrzne

[leksykon-1] Ryszard Tadeusiewicz, Maciej Szaleniec: Leksykon sieci neuronowych. s. 94. ISBN 978-83-63270-10-0.

[2] How do neural networks learn? A mathematical formula explains how they detect relevant patterns. phys.org, 2024-03-12. [dostęp 2024-04-11].

[3] PiotrP. Ciskowski PiotrP., Poznawanie własności sieci neuronowych w środowisku MATLAB [online] [dostęp 2023-07-28] (pol.).

[autonazwa1-4] KrzysztofK. Różanowski KrzysztofK., SZTUCZNA INTELIGENCJA: ROZWÓJ, SZANSE I ZAGROŻENIA .

[5] Ryszard Tadeusiewicz: Sieci neuronowe. Warszawa: Akademicka Oficyna Wydawnicza RM, 1993, s. 13–14.

[prace_AM_w_Szczecinie-6] Tomasz Cepowski: Badania dotyczące właściwości morskich statku. [w:] Prace Instytutu Nawigacji Morskiej [on-line]. Akademia Morska w Szczecinie. [dostęp 2012-04-17]. [zarchiwizowane z tego adresu (2011-05-24)]. (pol.)., w tym: Application of statistical methods and artificial neural networks for appraximation of ship’s roll in beam.

[1]

[2]

[3]

[4]

[5]

[6]