Wersja z 13:43, 27 cze 2018 edytuj 2a01:110f:101b:ea00:6c3b:c0dd:c1bd:6a18 (dyskusja) Dodanie domknięcia Kleene'ego do podrozdziału "Operacje na językach regularnych" Znacznik: VisualEditor ← poprzednia edycja		Wersja z 11:10, 23 lut 2019 edytuj anuluj edycję Beno (dyskusja \| edycje) Redaktorzy, Administratorzy interfejsu, Administratorzy 133 103 edycje m WP:SK+Bn następna edycja →
Linia 7: Regułami gramatyki regularnej są więc na przykład: : <math>A \~~rightarrow~~to B</math> : <math>A \~~rightarrow~~to xB</math> : <math>A \~~rightarrow~~to x</math> : <math>A \~~rightarrow~~to xyz</math> : <math>A \~~rightarrow~~to xyzB</math> : <math>A \~~rightarrow~~to \epsilon</math> Nie są zaś nimi na przykład: : <math>A \~~rightarrow~~to BC</math> (dopuszczalne w [[gramatyka bezkontekstowa\|gramatykach bezkontekstowych]]) : <math>AB \~~rightarrow~~to CDB</math> (dopuszczalne w [[gramatyka kontekstowa\|gramatykach kontekstowych]]) Zależności między językami regularnymi a gramatykami regularnymi są następujące: * Każdy język regularny '''można''' zapisać za pomocą gramatyki regularnej. * Każda gramatyka regularna '''generuje''' pewien język regularny. * Język, który '''nie jest''' regularny '''nie posiada''' gramatyki regularnej. * Gramatyka, która nie jest regularna '''może''' generować język regularny, acz nie musi. Jeśli takowy generuje, ma on też inną gramatykę, która jest regularna. Linia 34: * zbiór wszystkich słów alfabetu <math>\{0,1,2\}</math> w których na przemian występują zera, jedynki i dwójki Zbiór wszystkich języków regularnych oznacza się przez ''<math>REG.</math>~~''.~~ == Operacje na językach regularnych == Linia 48: * konkatenacji ** język słów które można podzielić tak, że początkowa część słowa składa się z naprzemiennie ustawionych zer i jedynek, a końcowa z naprzemiennie ustawionych zer, jedynek i dwójek, jest regularny * [[Domknięcie Kleene’ego\|domknięcia ~~Kleene'ego~~Kleene’ego]] ** np. język składający się tylko z 0 i 1 po zastosowaniu domknięcia ~~Kleene'ego~~Kleene’ego jest językiem wszystkich słów zerojedynkowych. == [[Deterministyczny automat skończony\|Deterministyczne automaty skończone]] (DFA) == Do testowania, czy dane słowo należy do danego języka regularnego można zawsze zbudować '''deterministyczny automat skończony''' – maszynę która ma skończoną liczbę stanów, oraz funkcję przejścia, zmieniającą jej stan po przeczytaniu każdego kolejnego znaku w zależności od przeczytanego znaku oraz stanu aktualnego. Niektóre z tych stanów oznaczone są jako [[stan akceptujący\|akceptujące]] – tzn. że przeczytany dotychczas fragment jest poprawnym słowem języka, dla którego zbudowano automat. każdego kolejnego znaku w zależności od przeczytanego znaku oraz stanu aktualnego. Niektóre z tych stanów oznaczone są jako [[stan akceptujący\|akceptujące]] – tzn. że przeczytany dotychczas fragment jest poprawnym słowem języka, dla którego zbudowano automat. Rodzinę języków rozpoznawalnych przez automaty skończone oznacza się przez ''<math>REC.</math>~~''.~~ === Przykład automatu deterministycznego === Automat służący do sprawdzania czy dane słowo binarne zaczyna się od jedynki mógłby wyglądać tak: * Stany automatu to Start, ZaczynaSięOdJedynki i ZaczynaSięOdZera. * Automat zaczyna w stanie Start. * Jeśli automat jest w stanie Start, to po przeczytaniu 0 przechodzi w stan ZaczynaSięOdZera. * Jeśli automat jest w stanie Start, to po przeczytaniu 1 przechodzi w stan ZaczynaSięOdJedynki. * Jeśli automat jest w dowolnym innym stanie, po przeczytaniu jakiegokolwiek znaku nie zmienia stanu. * Automat akceptuje słowo, jeśli po przeczytaniu całego znajduje się w stanie ZaczynaSięOdJedynki. === Przykład automatu deterministycznego (2) === Automat służący do sprawdzania czy dane słowo binarne kończy się jedynką mógłby wyglądać tak: * Stany automatu to Start, OstatniZnakToJedynka i OstatniZnakToZero. * Automat zaczyna w stanie Start. * Po przeczytaniu 0, niezależnie od poprzedniego stanu, automat przechodzi w stan OstatniZnakToZero. * Po przeczytaniu 1, niezależnie od poprzedniego stanu, automat przechodzi w stan OstatniZnakToJedynka. * Automat akceptuje słowo, jeśli po przeczytaniu całego znajduje się w stanie OstatniZnakToJedynka. === Przykład automatu deterministycznego (3) === Automat służący do sprawdzania czy dane słowo binarne ma <math>n</math> lub <math>m</math> (<math>(n > m)</math>) znaków mógłby wyglądać tak: * Stany to <math>S_0,</math>, <math>S_1,</math>, <math>S_2,</math>, aż do <math>S_n,</math>, i stan ZaDługie. * Stan początkowy to <math>S_0.</math> * Jeśli automat jest w stanie <math>S_k</math> (<math>(k \~~not=~~neq n),</math>), to po przeczytaniu dowolnego znaku przechodzi w stan <math>S_{k+1}.</math> * Jeśli automat jest w stanie <math>S_n,</math>, to po przeczytaniu dowolnego znaku przechodzi w stan ZaDługie. * Jeśli automat jest w stanie ZaDługie, po przeczytaniu dowolnego znaku pozostaje w stanie ZaDługie. * Akceptujące są stany <math>S_n</math> i <math>S_m.</math> === Twierdzenie Kleene’ego === Twierdzenie Kleene’ego dokładnie określa relacje pomiędzy rodzinami języków ''<math>REC</math>'' (rozpoznawalnych) i ''<math>REG</math>'' (regularnych). Mianowicie, dla dowolnego alfabetu (skończonego) zachodzi ''<math>REC = REG.</math>~~''.~~ Dowód tego twierdzenia przeprowadza się na zasadzie obustronnej inkluzji (ale jest on długi i zostaje pominięty). Główną konsekwencją tego dowodu jest, wspomniana już wcześniej, bezpośrednia zależność języków regularnych i automatów skończonych. Zatem dla każdego języka regularnego można stworzyć automat skończony i, analogicznie, każdy automat skończony rozpoznaje język regularny. Linia 97 ⟶ 96: === Przykład === Weźmy NFA rozpoznające język słów nad alfabetem binarnym, których czwartym od końca znakiem jest 1: * <math>S \~~rightarrow~~to^0 S</math> * <math>S \~~rightarrow~~to^1 S</math> * <math>S \~~rightarrow~~to^1 X_1</math> – jedynym niedeterministycznym przejściem jest przejście ze stanu <math>S</math> po przeczytaniu jedynki, albo w <math>S,</math>, albo w <math>X_1</math> * <math>X_1 \~~rightarrow~~to^0 X_2</math> * <math>X_1 \~~rightarrow~~to^1 X_2</math> * <math>X_2 \~~rightarrow~~to^0 X_3</math> * <math>X_2 \~~rightarrow~~to^1 X_3</math> * <math>X_3 \~~rightarrow~~to^0 X_4</math> * <math>X_3 \~~rightarrow~~to^1 X_4</math> * <math>X_4 \~~rightarrow~~to^0 S</math> * <math>X_4 \~~rightarrow~~to^1 S</math> * Stan startowy to <math>S,</math>, stanem akceptującym jest <math>X_4.</math> Możemy uruchomić ten automat na słowie <math>0101000{:}</math>: : <math>S \~~rightarrow~~to^0 S \~~rightarrow~~to^1 S \~~rightarrow~~to^0 S \~~rightarrow~~to^1 X_1 \~~rightarrow~~to^0 X_2 \~~rightarrow~~to^0 X_3 \~~rightarrow~~to^0 X_4.</math> Choć możemy też uruchomić go tak, żeby nie zaakceptował słowa: : <math>S \~~rightarrow~~to^0 S \~~rightarrow~~to^1 X_1 \~~rightarrow~~to^0 X_2 \~~rightarrow~~to^1 X_3 \~~rightarrow~~to^0 X_4 \~~rightarrow~~to^0 S \~~rightarrow~~to^0 S,</math> : <math>S \~~rightarrow~~to^0 S \~~rightarrow~~to^1 S \~~rightarrow~~to^0 S \~~rightarrow~~to^1 S \~~rightarrow~~to^0 S \~~rightarrow~~to^0 S \~~rightarrow~~to^0 S.</math> === Konwersja NFA do DFA === Linia 122 ⟶ 121: Nie musimy jednak pamiętać wszystkich ścieżek. Nieważne, co znajdowało się na początku ścieżki – nam wystarcza wiedza, '''jakie stany''' występują na dowolnej ze ścieżek po <math>k</math> krokach. Na początku bierzemy więc zbiór złożony jedynie ze stanu startowego emulowanego NFA, po każdym kroku zaś zbiór takich stanów <math>X,</math>, że w poprzednim zbiorze był jakiś stan <math>Y,</math>, i możliwe jest dla aktualnie czytanego znaku przejście z <math>Y</math> w <math>X.</math>. Czyli w interpretacji ścieżkowej – takich stanów <math>X,</math>, że na którejś ze ścieżek krok wcześniej był stan <math>Y,</math>, i że jest możliwe przedłużenie tej ścieżki w tym kroku do <math>X.</math>. Słowo jest akceptowane jeśli wśród zbioru stanów po przeczytaniu całego znajduje się choć jeden stan akceptujący. Przyjmując zbiory stanów NFA za stany DFA, każde NFA możemy emulować w pełni deterministycznie na DFA. Być może jednak liczba stanów będzie musiała wzrosnąć wykładniczo. ~~Być może jednak liczba stanów będzie musiała wzrosnąć wykładniczo.~~ === Przykład konwersji === Weźmy podany wyżej automat rozpoznający słowa, których czwartym od końca znakiem jest jedynka. Następuje wykładnicza eksplozja liczby stanów: : <math>\{S~~,X_1,X_2,X_3,X_4~~\} \~~rightarrow~~to^10 \{S~~,X_1,X_2,X_3,X_4~~\}</math>▼ ~~Następuje wykładnicza eksplozja liczby stanów:~~ : <math>\{S\} \~~rightarrow~~to^01 \{S,X_1\}</math> : <math>\{S,X_1\} \~~rightarrow~~to^10 \{S,~~X_1~~X_2\}</math> : <math>\{S,X_1\} \~~rightarrow~~to^01 \{S,X_1,X_2\}</math> : <math>\{S,~~X_1~~X_2\} \~~rightarrow~~to^10 \{S,~~X_1,X_2~~X_3\}</math> : <math>\{S,X_2\} \~~rightarrow~~to^01 \{S,X_1,X_3\}</math> : <math>\{S,X_1,X_2\} \~~rightarrow~~to^10 \{S,~~X_1~~X_2,X_3\}</math> : <math>\{S,X_1,X_2\} \~~rightarrow~~to^01 \{S,X_1,X_2,X_3\}</math> : <math>\{S,~~X_1,X_2~~X_3\} \~~rightarrow~~to^10 \{S,~~X_1,X_2,X_3~~X_4\}</math> : <math>\{S,X_3\} \~~rightarrow~~to^01 \{S,X_1,X_4\}</math> : <math>\{S,X_1,X_3\} \~~rightarrow~~to^10 \{S,~~X_1~~X_2,X_4\}</math> : <math>\{S,X_1,X_3\} \~~rightarrow~~to^01 \{S,X_1,X_2,X_4\}</math> : <math>\{S,~~X_1~~X_2,X_3\} \~~rightarrow~~to^10 \{S,~~X_1,X_2~~X_3,X_4\}</math> : <math>\{S,X_2,X_3\} \~~rightarrow~~to^01 \{S,X_1,X_3,X_4\}</math> : <math>\{S,X_1,X_2,X_3\} \~~rightarrow~~to^10 \{S,~~X_1~~X_2,X_3,X_4\}</math> : <math>\{S,X_1,X_2,X_3\} \~~rightarrow~~to^01 \{S,X_1,X_2,X_3,X_4\}</math> : <math>\{S,~~X_1,X_2,X_3~~X_4\} \~~rightarrow~~to^10 \{S~~,X_1,X_2,X_3,X_4~~\}</math> : <math>\{S,X_4\} \~~rightarrow~~to^01 \{S,X_1\}</math> : <math>\{S,X_1,X_4\} \~~rightarrow~~to^10 \{S,~~X_1~~X_2\}</math> : <math>\{S,X_1,X_4\} \~~rightarrow~~to^01 \{S,X_1,X_2\}</math> : <math>\{S,~~X_1~~X_2,X_4\} \~~rightarrow~~to^10 \{S,~~X_1,X_2~~X_3\}</math> : <math>\{S,X_2,X_4\} \~~rightarrow~~to^01 \{S,X_1,X_3\}</math> : <math>\{S,X_1,X_2,X_4\} \~~rightarrow~~to^10 \{S,~~X_1~~X_2,X_3\}</math> : <math>\{S,X_1,X_2,X_4\} \~~rightarrow~~to^01 \{S,X_1,X_2,X_3\}</math> : <math>\{S,~~X_1,X_2~~X_3,X_4\} \~~rightarrow~~to^10 \{S,~~X_1,X_2,X_3~~X_4\}</math> : <math>\{S,X_3,X_4\} \~~rightarrow~~to^01 \{S,X_1,X_4\}</math> : <math>\{S,X_1,X_3,X_4\} \~~rightarrow~~to^10 \{S,~~X_1~~X_2,X_4\}</math> : <math>\{S,X_1,X_3,X_4\} \~~rightarrow~~to^01 \{S,X_1,X_2,X_4\}</math> : <math>\{S,~~X_1~~X_2,X_3,X_4\} \~~rightarrow~~to^10 \{S,~~X_1,X_2~~X_3,X_4\}</math> : <math>\{S,X_2,X_3,X_4\} \~~rightarrow~~to^01 \{S,X_1,X_3,X_4\}</math> : <math>\{S,X_1,X_2,X_3,X_4\} \~~rightarrow~~to^10 \{S,~~X_1~~X_2,X_3,X_4\}</math> : <math>\{S,X_1,X_2,X_3,X_4\} \~~rightarrow~~to^01 \{S,X_1,X_2,X_3,X_4\}</math> ▲: <math>\{S,X_1,X_2,X_3,X_4\} \rightarrow^1 \{S,X_1,X_2,X_3,X_4\}</math> Przy czym akceptujące są stany zawierające <math>X_4,</math>, stan startowy to zaś <math>\{S\}.</math> Jedynym co choć trochę ogranicza liczbę stanów jest to, że stan <math>S</math> jest zawsze osiągalny, więc nie musimy uwzględniać zbiorów stanów nie zawierających <math>S.</math> ~~Jedynym co choć trochę ogranicza liczbę stanów jest to, że stan <math>S</math> jest zawsze osiągalny, więc~~ ~~nie musimy uwględniać zbiorów stanów nie zawierających <math>S</math>.~~ Sprawdźmy tym automatem słowo <math>0101000{:}</math>: : <math>\{S\} \~~rightarrow~~to^0 \{S\} \~~rightarrow~~to^1 \{S,X_1\} \~~rightarrow~~to^0 \{S,X_2\} \~~rightarrow~~to^1 \{S,X_1,X_3\} \~~rightarrow~~to^0 \{S,X_2,X_4\} \~~rightarrow~~to^0 \{S,X_3\} \~~rightarrow~~to^0 \{S,X_4\}.</math> == Wyrażenia regularne == Jeszcze jedną metodą wyrażania języków regularnych są [[Wyrażenie regularne\|wyrażenia regularne]]. Wyrażenie takie <math>X</math> tworzy się używając: * <math>\epsilon</math> – oznaczającego język złożony ze słowa pustego, ~~Wyrażenie takie <math>X</math> tworzy się używając:~~ * symboli nieterminali <math>~~\epsilon~~x</math> – ~~oznaczającego~~oznaczających język złożony zez ~~słowa~~pojedynczego ~~pustego~~nieterminala <math>x,</math> * ~~symboli nieterminali~~konkatenacji <math>xX_1 X_2</math> – ~~oznaczających~~oznacza to język złożony zze słów, które można podzielić tak, że pierwsza część należy do <math>X_1,</math> druga ~~pojedynczego~~zaś ~~nieterminala~~do <math>xX_2,</math> * ~~konkatenacji~~alternatywy <math>X_1 \| X_2</math> – oznacza to język złożony zez wszystkich słów~~, które można podzielić tak, że pierwsza część należy do~~ <math>X_1</math>, ~~druga~~oraz ~~zaś~~wszystkich dosłów <math>X_2,</math>. * ~~alternatywy~~gwiazdki <math>~~X_1 \| X_2~~X^</math> – oznacza to język złożony ~~z wszystkich~~ze słów, ~~<math>X_1</math>~~które ~~oraz~~można ~~wszystkich~~podzielić ~~słów~~na 0 lub więcej fragmentów, z których każdy należy do <math>~~X_2~~X.</math> gwiazdki <math>X^</math> – oznacza to język złożony ze słów, które można podzielić na 0 lub więcej fragmentów, z których każdy należy do <math>X</math> Każde wyrażenie regularne generuje język regularny i każdy język regularny można zapisać za pomocą wyrażenia regularnego. Wiele innych wygodnych symboli można łatwo zdefiniować używając powyższych: plus (jedno lub więcej wystąpień) – <math>X^+ = X X^,</math> znak zapytania (wystąpienie opcjonalne) – <math>X? = X \| \epsilon,</math> * n-krotne wystąpienie – <math>X^{n} = X X^{n-1} = \cdots</math> * od n do m wystąpień – <math>X^{n, m} = X^n X^{0, m-n} = X^n X? X^{0, m-n-1} = \cdots</math> Linia 193 ⟶ 187: '''''Uwaga''': używane w praktyce tzw. [[Wyrażenie regularne\|wyrażenia regularne]] w rzeczywistości posiadają zwykle dodatkowe możliwości, i generują więcej języków niż tylko języki regularne.'' == [[Twierdzenie Myhilla-~~Nerode'a~~Nerode’a]] == [[Twierdzenie Myhilla-~~Nerode'a~~Nerode’a]] podaje dostateczny i konieczny warunek na to, by język był regularny. === Przykład === Weźmy język słów o parzystej ilości jedynek i nieparzystej ilości zer. Język ten jest regularny, i prefiksy można pogrupować w 4 klasy: * prefiksy o parzystej ilości jedynek i zer – prawidłowe sufiksy mają parzyście wiele jedynek i nieparzyście wiele zer, * prefiksy o parzystej ilości jedynek i nieparzystej zer – prawidłowe sufiksy mają parzyście wiele jedynek i zer, * prefiksy o nieparzystej ilości jedynek i parzystej zer – prawidłowe sufiksy mają nieparzyście wiele jedynek i zer, * prefiksy o nieparzystej ilości jedynek i zer – prawidłowe sufiksy mają parzyście wiele zer i nieparzyście wiele jedynek. === Przykład (2) === Weźmy język <math>\{a^nb^n : n\in N\},</math>, czyli wszystkich słów składających się z <math>n</math> znaków <math>a,</math>, po których występuje <math>n</math> znaków <math>b,</math>, dla dowolnego <math>n.</math>. Weźmy ciąg <math>p_k</math> prefiksów postaci <math>a^k,</math>, dla kolejnych <math>k.</math>. <math>b^j</math> należy do zbioru <math>S_k</math> poprawnych sufiksów dla prefiksu <math>p_k</math> wtedy i tylko wtedy, gdy <math>a^kb^j</math> należy do tego języka, a więc gdy <math>k=j.</math> Czyli zbiory poprawnych sufiksów dla każdych dwóch prefiksów z naszego nieskończonego ciągu są różne, co przez twierdzenie o indeksie dowodzi, że język ten nie jest regularny. do zbioru <math>S_k</math> poprawnych sufiksów dla prefiksu <math>p_k</math> wtedy i tylko wtedy, gdy <math>a^kb^j</math> należy do tego języka, a więc gdy <math>k=j</math>. Czyli zbiory poprawnych sufiksów dla każdych dwóch prefiksów z naszego nieskończonego ciągu są różne, co przez twierdzenie o indeksie dowodzi, że język ten nie jest regularny. == [[Lemat o pompowaniu dla języków regularnych\|Lemat o pompowaniu]] == Załóżmy, że dany język jest regularny. Wtedy istnieje taka stała <math>n,</math>, że dla każdego słowa <math>w</math> należącego do tego języka i dłuższego niż <math>n,</math> możemy to słowo podzielić na trzy części <math>xyz,</math> z czego <math>n > \|xy\|</math> i <math>\|y\| > 0,</math> i dla każdego <math>k</math> całkowitego nieujemnego, <math>xy^kz</math> należy do języka. ~~słowa <math>w</math> należącego do tego języka i dłuższego niż <math>n</math>,~~ ~~możemy to słowo podzielić na trzy części <math>xyz</math>, z czego <math>n > \|xy\|</math> i <math>\|y\| > 0</math>,~~ ~~i dla każdego <math>k</math> całkowitego nieujemnego, <math>xy^kz</math> należy do języka.~~ === Przykład === Weźmy język <math>L=\{a^mb^m : m\in N\},</math>, czyli wszystkich słów składających się z <math>m</math> znaków <math>a,</math>, po których występuje <math>m</math> znaków <math>b,</math>, dla dowolnego <math>m</math> naturalnego. Weźmy słowo <math>a^mb^m\in L,</math>, gdzie <math>m</math> jest większe od stałej <math>n</math> z lematu o pompowaniu. Wobec warunku <math>\|xy\|<n</math> z lematu, <math>y</math> leży w całości w części <math>a^m.</math> Wtedy <math>xy^2z</math> ma więcej znaków <math>a</math> niż <math>b,</math> gdyż <math>\|y\|>0.</math> Zatem słowo <math>xy^2z</math> nie należy do <math>L,</math> wbrew tezie lematu o pompowaniu. Wobec warunku <math>\|xy\|<n</math> z lematu, <math>y</math> leży w całości w części <math>a^m</math>. Wtedy <math>xy^2z</math> ma więcej znaków <math>a</math> niż <math>b</math>, gdyż <math>\|y\|>0</math>. Zatem słowo <math>xy^2z</math> nie należy do <math>L</math>, wbrew tezie lematu o pompowaniu. Ponieważ <math>L</math> nie spełnia lematu o pompowaniu, to nie jest regularny.

Język regularny: Różnice pomiędzy wersjami