Wyróżnik wielomianu: Różnice pomiędzy wersjami

[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
m MalarzBOT: WPCHECK#2: poprawiam znaczniki <br>
m drobne techniczne
Linia 12:
i <math>{}\ \ \ D(p) = 0,\quad</math> gdy <math>p'= 0,</math>
 
gdzie <math>R(p,p')</math> to [[rugownik]] wielomianu <math>p</math> i jego pochodnej <math>p',</math> zaś <math>k</math> jest stopniem pochodnej <math>p'.</math><br />
 
Jeżeli <math>p' = 0,</math> to wielomian <math>p</math> ma pierwiastki wielokrotne<ref group="uwaga">Jeżeli spełniony jest warunek <math>p'=0,</math> to <math>p</math> ma rzeczywiście pierwiastki wielokrotne, co wynika z następującego twierdzenia.<br />
Jeżeli <math>Kp' = 0,</math> jestto ciałem,wielomian <math>p \in K[x],\ p \neq 0</math> ima pierwiastki wielokrotne<math>\alpha</mathref group="uwaga">Jeżeli spełniony jest pierwiastkiem wielomianuwarunek <math>p'=0,</math> (w jego ciele rozkładu), to <math>\alphap</math> jestma pierwiastkiemrzeczywiście wielokrotnympierwiastki wtedy i tylko wtedywielokrotne, gdyco jestwynika pierwiastkiemz pochodnejnastępującego <math>p'twierdzenia.</math><br />
 
Dowód: Niech <math>k \geqslant 2</math> będzie krotnością pierwiastka <math>\alpha.</math> Wtedy <math>p = (x - \alpha)^2 h</math> dla pewnego wielomianu <math>h.</math> Obliczmy pochodną <math>p' = 2(x - \alpha)h + (x - \alpha)^2 h'.</math> Stąd <math>p'(\alpha) = 0.</math><br />
Jeżeli <math>K</math> jest ciałem, <math>p \in K[x],\ p \neq 0</math> i <math>\alpha</math> jest pierwiastkiem wielomianu <math>p</math> (w jego ciele rozkładu), to <math>\alpha</math> jest pierwiastkiem wielokrotnym wtedy i tylko wtedy, gdy jest pierwiastkiem pochodnej <math>p'.</math>
Na odwrót, ponieważ <math>p(\alpha) = 0,</math> to <math>p = (x - \alpha)h</math> dla pewnego wielomianu <math>h.</math> Pochodną jest <math>p' = h + (x - \alpha) h'.</math> Tym razem <math>p'(\alpha) = 0</math> z założenia, więc <math>h(\alpha) = 0,</math> skąd <math>h = (x - \alpha) h_1</math> dla pewnego wielomianu <math>h_1.</math> Wstawiając to do wyrażenia na <math>p,</math> dostajemy <math>p = (x - \alpha)^2 h_1.</math> Ale <math>p \neq 0,</math> więc <math>h_1 \neq 0,</math> skąd wynika, że <math>\deg(p) \geqslant 2</math> i pierwiastek <math>\alpha</math> ma w wielomianie <math>p</math> krotność <math>k \geqslant 2,</math> więc jest wielokrotny.<br />
 
Z tego twierdzenia wynika, że gdy wielomian dodatniego stopnia ma zerową pochodną, to każdy jego pierwiastek jest wielokrotny, bo jest pierwiastkiem wielomianu zerowego (nawet każdy element każdego rozszerzenia ciała <math>K</math> jest pierwiastkiem wielomianu zerowego, z definicji pierwiastka, lecz nie ma on żadnej krotności w wielomianie zerowym).</ref>, i stąd postać drugiej części definicji.<br />
JeżeliDowód: stopieńNiech <math>n</math>k wielomianu\geqslant <math>p2</math> nie jestbędzie wielokrotnościąkrotnością charakterystykipierwiastka <math>\chi(K)alpha.</math> ciała (na przykład gdyWtedy <math>\chi(K)p =0</math>), to(x <math>k- =\alpha)^2 n-1,h</math> adla wyrażeniepewnego wielomianu <math>a_n^{n-k-2}R(p,p')h.</math> przyjmujeObliczmy postaćpochodną <math>a_n^{-1}R(p,p'),</math> a= jeżeli2(x jest- wielokrotnością\alpha)h i+ <math>p'(x - \neqalpha)^2 0,h'.</math> toStąd <math>kp'(\alpha) <= n-10.</math><br />
 
Na odwrót, ponieważ <math>p(\alpha) = 0,</math> to <math>p = (x - \alpha)h</math> dla pewnego wielomianu <math>h.</math> Pochodną jest <math>p' = h + (x - \alpha) h'.</math> Tym razem <math>p'(\alpha) = 0</math> z założenia, więc <math>h(\alpha) = 0,</math> skąd <math>h = (x - \alpha) h_1</math> dla pewnego wielomianu <math>h_1.</math> Wstawiając to do wyrażenia na <math>p,</math> dostajemy <math>p = (x - \alpha)^2 h_1.</math> Ale <math>p \neq 0,</math> więc <math>h_1 \neq 0,</math> skąd wynika, że <math>\deg(p) \geqslant 2</math> i pierwiastek <math>\alpha</math> ma w wielomianie <math>p</math> krotność <math>k \geqslant 2,</math> więc jest wielokrotny.
 
Z tego twierdzenia wynika, że gdy wielomian dodatniego stopnia ma zerową pochodną, to każdy jego pierwiastek jest wielokrotny, bo jest pierwiastkiem wielomianu zerowego (nawet każdy element każdego rozszerzenia ciała <math>K</math> jest pierwiastkiem wielomianu zerowego, z definicji pierwiastka, lecz nie ma on żadnej krotności w wielomianie zerowym).</ref>, i stąd postać drugiej części definicji.
 
Jeżeli stopień <math>n</math> wielomianu <math>p</math> nie jest wielokrotnością charakterystyki <math>\chi(K)</math> ciała (na przykład gdy <math>\chi(K)=0</math>), to <math>k = n-1,</math> a wyrażenie <math>a_n^{n-k-2}R(p,p')</math> przyjmuje postać <math>a_n^{-1}R(p,p'),</math> a jeżeli jest wielokrotnością i <math>p' \neq 0,</math> to <math>k < n-1.</math>
 
W pierwszym przypadku rugownik <math>R(p,p')</math> jest [[wyznacznik]]iem następującej macierzy Sylvestera stopnia <math>2n-1{:}</math>
: <math>\left[\begin{matrix}
Linia 35 ⟶ 42:
Oznaczmy powyższą macierz przez <math>M_n.</math> Ma ona zawsze stopień <math>2n-1</math> (niezależnie od tego czy <math>k < n-1</math>) i zachodzi związek <math>\det M_n = a_n^{n-k-1} R(p,p'),</math> więc ogólny wzór definiujący wyróżnik może być zapisany w zgrabnej postaci, obejmującej przypadek zerowej pochodnej
: <math>D(p)=(-1)^\frac{n(n-1)}{2}\frac{1}{a_n} \det M_n.</math>
 
Ponieważ (przy ustalonym n) do tego wzoru wchodzą jedynie współczynniki wielomianu, to naturalne jest zdefiniowanie bardziej bezpośrednich funkcji{{odn|Vinberg|2003| s = 124}} <math>\Delta_n\colon K^{n+1}\to K</math> określonych tym samym wzorem co wyróżnik.
: <math>\Delta_n(a_n, \dots ,a_0) = (-1)^\frac{n(n-1)}{2} \frac{1}{a_n} \det M_n \quad</math> dla <math>n\geqslant 1.</math>
 
W macierzy <math>M_n</math> najwyższy współczynnik <math>a_n</math> jest mnożnikiem pierwszej kolumny, więc można go wyciągnąć
przed wyznacznik i uprościć z mianownikiem, skąd wynika, że funkcja <math>\Delta_n</math> jest wielomianem <math>n+1</math> zmiennych.
Linia 43 ⟶ 52:
: <math>D|P_n = \Delta_n \circ \lambda_n,</math>
 
funkcję <math>\Delta_n</math> również nazywa się wyróżnikiem (wielomianu stopnia n).<br />
 
Możliwość wyrażenia wyróżnika przez wyznacznik macierzy o zawsze tej samej postaci, jak w ostatnim wzorze na <math>\Delta_n(a_n, \dots ,a_0),</math> oznacza, że ten wielomian ma charakter uniwersalny. Stosuje się w każdym przypadku niezależnie od ciała, charakterystyki ciała, czy stopnia pochodnej <math>p',</math> choć w pewnych przypadkach ogólne wyrażenie może się upraszczać.<br />
Możliwość wyrażenia wyróżnika przez wyznacznik macierzy o zawsze tej samej postaci, jak w ostatnim wzorze na <math>\Delta_n(a_n, \dots ,a_0),</math> oznacza, że ten wielomian ma charakter uniwersalny. Stosuje się w każdym przypadku niezależnie od ciała, charakterystyki ciała, czy stopnia pochodnej <math>p',</math> choć w pewnych przypadkach ogólne wyrażenie może się upraszczać.
 
W „matematyce szkolnej” (i nie tylko) stosuje się skrócony zapis, w którym litera <math>\Delta</math> bez indeksu oznacza wartość funkcji <math>\Delta_2</math> (lub <math>\Delta_3</math>) na współczynnikach wielomianu, co ma uzasadnienie nie przeciążaniem notacji.
 
== Zależność od pierwiastków wielomianu ==
Wielomian <math>p</math> stopnia <math>n</math> ma dokładnie <math>n</math> pierwiastków z uwzględnieniem ich krotności (być może w ciele szerszym niż <math>K</math>).
 
Ponumerujmy te pierwiastki w dowolny sposób: <math>x_1, x_2, \dots, x_n,</math> a wtedy
<math>p(x)=a_n (x-x_1)(x-x_2) \ldots (x-x_n).</math>
 
Kwadrat [[wyznacznik Vandermonde'a|wyznacznika Vandermonda]] <math>V_n^2(x_1, x_2, \dots,
x_n)</math> jest wielomianem symetrycznym swych argumentów, co gwarantuje przede
Linia 60 ⟶ 73:
 
gdzie <math>k</math> jest stopniem pochodnej <math>p'.</math>
 
Po wstawieniu do pierwszej definicji wyróżnika otrzymujemy
: <math>D(p) = a_n^{2n-2} V_n^2(x_1, x_2, \dots, x_n) = a_n^{2n-2} \prod_{1 \leqslant i < j \leqslant n} (x_i - x_j)^2.</math>
 
Ta równość jest często traktowana jako definicja wyróżnika.
 
Gdy <math>n = 1,</math> to nie istnieje żadna para wskaźników z <math>i < j</math> (iloczyn po zbiorze pustym), więc <math>D(p) = a_1^{0} \cdot 1 = 1</math> w zgodzie z pierwszą definicją. Obie definicje są więc całkowicie równoważne, jednak w nowej wyraźnie widoczna jest podstawowa własność wyróżnika. Ponadto wynika stąd, że jeżeli wielomian <math>f \in \mathbb R[x]</math> ma wszystkie pierwiastki rzeczywiste, to <math>D(f) \geqslant 0.</math><br />
Gdy <math>n = 1,</math> to nie istnieje żadna para wskaźników z <math>i < j</math> (iloczyn po zbiorze pustym), więc <math>D(p) = a_1^{0} \cdot 1 = 1</math> w zgodzie z pierwszą definicją. Obie definicje są więc całkowicie równoważne, jednak w nowej wyraźnie widoczna jest podstawowa własność wyróżnika. Ponadto wynika stąd, że jeżeli wielomian <math>f \in \mathbb R[x]</math> ma wszystkie pierwiastki rzeczywiste, to <math>D(f) \geqslant 0.</math>
 
== Obliczanie wyróżnika ==
Linia 115 ⟶ 130:
</math>
 
Wszystkie macierze <math>J_{n,k}</math> są symetryczne.<br />
 
W tym podrozdziale wielomiany stopnia <math>n</math> będziemy zapisywali w postaci
: <math>f(x) = a_0 x^n + a_1 x^{n-1} + \dots + a_{n-1} x + a_n,</math> &ensp; gdzie <math>a_0 \neq 0.</math>
 
Definiujemy macierze <math>B_n</math> zależne od współczynników wielomianu stopnia <math>n.</math>
: <math>B_n = a_n\sum_{k=0}^{n-2}(n-k)a_kJ_{n,k+2}</math> &ensp; dla <math>n \geqslant 2.</math>
 
: <math>
B_n = a_n\sum_{k=0}^{n-2}(n-k)a_kJ_{n,k+2}
</math> &ensp; dla <math>n \geqslant 2.
</math>
 
Przykłady
 
: <math>
B_2 = a_2 \sum_{k=0}^0 (2-k)a_k J_{2,k+2} = a_2 (2a_0 J_{2,2}) = a_2
Linia 146 ⟶ 158:
Macierze <math>A_n,</math> których wyznacznik jest wyróżnikiem wielomianu stopnia <math>n</math> zdefiniowane są rekursyjnie.
Niech <math>A_1 = \begin{bmatrix} 1 \end{bmatrix}.</math> Jeżeli już określona jest macierz <math>A_{n-1},</math> to <math>A_n = L_n A_n^' L_n^\operatorname{T} - B_n,</math> gdzie
 
: <math>
L_n = \left[\begin{array}{cccc|c}
Linia 163 ⟶ 174:
 
a <math>B_n</math> jest macierzą stopnia <math>n</math> jak wyżej.
 
Macierz <math>A_{n-1}</math> (i podobnie <math>I_{n-1}</math>) zajmuje pozycję w lewym górnym narożniku, a poza wskazaną jednością, w ostatniej kolumnie i ostatnim wierszu są same zera.
 
Łatwo dowieść indukcyjnie, że tak zdefiniowane macierze <math>A_n</math> są symetryczne.
 
Dowód: Dla <math>n = 1</math> jest to oczywiste. Załóżmy w kroku indukcyjnym, że macierz <math>A_{n-1}</math> jest symetryczna. Z założenia indukcyjnego i określenia macierzy <math>A_n^'</math> wynika, że <math>A_n^'</math> jest symetryczna, czyli <math> A_n^{'\operatorname{T}} = A_n^'.</math><br />
 
Sprawdźmy, że macierz <math>C_n = L_n A_n^' L_n^\operatorname{T}</math> jest symetryczna.
: <math>C_n^\operatorname{T} = (L_n A_n^' L_n^\operatorname{T})^\operatorname{T} = (L_n^\operatorname{T})^\operatorname{T}
A_n^{'\operatorname{T}} L_n^\operatorname{T} = L_n A_n^' L_n^\operatorname{T} = C_n.
</math><br />
 
Macierz <math>B_n</math> jest symetryczna, bo jest sumą macierzy symetrycznych <math>J_{n,k}</math> z pewnymi współczynnikami. Zatem <math>A_n,</math> jako różnica <math>C_n - B_n</math> macierzy symetrycznych, jest symetryczna, co kończy krok indukcyjny.
 
Linia 299 ⟶ 313:
=== Związek z macierzą Bezouta ===
{{Osobny artykuł|Macierz Bézouta}}
Dla dwóch wielomianów <math>f,g \in K[x]</math> spełniających <math>n = \max(\deg(f), \deg(g)) \geqslant 1</math> (jeden z nich może być zerowy, jeśli drugi ma dodatni stopień) zdefiniowana jest macierz Bezouta stopnia <math>n.</math> Zwykle oznacza się ją <math>B_n(f,g).</math> Niżej przytoczone są tylko podstawowe informacje o tej macierzy wystarczające dla celów niniejszego artykułu, to znaczy bez dokładnej definicji, bez wzorów określających jej współrzędne i bez własności, ponieważ szczegóły znajdują się we wskazanym artykule.<br />
 
1. Współrzędne macierzy Bezouta <math>B_n(f,g)</math> zależą od współczynników wielomianów <math>f</math> i <math>g</math> i wyrażają się wielomianowo przez te współczynniki, czyli należą do ciała <math>K.</math><br />
1. Współrzędne macierzy Bezouta <math>B_n(f,g)</math> zależą od współczynników wielomianów <math>f</math> i <math>g</math> i wyrażają się wielomianowo przez te współczynniki, czyli należą do ciała <math>K.</math>
2. Macierz <math>B_n(f,g)</math> jest symetryczna.<br />
 
2. Macierz <math>B_n(f,g)</math> jest symetryczna.
 
3. Istnieją jawne wzory określające jej współrzędne, a więc bez użycia rekursji i bez znajomości żadnej macierzy Bezouta niższego stopnia. Tutaj nie są przytoczone, gdyż wystarczająca jest tylko informacja, że takie wzory istnieją.
 
W szczególnym przypadku, gdy <math>g = f',</math> (<math>g</math> jest pochodną wielomianu <math>f</math>), macierz Bezouta <math>B_n(f,f')</math> oznacza się przez <math>B_n(f).</math> W myśl powyższych określeń stopień macierzy <math>n = \deg(f),</math> więc wielomian <math>f</math> musi być dodatniego stopnia.<br />
 
Dalej rozważane są już tylko macierze Bezouta <math>B_n(f).</math><br />
Dalej rozważane są już tylko macierze Bezouta <math>B_n(f).</math>
Przyjmijmy takie oznaczenia współczynników wielomianu, by dla <math>n=1</math> wielomian miał postać <math>f(x) = ax + b,</math> dla <math>n=2</math> postać <math>f(x) = ax^2 + bx + c,</math> i podobnie dla wyższych stopni.<br />
 
Przyjmijmy takie oznaczenia współczynników wielomianu, by dla <math>n=1</math> wielomian miał postać <math>f(x) = ax + b,</math> dla <math>n=2</math> postać <math>f(x) = ax^2 + bx + c,</math> i podobnie dla wyższych stopni.
 
Przykładowe macierze Bezouta wielomianów niższych stopni są następujące:
<math>
Linia 328 ⟶ 348:
</math>
 
Pewien ciąg prostych przekształceń prowadzi od macierzy <math>B_n(f)</math> do macierzy <math>A_n,</math> co stanowi związek między nimi.<br />
 
Pomnożenie dowolnej macierzy przez <math>J_{n,1}</math> z lewej strony powoduje odwrócenie kolejności jej wierszy, a z prawej strony – kolejności kolumn. Gdy dana macierz jest symetryczna, to pomnożenie jej z obu stron przez <math>J_{n,1}</math> jest odbiciem względem antydiagonali.<br />
 
Macierz Bezouta odbita względem antydiagonali <math>J_{n,1} B_n(f) J_{n,1}</math> może być także nazywana (przy pewnej tolerancji dla terminologii) macierzą Bezouta. To przekształcenie nie jest bardzo istotne z teoretycznego punktu widzenia, nie zmienia wyznacznika (bo <math>\det J_{n,1} = (-1)^{n(n - 1)/2}</math>), a ponadto w literaturze często spotyka się taką definicję macierzy Bezouta, że od samego początku ma ona tę przekształconą postać, co dodatkowo uzasadnia nazwę.
 
Ze wzorów na współrzędne macierzy Bezouta <math>B_n(f)</math> wynika, że najwyższy współczynnik <math>a</math> wielomianu jest mnożnikiem ostatniego wiersza i ostatniej kolumny, a więc pierwszego wiersza i pierwszej kolumny w macierzy <math>J_{n,1} B_n(f) J_{n,1}.</math> <br />
 
Wprowadźmy oznaczenie <math>D_n(t) = \operatorname{diag}(t, 1, \dots, 1).</math> Mnożenie przez tę macierz z lewej strony mnoży pierwszy wiersz przez <math>t,</math> a mnożenie z prawej strony mnoży przez <math>t</math> pierwszą kolumnę, więc mnożenie z obu stron przez <math>D_n(a^{-1})</math> usuwa „nadmiarowy” czynnik. Oznaczmy nową macierz przez <math>C_n(f),</math> czyli<br />
Wprowadźmy oznaczenie <math>D_n(t) = \operatorname{diag}(t, 1, \dots, 1).</math> Mnożenie przez tę macierz z lewej strony mnoży pierwszy wiersz przez <math>t,</math> a mnożenie z prawej strony mnoży przez <math>t</math> pierwszą kolumnę, więc mnożenie z obu stron przez <math>D_n(a^{-1})</math> usuwa „nadmiarowy” czynnik. Oznaczmy nową macierz przez <math>C_n(f),</math> czyli
<math>C_n(f) = D_n(a^{-1}) J_{n,1} B_n(f) J_{n,1} D_n(a^{-1}).</math><br />
: <math>C_n(f) = D_n(a^{-1}) J_{n,1} B_n(f) J_{n,1} D_n(a^{-1}).</math>
Tej macierzy nie można już nazywać macierzą Bezouta, bo ma ona nie tylko inne współrzędne, lecz także inny wyznacznik (w ogólności).<br />
 
<math>\det C_n(f) = a^{-2} \det B_n(f)</math><br />
Tej macierzy nie można już nazywać macierzą Bezouta, bo ma ona nie tylko inne współrzędne, lecz także inny wyznacznik (w ogólności)
Na przykład<br />
: <math>C_3\det C_n(f) = D_3(a^{-12}) J_{3,1}\det B_3B_n(f) J_{3,1} D_3(a^{-1}) =</math>.
 
Na przykład
: <math>C_3(f) = D_3(a^{-1}) J_{3,1} B_3(f) J_{3,1} D_3(a^{-1}) =
\left[\begin{smallmatrix}
3 & 2b & c \\
2b & 2b^2 - 2ac & bc - 3ad \\
c & bc - 3ad & c^2 - 2bd \end{smallmatrix}\right].
</math><br />
 
Jest ona zbliżona pokrojem do macierzy <math>A_3,</math> ale wciąż różna od niej. Kilka operacji elementarnych na wierszach i kolumnach macierzy <math>C_3(f),</math> nie naruszających jej symetryczności, przekształca ją w <math>A_3.</math><br />
Jest ona zbliżona pokrojem do macierzy <math>A_3,</math> ale wciąż różna od niej. Kilka operacji elementarnych na wierszach i kolumnach macierzy <math>C_3(f),</math> nie naruszających jej symetryczności, przekształca ją w <math>A_3.</math>
Od drugiego wiersza odejmijmy pierwszy wiersz pomnożony przez <math>b,</math> od wiersza trzeciego odejmijmy wiersz pierwszy pomnożony przez <math>c,</math> i zastosujmy analogiczne operacje do kolumn. Wreszcie pierwszy wiersz pomnóżmy przez <math>-1</math> i pierwszą kolumnę też przez <math>-1.</math> Macierz przekształcona jest równa <math>A_3.</math><br />
 
W zapisie macierzowym te elementarne operacje na kolumnach są określone macierzą<br />
Od drugiego wiersza odejmijmy pierwszy wiersz pomnożony przez <math>b,</math> od wiersza trzeciego odejmijmy wiersz pierwszy pomnożony przez <math>c,</math> i zastosujmy analogiczne operacje do kolumn. Wreszcie pierwszy wiersz pomnóżmy przez <math>-1</math> i pierwszą kolumnę też przez <math>-1.</math> Macierz przekształcona jest równa <math>A_3.</math>
 
W zapisie macierzowym te elementarne operacje na kolumnach są określone macierzą
: <math>F_3 =
\begin{bmatrix}
Linia 356 ⟶ 382:
\end{bmatrix},
</math>
 
a dla wierszy jest to macierz <math>F_3^\operatorname{T},</math> czyli <math>A_3 = F_3^\operatorname{T} C_3(f) F_3.</math><br />
a dla wierszy jest to macierz <math>F_3^\operatorname{T},</math> czyli <math>A_3 = F_3^\operatorname{T} C_3(f) F_3.</math>
Ogólnie, przy odwróconym indeksowaniu współczynników wielomianu, tzn. <math>f(x) = a_0 x^n + \dots + a_n,</math><br />
 
: <math>F_n =
Ogólnie, przy odwróconym indeksowaniu współczynników wielomianu, tzn. <math>f(x) = a_0 x^n + \dots + a_n,</math>
\begin{bmatrix}
: <math>F_n = \begin{bmatrix}
-1 & -a_1 & \dots & -a_{n-1} \\
& 1 & & \\
& & \ddots & \\
& & & 1
\end{bmatrix}</math>
 
</math>
i <math>A_n = F_n^\operatorname{T} C_n(f) F_n.</math><br />
 
Ponieważ <math>\det F_n = -1,</math> to <math>\det A_n = \det C_n(f),</math> więc otrzymujemy związek pomiędzy wyróżnikiem i macierzą Bezouta<br />
Ponieważ <math>\det F_n = -1,</math> to <math>\det A_n = \det C_n(f),</math> więc otrzymujemy związek pomiędzy wyróżnikiem i macierzą Bezouta
: <math>D(f) = a_0^{-2} \det B_n(f).</math><br />
: <math>D(f) = a_0^{-2} \det B_n(f).</math>
Macierz <math>F_n</math> jest inwolutywna, to znaczy <math>F_n^2 = I_n,</math> skąd wynika, że wykonanie identycznych operacji elementarnych na macierzy <math>A_n</math> przekształca ją z powrotem w <math>C_n(f),</math> ponieważ<br />
 
<math>F_n^\operatorname{T} A_n F_n = F_n^\operatorname{T} F_n^\operatorname{T} C_n(f) F_n F_n = I_n C_n(f) I_n = C_n(f).</math><br />
Zatem macierzeMacierz <math>C_n(f)F_n</math> ijest inwolutywna, to znaczy <math>A_nF_n^2 = I_n,</math> przekształcająskąd sięwynika, wzajemnieże nawykonanie siebieidentycznych podoperacji działaniemelementarnych operacjina macierzy <math>F_n.A_n</math><br przekształca ją z powrotem w <math>C_n(f),</math> ponieważ
: <math>F_n^\operatorname{T} A_n F_n = F_n^\operatorname{T} F_n^\operatorname{T} C_n(f) F_n F_n = I_n C_n(f) I_n = C_n(f).</math>
 
Zatem macierze <math>C_n(f)</math> i <math>A_n</math> przekształcają się wzajemnie na siebie pod działaniem operacji <math>F_n.</math>
 
Związek pomiędzy macierzą <math>A_n</math> i macierzą Bezouta <math>B_n(f)</math> wyraża się, po uwzględnieniu wszystkich zastosowanych przekształceń, równością
: <math>A_n = F_n^\operatorname{T} D_n(a^{-1}) J_{n,1} B_n(f) J_{n,1} D_n(a^{-1}) F_n</math>
 
i na odwrót
: <math>B_n(f) = J_{n,1} D_n(a) F_n^\operatorname{T} A_n F_n D_n(a) J_{n,1}.</math>
 
Choć <math>A_n</math> nie jest macierzą Bezouta, to widoczny jest bliski związek między nimi.
 
'''Podsumowanie'''<br />
1. Macierz <math>A_n</math> nie musi być z konieczności obliczana rekursyjnie, bo można skorzystać ze wzorów na współrzędne macierzy Bezouta <math>B_n(f)</math> i natychmiast otrzymać <math>C_n(f),</math> a następnie obliczyć <math>A_n = F_n^\operatorname{T} C_n(f) F_n.</math><br />
 
2. Dla wielomianu stopnia <math>n</math> istnieją macierze stopnia <math>n,</math> których wyznacznik jest wyróżnikiem tego wielomianu i niezależnie od sposobu ich obliczenia (z użyciem rekursji lub bez niej) mogą w pewnych przypadkach ułatwiać obliczenie wyróżnika. Jest oczywiste, że można wybrać tę macierz, której wyznacznik oblicza się prościej.
 
Linia 407 ⟶ 441:
: {| class="wikitable mw-collapsible mw-collapsed"
|+ style="text-align:left;"| <math>\Delta_5(a,b,c,d,e,f)=</math>
! Nr || Znak || Czynnik || Jednomian
! Nr
! Znak
! Czynnik
! Jednomian
! rowspan=21 style="border-top-color: White; border-bottom-color: White; background-color: White;"|
! Nr || Znak || Czynnik || Jednomian
! Nr
! Znak
! Czynnik
! Jednomian
! rowspan=21 style="border-top-color: White; border-bottom-color: White; background-color: White;"|
! Nr || Znak || Czynnik || Jednomian
! Nr
! Znak
! Czynnik
! Jednomian
|-
| style="text-align:right;"| 1 ||style="text-align:center;"| <math>+</math>
Linia 565 ⟶ 590:
: {| class="wikitable mw-collapsible mw-collapsed"
|+ style="text-align:left;"|<math>\Delta_6(a,b,c,d,e,f,g)=</math>
! Nr || Z || Czyn || Jednom
! Nr
! Z
! Czyn
! Jednom
! rowspan=51 style="border-top-color: White; border-bottom-color: White; background-color: White;"|
! Nr || Z || Czyn || Jednom
! Nr
! Z
! Czyn
! Jednom
! rowspan=51 style="border-top-color: White; border-bottom-color: White; background-color: White;"|
! Nr || Z || Czyn || Jednom
! Nr
! Z
! Czyn
! Jednom
! rowspan=51 style="border-top-color: White; border-bottom-color: White; background-color: White;"|
! Nr || Z || Czyn || Jednom
! Nr
! Z
! Czyn
! Jednom
! rowspan=51 style="border-top-color: White; border-bottom-color: White; background-color: White;"|
! Nr || Z || Czyn || Jednom
! Nr
! Z
! Czyn
! Jednom
 
|-
Linia 1872 ⟶ 1882:
 
== Inne przykłady ==
Wyróżnikiem trójmianu <math>ax^n+bx+c</math> jest<ref group="uwaga">Wprawdzie pierwszy wzór na liście jest szczególnym przypadkiem ogólnego wzoru dla trójmianu, lecz można go znaleźć niezależnie, korzystając z rekursyjnej definicji macierzy <math>A_n</math> (patrz rozdz. „[[#Obliczanie wyróżnika|Obliczanie wyróżnika]]”).<br />
Plan dowodu:<br />
Musimy znać postać macierzy <math>A_n</math> dla danego wielomianu, by obliczyć jej wyznacznik. Temu celowi służą trzy pierwsze kroki dowodu.<br />
 
Plan dowodu:<br />
&nbsp; Krok 1. Dowodzimy indukcyjnie, że macierz <math>A_n</math> wielomianu <math>a_0 x^n</math> dla <math>n \geqslant 1</math> ma taką postać, że element w 1 kolumnie i 1 wierszu jest równy <math>n,</math> a pozostałe są zerami.<br />
Musimy znać postać macierzy <math>A_n</math> dla danego wielomianu, by obliczyć jej wyznacznik. Temu celowi służą trzy pierwsze kroki dowodu.
 
&nbsp; Krok 21. PrzechodzimyDowodzimy rekursyjnie od znanejindukcyjnie, jużże macierzy <math>A_{n-1}</math> wielomianu <math>a_0 x^{n-1}</math> do macierzymacierz <math>A_n</math> wielomianu <math>a_0 x^n + a_n</math> dla <math>n \geqslant 2.1</math> Tutajma nietaką stosujemypostać, jużże indukcji,element leczw tylko1 jednokolumnie równaniei rekursji1 dlawierszu dowolnego,jest ale ustalonegorówny <math>n.,</math> Macierza ma postać jak niżej (z lewej). W pozycjach nie wypełnionychpozostałezerazerami.<br />
 
&nbsp; Krok 2. Przechodzimy rekursyjnie od znanej już macierzy <math>A_{n-1}</math> wielomianu <math>a_0 x^{n-1}</math> do macierzy <math>A_n</math> wielomianu <math>a_0 x^n + a_n</math> dla <math>n \geqslant 2.</math> Tutaj nie stosujemy już indukcji, lecz tylko jedno równanie rekursji dla dowolnego, ale ustalonego <math>n.</math> Macierz ma postać jak niżej (z lewej). W pozycjach nie wypełnionych są zera.
: <math>
A_n = \left[\begin{smallmatrix}
Linia 1895 ⟶ 1905:
(n - 1) a_{n-1} & - n a_0 a_n & & & (n - 1) a_{n-1}^2
\end{smallmatrix}\right]
</math><br />
 
&nbsp; Krok 3. Znając już macierz <math>A_{n-1}</math> wielomianu <math>a_0 x^{n-1} + a_{n-1},</math> znajdujemy z równania rekursji (podobnie jak w drugim kroku) macierz <math>A_n</math> wielomianu <math>a_0 x^n + a_{n-1} x + a_n</math> dla <math>n \geqslant 3.</math> Ma ona postać jak wyżej (z prawej). Na antydiagonali są wyrazy <math>(1 - n) a_0 a_{n-1}</math> z wyjątkiem jej końców o wyrazach <math>(n - 1) a_{n-1},</math> a na pierwszej poddiagonali antydiagonali są tylko wyrazy <math>- n a_0 a_n.</math><br />
 
&nbsp; Krok 4. Przed obliczeniem wyznacznika wygodnie jest zmienić oznaczenia <math>a_0, a_{n-1}, a_n</math> na <math>a, b, c</math> odpowiednio, gdyż rachunki są wtedy czytelniejsze. Obliczenie wyznacznika nie sprawia trudności, a wynikiem jest szukany wyróżnik dla <math>n \geqslant 3.</math><br />
 
&nbsp; Krok 5. Sprawdzamy bezpośrednio, że wzór pozostaje w mocy dla <math>n = 2.</math></ref>
Linia 1907 ⟶ 1917:
* <math>D(ax^n + c) = (-1)^\frac{n(n - 1)}{2} n^n a^{n - 1} c^{n - 1} \quad</math> dla <math>n \geqslant 1</math>
Gdy zaś przyjmiemy <math>c=0,</math> to otrzymamy drugi przypadek szczególny dla dwumianu <math>ax^n + bx.</math>
: <math>D(ax^n + bx) = (-1)^\frac{n(n - 1)}{2} (1 - n)^{n - 1}a^{n-2}b^n = (-1)^\frac{n(n - 1)}{2} (-1)^{n - 1} (n - 1)^{n - 1} a^{n - 2}b^n</math><br />
: <math>= (-1)^{\frac{n(n-1)}{2} + n - 1} (n - 1)^{n - 1} a^{n-2}b^n = (-1)^\frac{(n-1)(n-2)}{2} (n - 1)^{n - 1} a^{n-2}b^n</math>
 
* <math>D(ax^n + bx) = (-1)^\frac{(n-1)(n-2)}{2} (n - 1)^{n - 1} a^{n-2}b^n \quad</math> dla <math>n \geqslant 2</math>
Ten wynik można otrzymać prościej, korzystając ze wzoru redukcyjnego (patrz następny rozdział) i poprzedniego wyróżnika. <math>D(a x^n + b x) = D((a x^{n - 1} + b)x) = b^2 D(ax^{n - 1} + b) = b^2 (-1)^\frac{(n - 1)(n - 2)}{2} (n - 1)^{n - 1} a^{n - 2} b^{n - 2}</math><br />
: <math>= (-1)^\frac{(n - 1)(n - 2)}{2} (n - 1)^{n - 1} a^{n - 2} b^n</math><br />
 
Pierwszy wzór na liście ma uogólnienie na dowolny trójmian znalezione przez R.G. Swana (1962){{odn|Prasolov|2004| s = 26}}{{r|Swan}}.<br />
Pierwszy wzór na liście ma uogólnienie na dowolny trójmian znalezione przez R.G. Swana (1962){{odn|Prasolov|2004| s = 26}}{{r|Swan}}.
Niech <math>n > m > 0</math> i niech <math>d = (n, m)</math><ref group="uwaga">Zapis <math>(n,m)</math> jest bardzo często stosowanym skróconym oznaczeniem dla <math>\mathrm{NWD}(n,m).</math> W tej konwencji zamiast <math>\mathrm{NWW}(n,m)</math> pisze się <math>[n,m]</math>.</ref>, <math>{}\ \ n = n_1 d,\quad m = m_1 d.\ \ </math> Wtedy<br />
 
Niech <math>n > m > 0</math> i niech <math>d = (n, m)</math><ref group="uwaga">Zapis <math>(n,m)</math> jest bardzo często stosowanym skróconym oznaczeniem dla <math>\mathrm{NWD}(n,m).</math> W tej konwencji zamiast <math>\mathrm{NWW}(n,m)</math> pisze się <math>[n,m]</math>.</ref>, <math>{}\ \ n = n_1 d,\quad m = m_1 d.\ \ </math> Wtedy
* <math>D(a x^n + b x^m + c) = (-1)^ \frac{n(n - 1)}{2} a^{(n - m - 1)} c^{(m - 1)} \left(n^{n_1} a^{m_1} c^{n_1 - m_1} + (-1)^{n_1 + 1} (n - m)^{n_1 - m_1} m^{m_1} b^{n_1}\right)^d</math>
Można oznaczyć dodatkowo <math>s = (-1)^{n_1 + 1} (n - m)^{n_1 - m_1},</math> by wzór miał bardziej zwartą postać
Linia 1935 ⟶ 1948:
Bardziej znany jest inny dowód<ref group="uwaga">Ta zależność może być również otrzymana ze wzoru na wyróżnik iloczynu (patrz rozdz. „[[#Własności|Własności]]”).
<math>\Delta_n(a_0, \dots, a_{n-1}, 0) = D(a_0x^n + \dots + a_{n-1}x) = D\big((a_0x^{n-1} + \dots + a_{n-1})x\big)</math>
<math>= D(a_0x^{n-1} + \dots + a_{n-1}) D(x) R^2(a_0x^{n-1} + \dots + a_{n-1}, x).</math><br />
 
Rugownik obliczymy jako wyznacznik macierzy Sylvestera (stopnia <math>n</math>). Ma ona w ostatniej kolumnie same zera z wyjątkiem pierwszego elementu równego <math>a_{n-1}.</math> Rozwinięcie wyznacznika względem ostatniej kolumny prowadzi od razu do <math>R(a_0 x^{n-1} + \dots + a_{n-1}, x) = (-1)^{n-1} a_{n-1}.</math><br />
Rugownik obliczymy jako wyznacznik macierzy Sylvestera (stopnia <math>n</math>). Ma ona w ostatniej kolumnie same zera z wyjątkiem pierwszego elementu równego <math>a_{n-1}.</math> Rozwinięcie wyznacznika względem ostatniej kolumny prowadzi od razu do <math>R(a_0 x^{n-1} + \dots + a_{n-1}, x) = (-1)^{n-1} a_{n-1}.</math>
 
Zatem <math>\Delta_n(a_0, \dots, a_{n-1}, 0) = a_{n-1}^2 D(a_0 x^{n-1} + \dots + a_{n-1}) = a_{n-1}^2 \Delta_{n-1}(a_0, \dots, a_{n-1}).</math></ref> tej zależności, w którym nie korzysta się z definicji rekursyjnej.
 
Linia 1945 ⟶ 1960:
Zachodzi też równość do pewnego stopnia symetryczna względem powyższej. Gdy do wyróżnika <math>\Delta_n(a_0, a_1, \dots, a_n)</math> podstawimy <math>a_0=0,</math> to nie otrzymamy wyróżnika żadnego wielomianu, bo wszystkie rozważania prowadzone są przy założeniu, że wielomian jest stopnia <math>n,</math> to znaczy z <math>a_0 \neq 0.</math> Tym niemniej, rozpatrując ten wyróżnik jako pewien wielomian zależny od <math>n+1</math> zmiennych, można przyjąć w nim <math>a_0 = 0</math> i rozważyć czym jest otrzymane wyrażenie. Okazuje się, że przy założeniu <math>a_1 \neq 0</math> spełniona jest równość
: <math>\Delta_n(0, a_1, \dots, a_n) = a_1^2 \Delta_{n-1}(a_1, \dots, a_n)\quad</math> dla <math>n \geqslant 2,</math>
 
gdzie <math>\Delta_{n-1}(a_1, \dots, a_n)</math> jest wyróżnikiem wielomianu <math>g(x) = a_1 x^{n-1} + a_2 x^{n-2} + \dots + a_{n-1} x + a_n</math> stopnia <math>n-1.</math> Poniżej przedstawiony jest tylko przykładowy dowód dla przypadku szczególnego <math>n=3,</math> gdyż uogólnienie na dowolne <math>n \geqslant 2</math> jest oczywiste, choć nieco uciążliwe w zapisie.
 
Linia 2019 ⟶ 2035:
0 & 2b & c
\end{smallmatrix}\right|.
</math><br />
 
Zatem <math>\Delta_3(0,b,c,d) = b^2 \Delta_2(b,c,d).</math><br />
Zatem <math>\Delta_3(0,b,c,d) = b^2 \Delta_2(b,c,d).</math>
Dowód ogólny przebiega analogicznie.<br />
 
Dowód ogólny przebiega analogicznie.
 
Przykład
Linia 2028 ⟶ 2046:
 
Przy bardziej naturalnym indeksowaniu współczynników wielomianu pierwsza zależność ma postać
<math>{}\quad\ \Delta_n(a_n, \dots, a_1, 0) = a_1^2 \Delta_{n-1} (a_n, \dots, a_1).</math><br />
 
Może być także zapisana równoważnie w postaci wzoru redukcyjnego
: <math>D(a_n x^n + \dots + a_1x) = a_1^2 D(a_n x^{n-1} + \dots + a_1) \quad</math> dla <math>n \geqslant 2</math><br />
 
lub <math>{}\ D(xf) = f^2(0) D(f) \quad</math> dla <math>\deg (f) \geqslant 1.</math><br />
lub <math>{}\ D(xf) = f^2(0) D(f) \quad</math> dla <math>\deg (f) \geqslant 1.</math>
 
Podobny zapis w postaci wzoru redukcyjnego dla drugiej zależności nie jest możliwy.
 
Linia 2057 ⟶ 2078:
Wielomian <math>p(x) = ax + b</math> stopnia 1, nad dowolnym ciałem <math>K,</math> ma zawsze pierwiastek <math>x_1 = -b/a</math> i ten jedyny pierwiastek należy do ciała <math>K.</math>
 
Wielomian <math>p(x) = ax^2 + bx + c</math> stopnia 2 nad ciałem <math>K</math> o charakterystyce różnej od 2 (na przykład nad ciałem liczbowym) ma pierwiastki w <math>K</math> wtedy i tylko wtedy, gdy jego wyróżnik jest kwadratem w ciele <math>K.</math> Jeżeli jest kwadratem, to pierwiastki wyrażają się dobrze znanym wzorem <math>x_{1,2}=\frac{-b \pm \sqrt {b^2-4ac}}{2a},</math> a jeżeli nie jest, to wielomian jest [[wielomian nierozkładalny|nierozkładalny]]<ref group="uwaga">W pierścieniu wielomianów nad ciałem pojęcia „wielomian nieprzywiedlny” i „wielomian nierozkładalny” są tożsame. Różnica pojawia się w pierścieniu wielomianów nad taką dziedziną całkowitości, która nie jest ciałem. Wtedy każdy wielomian nierozkładalny jest nieprzywiedlny, ale niekoniecznie na odwrót. Wielomian nieprzywiedlny może być rozkładalny.<br />
 
W pierścieniu wielomianów nad ciałem jest jeszcze jedno pojęcie równoważne dwóm poprzednim: „wielomian pierwszy”. W dziedzinie całkowitości element pierwszy jest nierozkładalny, ale niekoniecznie na odwrót. Jeżeli pierścień jest dziedziną z jednoznacznością rozkładu (więc z definicji dziedziną całkowitości), to także każdy element nierozkładalny jest pierwszy. Pierścień wielomianów nad ciałem jest dziedziną z jednoznacznością rozkładu, skąd już wynika równoważność ostatniego pojęcia z dwoma poprzednimi.<br />
W pierścieniu wielomianów nad ciałem jest jeszcze jedno pojęcie równoważne dwóm poprzednim: „wielomian pierwszy”. W dziedzinie całkowitości element pierwszy jest nierozkładalny, ale niekoniecznie na odwrót. Jeżeli pierścień jest dziedziną z jednoznacznością rozkładu (więc z definicji dziedziną całkowitości), to także każdy element nierozkładalny jest pierwszy. Pierścień wielomianów nad ciałem jest dziedziną z jednoznacznością rozkładu, skąd już wynika równoważność ostatniego pojęcia z dwoma poprzednimi.
Powyższe uwagi stosują się zarówno do wielomianów jednej zmiennej, jak też wielu zmiennych – bez zmiany argumentacji.<br />
 
Można więc używać dowolnego z tych trzech synonimów według potrzeb lub uznania, o ile rozważane są wielomiany nad ciałami. Każdy wybór jest poprawny. W polskiej literaturze najczęściej używany jest drugi, rzadziej pierwszy, a najmniej spotykany jest trzeci, choć i to się zdarza.</ref> w <math>K.</math><br />
Powyższe uwagi stosują się zarówno do wielomianów jednej zmiennej, jak też wielu zmiennych – bez zmiany argumentacji.
 
Można więc używać dowolnego z tych trzech synonimów według potrzeb lub uznania, o ile rozważane są wielomiany nad ciałami. Każdy wybór jest poprawny. W polskiej literaturze najczęściej używany jest drugi, rzadziej pierwszy, a najmniej spotykany jest trzeci, choć i to się zdarza.</ref> w <math>K.</math>
 
Dowód tego twierdzenia jest bardzo podobny do dowodu dla ciała liczb rzeczywistych – przez wydzielenie z trójmianu pełnego kwadratu{{odn|Fine|Gaglione|Rosenberger|2014| s = 401-402}}.
 
Jeśli <math>K = \mathbb R</math> jest ciałem liczb rzeczywistych, to wielomian stopnia 2 ma pierwiastki w <math>\mathbb R,</math> gdy jego wyróżnik jest nieujemny. Już w ciele liczb wymiernych <math>\mathbb Q</math> jest inaczej: trójmian <math>x^2-3x+2</math> ma pierwiastki wymierne, bo jego wyróżnik <math>\Delta = 1</math> jest kwadratem w ciele <math>\mathbb Q;</math> trójmian <math>x^2-3x+1</math> ma dodatni wyróżnik <math>\Delta = 5,</math> więc ma pierwiastki rzeczywiste, ale nie ma pierwiastków wymiernych, bo 5 nie jest kwadratem liczby wymiernej.
 
Gdy charakterystyka ciała <math>\chi (K) = 2,</math> to <math>\Delta_2(a,b,c) = b^2 - 4ac = b^2,</math> bo w takich ciałach <math>4 = 0.</math> Zatem wyróżnik jest zawsze kwadratem<ref group="uwaga">Jeżeli ciało o charakterystyce 2 jest skończone, to nawet każdy element jest kwadratem dokładnie jednego elementu tego ciała. Innymi słowy każdy element ma jeden pierwiastek 2 stopnia.</ref>, a mianowicie elementu <math>b \ \ (-b = b,</math> bo <math>-1 = 1).</math> Można jednak wskazać trójmian kwadratowy, który nie ma pierwiastków w <math>K,</math> co wyjaśnia założenie o charakterystyce w powyższym twierdzeniu.<br />
 
Oczywiście do sprawdzenia krotności pierwiastków wciąż można (jak zawsze) posłużyć się wyróżnikiem. Wielomian <math>p,</math> jak wyżej, ma jeden pierwiastek dwukrotny wtedy i tylko wtedy, gdy <math>b=0.</math> W przypadku ciała skończonego pierwiastek dwukrotny jest elementem tego ciała.
 
=== Wielomiany w <math>\mathbb R[x]</math> ===
W tym podrozdziale stale obowiązuje założenie, że wielomian <math>f</math> jest nad ciałem liczb rzeczywistych, czyli <math>f \in \mathbb R[x].</math> Domknięciem algebraicznym ciała <math>\mathbb R</math> jest ciało [[liczby zespolone|liczb zespolonych]] <math>\mathbb C,</math> więc każdy wielomian ma wszystkie pierwiastki w <math>\mathbb C.</math> Wielomianami nierozkładalnymi w <math>\mathbb R</math> mogą być jedynie wielomiany 1 i 2 stopnia, więc każdy wielomian <math>f</math> dodatniego stopnia rozkłada się w <math>\mathbb R</math> na iloczyn wielomianów nierozkładalnych co najwyżej 2 stopnia. Jeżeli pewien czynnik w rozkładzie ma stopień 2, to jego dwa pierwiastki w ciele <math>\mathbb C</math> są wzajemnie sprzężonymi liczbami zespolonymi, oczywiście nie rzeczywistymi. Zatem wszystkie pierwiastki nie rzeczywiste wielomianu, o ile takie istnieją, występują w parach sprzężonych. W przypadku gdy pierwiastek pary ma krotność większą niż 1, to także sprzężony z nim w parze ma tę samą krotność, więc można mówić o krotności całej pary pierwiastków.<br />
 
Z wartości wyróżnika wielomianu można uzyskać pewną informację jakościową o pierwiastkach, tzn. o liczbie pierwiastków rzeczywistych, liczbie par zespolonych, ich krotnościach, bez obliczania tych pierwiastków. Jednak informacja otrzymana z samej wartości wyróżnika jest tym bardziej niekompletna, im większy jest stopień wielomianu. Do dokładnego rozpoznania potrzebne są inne metody.<br />
Z wartości wyróżnika wielomianu można uzyskać pewną informację jakościową o pierwiastkach, tzn. o liczbie pierwiastków rzeczywistych, liczbie par zespolonych, ich krotnościach, bez obliczania tych pierwiastków. Jednak informacja otrzymana z samej wartości wyróżnika jest tym bardziej niekompletna, im większy jest stopień wielomianu. Do dokładnego rozpoznania potrzebne są inne metody.
 
Niech <math>\nu (f)</math> oznacza liczbę par nie rzeczywistych pierwiastków sprzężonych wielomianu <math>f</math> z uwzględnieniem krotności par. Zachodzi ogólne twierdzenie dla wielomianów dowolnego stopnia dodatniego.
 
Jeżeli <math>D(f)>0,</math> to <math>\nu (f)</math> jest liczbą parzystą (dopuszczalne 0), a jeżeli <math>D(f)<0,</math> to <math>\nu (f)</math> jest liczbą nieparzystą.
 
Założenia tego twierdzenia wykluczają pierwiastki wielokrotne.<br />
 
Poniżej przedstawione są wnioski dla szczególnych przypadków niskich stopni. Stopień 2, omówiony już w poprzednim podrozdziale, został także włączony dla kompletności.
 
Linia 2112 ⟶ 2141:
D(f) & = \Delta_5(1,0,0,0,-6,3) = 5^5 3^4 + 4^4(-6)^5 = 3125 \cdot 81 - 256 \cdot 7776 = 253125 - 1990656 \\
& = -1737531 < 0.
\end{align}</math><br />
 
Stąd wnioskujemy, że wielomian <math>f</math> ma trzy różne pierwiastki rzeczywiste i jedną parę pierwiastków zespolonych sprzężonych. Ten wynik można otrzymać także innymi sposobami, ale zastosowanie wyróżnika jest najszybsze.
 
Linia 2119 ⟶ 2149:
Wypiszmy wszystkie wielomiany 2 stopnia nad ciałem <math>\mathrm F_2.</math> Każdy niezerowy wielomian w <math>\mathrm F_2[x]</math> jest moniczny, więc są one postaci <math>x^2 + bx + c,</math> gdzie <math>b</math> i <math>c</math> mogą przybierać wartości 0 lub 1. Są więc 4 takie wielomiany.
: <math>f_1 = x^2,\quad f_2 = x^2 + 1,\quad f_3 = x^2 + x,\quad f_4 = x^2 + x + 1.</math>
<math>\Delta_2(a, b, c) = b^2 = b.</math> Ostatnia równość wynika stąd, że <math>b^2 = b</math> dla każdego <math>b \in \mathrm F_2.</math><br />
 
Zatem <math>D(f_1) = D(f_2) = 0</math> i <math>D(f_3) = D(f_4) = 1.</math><br />
Istotnie,Zatem <math>D(f_1) = D(xf_2) -= 0)^2</math> ma pierwiastek dwukrotnyi <math>0,D(f_3) = D(f_4) = 1.</math><br />
 
<math>(x - 1)^2 = x^2 - 2x +1 = x^2 + 1</math> (bo <math>2 = 0</math>), więc <math>f_2</math> ma pierwiastek dwukrotny <math>1.</math><br />
NatomiastIstotnie, <math>(xf_1 -= 0)(x - 10) = x^2 - x = x^2 + x = f_3,</math> więc <math>f_3</math> ma dwapierwiastek różne pierwiastkidwukrotny <math>0,</math> i <math>1.</math><br />
 
Przez bezpośrednie podstawienie przekonujemy się, że wielomian <math>f_4</math> nie ma pierwiastków w <math>\mathrm F_2.</math> Aby sprawdzić, że w swoim ciele rozkładu (jest nim <math>\mathrm F_4 = \mathrm F_{2^2}</math>) ma dwa różne pierwiastki, obliczmy pochodną <math>f_4' = 2x + 1 = 1.</math> Wielomian <math>f_4</math> nie ma wspólnego pierwiastka ze swą pochodną (bo ona w ogóle nie ma pierwiastków), więc nie ma pierwiastka dwukrotnego w <math>\mathrm F_4.</math><br />
<math>(x - 1)^2 = x^2 - 2x +1 = x^2 + 1</math> (bo <math>2 = 0</math>), więc <math>f_2</math> ma pierwiastek dwukrotny <math>1.</math>
 
Natomiast <math>(x - 0)(x - 1) = x^2 - x = x^2 + x = f_3,</math> więc <math>f_3</math> ma dwa różne pierwiastki <math>0</math> i <math>1.</math>
 
Przez bezpośrednie podstawienie przekonujemy się, że wielomian <math>f_4</math> nie ma pierwiastków w <math>\mathrm F_2.</math> Aby sprawdzić, że w swoim ciele rozkładu (jest nim <math>\mathrm F_4 = \mathrm F_{2^2}</math>) ma dwa różne pierwiastki, obliczmy pochodną <math>f_4' = 2x + 1 = 1.</math> Wielomian <math>f_4</math> nie ma wspólnego pierwiastka ze swą pochodną (bo ona w ogóle nie ma pierwiastków), więc nie ma pierwiastka dwukrotnego w <math>\mathrm F_4.</math>
 
Ten przykład jest ilustracją uniwersalności wyróżnika. Metody stosowane w przypadku charakterystyki 2 mają własną specyfikę i różnią się znacznie od metod dla innych charakterystyk, ale wyróżnik jest na to niewrażliwy i daje zawsze właściwe wyniki niezależnie od charakterystyki ciała.
 
Następny przykład dotyczy ciała <math>\mathrm F_9,</math> więc przydatne mogą być najbardziej podstawowe wiadomości o tym ciele przedstawione poniżej{{odn|Koblitz|1995| s = 57}}. Są one wystarczające, by snadnie wykonywać rachunki arytmetyczne w <math>\mathrm F_9.</math> Ciało <math>\mathrm F_9</math> zawiera ciało proste <math>\mathrm F_3 = \mathbb Z/3\mathbb Z</math> i jest jego rozszerzeniem 2 stopnia. Może być otrzymane przez dołączenie pierwiastka monicznego wielomianu nierozkładalnego 2 stopnia z <math>\mathrm F_3[x].</math> Wybierzmy wielomian <math>x^2 + 1</math> (nierozkładalny, bo nie ma pierwiastka w <math>\mathrm F_3</math>). Jego pierwiastek <math>\,\alpha\,</math> spełnia więc równanie <math>\alpha^2 = -1.</math> Nazwijmy go raczej <math>\,i\ </math>– przecież dołączyliśmy pierwiastek z <math>-1.</math> Każdy element ciała <math>\mathrm F_9 = \mathrm F_3(i),</math> jako przestrzeni liniowej nad <math>\mathrm F_3</math> wymiaru 2 z bazą <math>\{1, i\},</math> ma jednoznaczne przedstawienie w postaci <math>a + bi,</math> gdzie <math>a,b \in \mathrm F_3.</math> Te elementy dodajemy i mnożymy w zwykły sposób, z tym tylko, że <math>i^2</math> zastępujemy wszędzie przez <math>-1.</math> Jest to bardzo podobne do działań na liczbach zespolonych, z tą różnicą, że działania arytmetyczne na współczynnikach <math>a</math> i <math>b</math> odbywają się według zasad obowiązujących w małym ciele <math>\mathrm F_3.</math> Jego elementami są <math>0,1</math> i <math>2,</math> ale wygodnie jest stosować w zapisie <math>0,1</math> i <math>-1,</math> bo <math>2 = -1.</math><br />
 
Znajdźmy dla przykładu element odwrotny do <math>1 + i.</math>
: <math>\frac{1}{1+i} = \frac{1}{1 + i} \cdot \frac{1 - i}{1 - i} = \frac{1 - i}{1 - i^2} = \frac{1 - i}{2} = \frac{1 - i}{-1} = -1(1 - i) = -1 + i.</math>
Linia 2133 ⟶ 2170:
'''Przykład 3'''
 
Sprawdźmy, czy wielomian <math>ix^2 + ix + 1+i \in \mathrm F_9[x]</math> ma pierwiastki w <math>\mathrm F_9</math> i jeśli tak, to obliczmy je.<br />
 
W grupie multyplikatywnej <math>\mathrm F_9^*</math> są 4 kwadraty, więc wypiszmy je, podnosząc do kwadratu elementy każdej z 4 par elementów wzajemnie przeciwnych<ref group="uwaga">Niech <math>\mathrm F_q</math> będzie ciałem skończonym o charakterystyce różnej od 2. Jeżeli pewien element <math>\alpha</math> w grupie mutyplikatywnej <math>\mathrm F_q^*</math> tego ciała jest kwadratem elementu <math>\beta \in \mathrm F_q^*,</math> czyli <math>\beta ^2 = \alpha,</math> to także <math>(-\beta)^2 = \alpha.</math> Ponieważ <math>\chi (\mathrm F_q) \neq 2</math> i <math>\beta \neq 0,</math> to <math>\beta \neq -\beta.</math> Stąd wynika, że jeżeli <math>\alpha \in \mathrm F_q^*</math> jest kwadratem, to ma dokładnie dwa pierwiastki drugiego stopnia, gdyż równanie <math>x^2 - \alpha = 0</math> nie może mieć więcej niż dwa rozwiązania. Pierwiastki tworzą parę elementów wzajemnie przeciwnych. Kwadraty w <math>\mathrm F_q^*</math> stanowią więc dokładnie połowę elementów tej grupy, bo jest ich tyle, ile jest par elementów wzajemnie przeciwnych, czyli <math>(q-1)/2.</math></ref>
: <math>1^2 = (-1)^2 = 1</math>
.<br />
: <math>1i^2 = (-1i)^2 = -1</math><br />
: <math>(1 + i)^2 = (-1 - i)^2 = 1 + 2i - 1 = 2i = -i</math><br />
: <math>(1 +- i)^2 = (-1 -+ i)^2 = 1 +- 2i - 1 = -2i = -i</math><br />.
 
<math>(1 - i)^2 = (-1 + i)^2 = 1 - 2i - 1 = -2i = i</math><br />
Zatem kwadratami są prawe strony tych równości: <math>1, -1, i, -i,</math> a w całym <math>\mathrm F_9</math> jeszcze <math>0.</math><br />
 
To umożliwia już zastosowanie [[#Stopnie 1 i 2|wzorów]] na pierwiastki.<br />
To umożliwia już zastosowanie [[#Stopnie 1 i 2|wzorów]] na pierwiastki.
<math>\Delta = \Delta_2 (a,b,c) = b^2 - 4ac = b^2 - ac,</math><br />
: <math>\Delta = \Delta_2 (a,b,c) = b^2 - 4ac = b^2 - ac,</math>
: <math>x_{1,2} = \frac{-b \pm \sqrt\Delta}{2a} = \frac{-b \pm \sqrt\Delta}{-a} = -\frac{-b \pm \sqrt\Delta}{a} = \frac{b \pm \sqrt\Delta}{a}.</math><br />
 
Otrzymane wzory na wyróżnik i pierwiastki
: <math>\Delta = b^2 - ac, \qquad x_{1,2} = \frac{b \pm \sqrt \Delta}{a}</math>
 
stosują się w każdym ciele o charakterystyce 3 (także nieskończonym).<br />
stosują się w każdym ciele o charakterystyce 3 (także nieskończonym).
Dla danego wielomianu mamy <math>\Delta = i^2 - i(1+i) = -1 - i +1 = -i,</math> skąd wnioskujemy, że ma on pierwiastki w <math>\mathrm F_9,</math> bo <math>-i</math> jest kwadratem. Jako pierwiastek arytmetyczny z wyróżnika weźmy dowolny z pary, np. <math>1 + i.</math><br />
 
<math>x_1 = \frac{i + 1 + i}{i} = \frac{1 + 2i}{i} = -i(1-i) = -1 - i, \quad x_2 = \frac{i - 1 - i}{i} = \frac{-1}{i} = i</math><br />
Dla danego wielomianu mamy <math>\Delta = i^2 - i(1+i) = -1 - i +1 = -i,</math> skąd wnioskujemy, że ma on pierwiastki w <math>\mathrm F_9,</math> bo <math>-i</math> jest kwadratem. Jako pierwiastek arytmetyczny z wyróżnika weźmy dowolny z pary, np. <math>1 + i.</math>
i otrzymujemy rozkład wielomianu: <math>i(x - i)(x + 1 + i).</math><br />
: <math>x_1 = \frac{i + 1 + i}{i} = \frac{1 + 2i}{i} = -i(1-i) = -1 - i, \quad x_2 = \frac{i - 1 - i}{i} = \frac{-1}{i} = i</math>
 
i otrzymujemy rozkład wielomianu: <math>i(x - i)(x + 1 + i).</math>
 
Ten przykład przedstawia jedno z zastosowań wyróżnika. Droga do rozwiązania równania kwadratowego wiedzie poprzez obliczenie odpowiedniego wyróżnika i znalezienie jego pierwiastka arytmetycznego.
 
Linia 2156 ⟶ 2200:
Wypiszmy dla wygody rachunków [[#Inne przykłady|wzór]] na wyróżnik trójmianu
<math>D(a x^n + b x^m + c) = (-1)^ \frac{n(n - 1)}{2} a^{(n - m - 1)} c^{(m - 1)} \left(n^{n_1} a^{m_1} c^{n_1 - m_1} + s m^{m_1} b^{n_1}\right)^d,</math><br />
gdzie <math>d = (n, m), \quad n = n_1 d, \quad m = m_1 d, \quad s = (-1)^{n_1 + 1} (n - m)^{n_1 - m_1},\ </math>i obliczmy wyróżnik trójmianu <math>a x^6 + b x^3 + c.</math><br />
 
Mamy tutaj <math>n = 6, \quad m = 3, \quad d = (6,3) = 3, \quad n_1 = 2, \quad m_1 = 1, \quad s = - (6 - 3)^{2 - 1} = - 3, \ </math>więc<br />
Mamy tutaj <math>n = 6, \quad m = 3, \quad d = (6,3) = 3, \quad n_1 = 2, \quad m_1 = 1, \quad s = - (6 - 3)^{2 - 1} = - 3, \ </math>więc
<math>\begin{align}
: <math>\begin{align}
& D(a x^6 + b x^3 + c) = - a^2c^2 \big(6^2 ac - 3 \cdot 3^1 b^2 \big)^3 = - a^2c^2 \big(6^2 ac - 3^2 b^2 \big)^3 = - 3^6 a^2c^2 \big(4 ac - b^2\big)^3\\
& = - 729 a^2c^2 \big(64 a^3c^3 - 48 a^2b^2c^2 + 12 ab^4c - b^6 \big)\\
Linia 2164 ⟶ 2209:
\end{align}</math>
 
Możemy też skorzystać z pełnego wyróżnika w [[#Wyróżniki wielomianów stopni od 1 do 6|tabeli]] z wyróżnikiem wielomianu 6 stopnia. Dostosujmy oznaczenia współczynników danego wielomianu do oznaczeń w tabeli (nie odwrotnie!). <math>D(a x^6 + d x^3 + g) = \Delta_6(a,0,0,d,0,0,g).</math><br />

Po odrzuceniu składników, w których występuje współczynnik <math>b,c,e</math> lub <math>f,</math> pozostają tylko 4 składniki o numerach porządkowych 1, 5, 37 i 107, a wynik jest identyczny.
 
== Zobacz też ==