Załóżmy, że
U
1
,
U
2
,
…
,
U
n
{\displaystyle U_{1},U_{2},\dots ,U_{n}}
są niezależnymi zmiennymi losowymi o rozkładach normalnych . Rozważmy równość
∑
i
=
1
n
U
i
2
=
Q
1
+
⋯
+
Q
k
,
{\displaystyle \sum _{i=1}^{n}~U_{i}^{2}=Q_{1}+\dots +Q_{k},}
gdzie
Q
i
{\displaystyle Q_{i}}
są sumami kwadratów kombinacji liniowych zmiennych
U
i
,
{\displaystyle U_{i},}
takimi że
r
i
+
⋯
+
r
k
=
n
,
{\displaystyle r_{i}+\dots +r_{k}=n,}
gdzie
r
i
{\displaystyle r_{i}}
są rzędami
Q
i
.
{\displaystyle Q_{i}.}
Jeśli
X
1
,
…
,
X
n
{\displaystyle X_{1},\dots ,X_{n}}
są niezależnymi zmiennymi losowymi o rozkładzie normalnym ze średnią
μ
{\displaystyle \mu }
i odchyleniem standardowym
σ
,
{\displaystyle \sigma ,}
wtedy
U
i
=
X
i
−
μ
σ
{\displaystyle U_{i}={\frac {X_{i}-\mu }{\sigma }}}
ma standardowy rozkład normalny dla każdego
i
.
{\displaystyle i.}
Możemy zapisać:
∑
i
=
1
n
(
X
i
−
μ
)
2
=
∑
i
=
1
n
(
X
i
+
X
¯
−
X
¯
−
μ
)
2
=
{\displaystyle \sum _{i=1}^{n}~(X_{i}-\mu )^{2}=\sum _{i=1}^{n}~(X_{i}+{\overline {X}}-{\overline {X}}-\mu )^{2}=}
=
∑
i
=
1
n
(
X
i
−
X
¯
)
2
+
∑
i
=
1
n
(
X
¯
−
μ
)
2
+
2
∑
i
=
1
n
(
X
i
−
X
¯
)
(
X
¯
−
μ
)
.
{\displaystyle =\sum _{i=1}^{n}~(X_{i}-{\overline {X}})^{2}+\sum _{i=1}^{n}~({\overline {X}}-\mu )^{2}+2\sum _{i=1}^{n}~(X_{i}-{\overline {X}})({\overline {X}}-\mu ).}
Trzeci składnik wynosi zero, ponieważ jest równy iloczynowi stałej przez
∑
i
=
1
n
(
X
i
−
X
¯
)
,
{\displaystyle \sum _{i=1}^{n}~(X_{i}-{\overline {X}}),}
natomiast drugi składnik jest sumą
n
{\displaystyle n}
identycznych stałych.
Uwzględniając powyższe i dzieląc strony równości przez
σ
2
,
{\displaystyle \sigma ^{2},}
otrzymujemy:
∑
i
=
1
n
(
X
i
−
μ
σ
)
2
=
∑
i
=
1
n
(
X
i
−
X
¯
σ
)
2
+
n
(
X
¯
−
μ
σ
)
2
=
Q
1
+
Q
2
.
{\displaystyle \sum _{i=1}^{n}~\left({\frac {X_{i}-\mu }{\sigma }}\right)^{2}=\sum _{i=1}^{n}~\left({\frac {X_{i}-{\overline {X}}}{\sigma }}\right)^{2}+n\left({\frac {{\overline {X}}-\mu }{\sigma }}\right)^{2}=Q_{1}+Q_{2}.}
Ranga
Q
2
{\displaystyle Q_{2}}
wynosi
1
{\displaystyle 1}
(jest to kwadrat tylko jednej kombinacji liniowej zmiennych losowych o standardowym rozkładzie normalnym). Ranga
Q
1
{\displaystyle Q_{1}}
być z kolei obliczona jako
n
−
1.
{\displaystyle n-1.}
Spełnione są założenia twierdzenia Cochrana. Twierdzenie Cochrana mówi, że
Q
1
{\displaystyle Q_{1}}
i
Q
2
{\displaystyle Q_{2}}
są niezależnymi zmiennymi losowymi i mają rozkład
χ
2
{\displaystyle \chi ^{2}}
ze stopniami swobody odpowiednio
n
−
1
{\displaystyle n-1}
i
1.
{\displaystyle 1.}
To pokazuje, że średnia z próby i wariancja z próby są niezależnymi zmiennymi losowymi, a także:
(
X
¯
−
μ
)
2
∼
σ
2
n
χ
1
2
.
{\displaystyle ({\overline {X}}-\mu )^{2}\sim {\frac {\sigma ^{2}}{n}}\chi _{1}^{2}.}
Jako estymatora wariancji
σ
2
{\displaystyle \sigma ^{2}}
używa się często:
σ
2
^
=
1
n
∑
(
X
i
−
X
¯
)
2
.
{\displaystyle {\hat {\sigma ^{2}}}={\frac {1}{n}}\sum ~\left(X_{i}-{\overline {X}}\right)^{2}.}
Twierdzenie Cochrana pokazuje, że:
σ
2
^
∼
σ
2
n
χ
n
−
1
2
,
{\displaystyle {\hat {\sigma ^{2}}}\sim {\frac {\sigma ^{2}}{n}}\chi _{n-1}^{2},}
z czego wynika, że wartością oczekiwaną
σ
2
^
{\displaystyle {\hat {\sigma ^{2}}}}
jest
σ
2
n
n
−
1
.
{\displaystyle {\frac {\sigma ^{2}n}{n-1}}.}