Bonjour, je n´arrive pas à saisir le raisonnement de l´analyse de la variance à un facteur expliqué dans mon cours de statistique mathématique. Je vous explique d´abord ce que j´ai compris.
J´ai un un modèle linéaire Y = X.B + E
Y et E sont des vecteurs aléatoires de dimention n Y = (Y1,...,Yn)t.
B un vecteur aléatoire de dimension p: B = (B1,...,Bp)t.
X est une matrice de dimenstion nxp
Le vecteur XB est donc de dim n et il est élément d´un sous-espace vectoriel V de dimension p de IRn.
Dire (hypothèse H0) qu´il y a une relation linéaire dans les éléments de B (par exemple B1 = B2 = B3), c´est dire qu´il ya un système de k équations linéaires liant les éléments de B, donc que XB est dans un sous-espace vectoriel de V, que j´appelle W, de dimension p-k.
On peut donc décomposer IRn en 3 sous-espaces supplémentaires:
IRn = VT + W + WT. (T voulant dire "orthogonal".)
Le vecteur aléatoire E se décompose alors aussi en 3 vecteurs eT de dimension n-p, e1 de dimension p-k et e2 de dimension k.
On peut alors considérer deux estimateurs des moindres carrés de B:
- l´estimateur usuel Ba avec XBa = XB + e1 + e2 et la somme des carrés des résidus D2(Y,Ba) = [Norm(eT)]2.
- l´estimateur Bb des moindres carrés sous H0 avec XBb = XB + e1 et donc D2(Y,Bb) = [Norm(eT)]2 + [Norm(e2]2
Donc sous l´hypothèse H0 et en vertu du théorème de Cochran, D2(Y,Bb)- D2(Y,Ba) et D2(Y,Ba) sont indépendantes et par le même théorème:
-----