Bonsoir,
Je suis en train de faire ma premiere Analyse en Composantes Principales et je n'arrive pas à comprendre où je me plante :
énoncé :
On s'intéresse au prix de 3 produits de base x_1,x_2,x_3 dans 4 magasins. On résume les données ds le tableau suivant :
On ne souhaite pas dans un premier temps utiliser les données du 4eme magasin. Cela revient à considerer les poids : p_1=p_2=p_3=1/3 et p_4=0
1/calculer les moyennes de x_1,x_2,x_3 et les variances s_1²,s_2²,s_3²
bon ça ok, ça va
2/Développer l'ACP sur les données centrees réduites (toujours avec p_4=0). c-à-d déterminer la matrice des corrélations, ses valeurs propres et les axes factoriels
Je n'arrive pas à trouver la matrice des corrélations en utilisant le calcul matriciel.
J'ai centré mes données : j'ai retranché la moyenne de x_i sur la colonne x_i. Cela m'a donné une matrice Y
J'ai choisi la matrice du produit scalaire M=diag(1/s_i ²) pour i de 1 à 3(donc pas besoin de réduire les données)
Pour D j'ai choisi D=diag(p_i) pour i de 1 à 4
Et qd je calcule la matrice d'inertie (qui est la matrice des coeff de corrélation) : transposée(Y)DYM je ne trouve pas une matrice symétrique, et de plus certains coeff de corrélation ne sont pas compris entre -1 et 1. Donc le résultat est clairement faux ! Pourquoi ????
J'ai fait les calculs matriciel à la calculette, donc à priori pas d'erreur de calcul, plutot une erreur de raisonnement.
Merci de votre precieuse collaboration
-----