bonjour à touss,
je voudrais faire une ACP sur mes données.
Je veux expliquer le taux d'alcolémie de 150 personnes en fonction par exemple de leur âge, sexe, quel vin elles ont consommé, etc...
J'ai transformé quelques données qualitatives en données quantitatives à l'aide de variables "dummies" (exemple sexe H/F codé en 0/1) comme Vin={Rouge,Rosé,Blanc} par:
d1 d2
Rouge 1 0
Rosé 0 1
Blanc 0 0
J'ai deux questions:
1) je choisis une ACP normée, à partir de là dois-je centrer et réduire mes variables qui viennent d'être codées 0 et 1 ou je ne centre et réduit uniquement les quantitatives ?
2) mon modèle pourrait être à la fin:
taux_alcolémie=[b0+b1.d0]+[b2+b3.d1+b4.d2]
où b0,b1,b2,b4 me seront donnés par les vecteurs propres et d0 dummy de sexe et d1,d2 dummy du vin.
Qu'en pensez vous ? Merci à tous de vos réponses.
(ps je ne cherche pas à discuter le choix de l'acp mais juste ces deux doutes que j'ai numérotés ici^^)
Théo
-----