Bonjour,
(désolé si ce n'est pas le forum le mieux adapté - je découvre...)
J'ai un petit problème dans l'analyse de données qui est le but principal de mon stage (école d'ingénieurs - première année) :
j'ai des réponses, bref des variables : 22, quantitatives pour, disons, 20 situations.
il y a donc 22 résultats par situation.
tout ça me fait une jolie matrice, et le gentil SPSS me fait une ACP sans broncher, sauf que 22 variables c'est réductible mais pas tant que ça : grosso modo j'ai 3/4/5 valeurs propres intéressantes selon les cas, avec donc pas mal de perte d'information quand je projette sur 2 axes.
ce que je voudrais faire, c'est réduire les variables sur un nombre limité d'axes, en faisant des regroupements de variables fortement corrélées expérimentalement (corrélations qui ont un sens, heureusement). J'ai donc exploré le monde de la classification hiérarchique et fait quelques manips avec SPSS toujours. mais je n'obtiens pas exactement ce que je veux : j'ai une certaine classification (mon indice de regroupement est le coefficient de Pearson, l'agrégation se fait sur la distance intra-groupe) mais je voudrais avoir plus :
l'idéal, ce serait un regroupement par pourcentage de l'inertie expliquée par le premier axe d'une ACP faite sur les variables regroupées à chaque étape : comme ça je pourrais avoir une vraie information au moment de choisir mes "paquets" de variables.
Mes questions sont donc :
- existe-t-il un moyen de faire une telle classification (dans SPSS, par exemple...) ? (sinon je peux essayer de faire ça "à la main" en utilisant un truc du genre scilab, mais je n'ai plus trop de temps devant moi...)
- je pense "sentir" qu'utiliser le coefficient de corrélation de Pearson va dans ce sens, mais est-ce vrai ?
- surtout, est-ce que çela paraît cohérent comme démarche ?
- si vous avez des documents, liens, qui vous semblent en rapport, je veux bien... (j'ai cherché sur la fouille de données alias exploration statistique alias data mining, mais sur un regroupement de variables sans utiliser d'ACP j'ai pas grand chose)
Enfin, une précision : j'essaie de trouver un moyen plus "orienté" de regroupement qu'une ACP pour pouvoir garder un lien fort avec la signification de mes variables, c'est vraiment le point important...
Merci...
-----