Aide réalisation ACP, tri des variables
Répondre à la discussion
Affichage des résultats 1 à 10 sur 10

Aide réalisation ACP, tri des variables



  1. #1
    zoukaydi

    Question Aide réalisation ACP, tri des variables


    ------

    Bonjour à tous,

    Je dois actuellement réaliser une ACP pour mon mémoire. Le thème est le dynamisme des espaces ruraux.

    Mon but est d'analyser les communes rurales du département de l'Indre (au nombre de 234) et d'en déterminer les dynamiques. J'ai sélectionné 31 variables dans différentes catégories (démographie, activité économique, accessibilité, équipements...), il s'agit d'indicateurs descriptifs des communes. Mon ACP est donc de 234 individus et 31 variables.

    Le problème est que l'inertie expliquée par les composantes principales est trop faible (à peine de l'ordre de 30% cumulée pour les trois premiers axes).

    Pour améliorer l'inertie expliquée, j'essaye de réduire les variables utilisées, si j'ai bien compris il s'agit de supprimer les variables trop corrélées entre elles (ce qui veut dire que une variable suffit à en résumer d'autres ou est inductrice des autres).

    J'utilise donc la matrice de corrélation et en observant les indice de corrélation >0,5 ou <-0,5, je peux effectivement supprimer quelques variables qui sont potentiellement décrites par d'autres, je supprime donc 8 variables. A noter que cette suppression n'est pas véritablement rigoureuse pour moi car quand bien même deux variables sont corrélées il n'est pas évident de savoir laquelle conserver. En relancant l'ACP, l'inertie obtenue n'est pas beaucoup mieux.

    En faisant des recherches, je trouve le test KMO, qui permet lui de supprimer des variables qui n'ont pas assez de sens, en effectuant ce test sur ma matrice de corrélation, je peux supprimer une dizaine de variables dont la valeur MSA du KMO<0,5 (seuil trouvé sur internet comme inacceptable). En relancant l'ACP, l'inertie n'est toujours pas satisfaisante.

    Je pense que j'ai peut être mal compris les méthodes de suppression de variables, je suis perdue entre "les variables doivent être corrélées pour que l'ACP ait un intérêt" et "si les variables sont trop corrélées, la précision de l'ACP est réduite".

    Je sais pas si vous avez réussi à me suivre, (si oui merci!) mais pour résumer la question que je me pose c'est : comment savoir quelles variables supprimer pour améliorer l'inertie de l'ACP, et comment les supprimer ?

    Je vous remercie!

    -----

  2. #2
    MissJenny

    Re : Aide réalisation ACP, tri des variables

    Citation Envoyé par zoukaydi Voir le message
    Le problème est que l'inertie expliquée par les composantes principales est trop faible (à peine de l'ordre de 30% cumulée pour les trois premiers axes).

    Pour améliorer l'inertie expliquée, j'essaye de réduire les variables utilisées, si j'ai bien compris il s'agit de supprimer les variables trop corrélées entre elles (ce qui veut dire que une variable suffit à en résumer d'autres ou est inductrice des autres).
    excuse ma franchise mais ce que tu proposes n'a aucun intérêt. Tu réduis l'information contenue dans des 31 variables en ne considérant que les 3 premières composantes principales. Le pourcentage d'inertie expliquée est une mesure de cette réduction d'information. Si tu considères un sous-ensemble des 31 variables, il y aura encore moins d'information dans les 3 premières composantes principales de la nouvelle analyse. Peut-être que le pourcentage d'intertie sera supérieur à 30% mais tu auras perdu de l'information.

  3. #3
    gg0
    Animateur Mathématiques

    Re : Aide réalisation ACP, tri des variables

    Euh ... on perd très peu d'information en supprimant des variables très corrélées à celles qui restent. Bien évidemment, il faut y aller avec précaution.
    Par contre, si on a fait très sérieusement le choix des variables d'intérêt au départ, le fait que les principales variables sont peu explicatives est un véritable problème, qui ne disparaitra pas en réduisant les variables. Comme toujours en stats, on peut "améliorer les résultats" en perdant de la validité de l'étude. Une réétude des variables choisies peu parfois permettre de ne retenir que les plus utiles; et la conclusion que l'étude finalement n'apporte pas grand chose doit toujours être envisagée ...

    Cordialement.

  4. #4
    zoukaydi

    Re : Aide réalisation ACP, tri des variables

    Merci pour votre réponse. Je vais considérer de réétudier le choix des variables initiales.

    Pensez-vous que c'est une bonne idée de construire l'ACP sur un nombre plus réduit et moins varié de variables (pour avoir une bonne inertie) et d'utiliser les autres variables en tant qu'illustratives, qui ne servent donc pas à la construction des axes mais qui aident à l'interprétation ? Ou alors on perd l'intérêt de l'ACP ?

    Dans mon exemple, si je réalise une ACP sur la dynamique démographique, je pourrai classer les communes selon un gradient du plus au moins dynamique (avec une inertie plutôt bonne), et réaliser l'interprétation en regardant comment se positionnent les variables illustratives d'activité économique, d'accessibilité, etc...

    Bien cordialement

  5. A voir en vidéo sur Futura
  6. #5
    zoukaydi

    Re : Aide réalisation ACP, tri des variables

    Merci pour votre réponse @Missjenny.
    Le but de mon ACP est bel et bien de réduire l'information. Le problème que je rencontre, d'où mon message sur le forum, est plutôt par rapport aux variables choisies.
    Je pense qu'il est possible de minimiser la réduction d'information si les variables sont choisies de manière adéquate, ni trop corrélées, ni trop peu.
    C'est le choix SUBJECTIF des variables qui induit l'inertie. Si j'avais par exemple, 31 variables traitant de la même thématique, l'inertie serait probablement meilleure. A l'inverse si mes 31 variables sont trop variées et ne sont pas suffisamment représentatives de la structure sous-jacente des données, l'inertie sera très faible.

    Mes 31 variables sont donc subjectives (et évidemment non exhaustives) et mon objectif et des les trier de manière à ce qu'elles soient le plus représentatives possibles, en supprimant l'information oui, mais l'information non pertinente et non représentative.

    Cordialement.

  7. #6
    MissJenny

    Re : Aide réalisation ACP, tri des variables

    si tu as 12 pommes dans un sac, 4 mauvaises, 4 moyennes et 4 bonnes. Tu as un algorithme qui identifie les bonnes pommes, tu le fais tourner, il identifie correctement les 4 bonnes pommes, mais tu n'es pas content parce que n'as que 33% de bonnes pommes dans ton sac. Donc tu utilises un autre algorithme qui lui identifie les mauvaises pommes. Tu le fais tourner et il identifie correctement les 4 mauvaises pommes. Tu les élimines puis tu relances ton premier algorithme qui retrouve les 4 bonnes pommes. Donc tu es content parce que maintenant tu as 50% de bonnes pommes. Cependant, tu as toujours 4 bonnes pommes, tu n'as rien gagné (voire un peu perdu si les mauvaises pommes n'étaient pas si mauvaises).

  8. #7
    zoukaydi

    Re : Aide réalisation ACP, tri des variables

    si tu as 12 pommes dans un sac, 4 mauvaises, 4 moyennes et 4 bonnes. Tu as un algorithme qui identifie les bonnes pommes, tu le fais tourner, il identifie correctement les 4 bonnes pommes, mais tu n'es pas content parce que n'as que 33% de bonnes pommes dans ton sac. Donc tu utilises un autre algorithme qui lui identifie les mauvaises pommes. Tu le fais tourner et il identifie correctement les 4 mauvaises pommes. Tu les élimines puis tu relances ton premier algorithme qui retrouve les 4 bonnes pommes. Donc tu es content parce que maintenant tu as 50% de bonnes pommes. Cependant, tu as toujours 4 bonnes pommes, tu n'as rien gagné (voire un peu perdu si les mauvaises pommes n'étaient pas si mauvaises).
    Je vous remercie et comprends le raisonnement mais je ne vois pas le lien avec l'ACP puisqu'il n'est pas question ici d'intervenir sur les individus mais sur les variables.

  9. #8
    MissJenny

    Re : Aide réalisation ACP, tri des variables

    les pommes sont les variables.

  10. #9
    zoukaydi

    Re : Aide réalisation ACP, tri des variables

    Vous pensez donc que ce que je propose n'a aucun intérêt parce je veux réduire les variables (et donc perdre de l'information) ou parce que l'utilisation de l'ACP n'est pas intéressante dans mon cas d'étude (puisque n'explique pas beaucoup d'inertie) ?

  11. #10
    MissJenny

    Re : Aide réalisation ACP, tri des variables

    je pense qu'en éliminant les variables redondantes tu ne vas pas gagner, tu devrais retrouver à peu près la même ACP.

Discussions similaires

  1. [Outils/Fab/Comp] Aide réalisation Gerber
    Par Antoine8082 dans le forum Électronique
    Réponses: 56
    Dernier message: 09/03/2021, 17h21
  2. Aide pour une réalisation
    Par invite7392819b dans le forum Électronique
    Réponses: 8
    Dernier message: 20/08/2008, 17h30
  3. [PIC]-Aide déclaration variables
    Par invite3c35244f dans le forum Électronique
    Réponses: 17
    Dernier message: 03/06/2008, 10h36
  4. de l'aide sur cet exo (Variables aléatoires)
    Par inviteaefa054c dans le forum Mathématiques du supérieur
    Réponses: 3
    Dernier message: 28/07/2006, 19h07
  5. Aide sur les variables d'un PIC
    Par invite83652f77 dans le forum Électronique
    Réponses: 4
    Dernier message: 12/06/2006, 19h17