Corrélation de données à répartition normale et non normale
Répondre à la discussion
Affichage des résultats 1 à 8 sur 8

Corrélation de données à répartition normale et non normale



  1. #1
    marjo92blabla

    Corrélation de données à répartition normale et non normale


    ------

    Bonjour,

    Voilà j'ai un petit problème, je voudrais étudier la corrélation de différentes variables mais les données de l'une d'entre elle ne suit pas une loi normale. Je ne sais donc pas quel test utiliser sachant que toutes les autres suivent une loi normale. Spearman pour du non paramétrique ou Pearson pour du paramétrique mais s'il y a un peu des deux ... ? Spearman ?

    -----

  2. #2
    gg0
    Animateur Mathématiques

    Re : Corrélation de données à répartition normale et non normale

    Bonjour.

    La Normalité des données n'est pas du tout nécessaire lorsqu'on veut mettre en évidence des corrélations. Heureusement, sinon l'analyse de corrélation serait bien limitée !!
    En fait, ce que l'on suppose gaussien, c'est l'erreur du modèle. Par exemple, pour deux variables, le modèle est Y=aX+b+e où e est une variable aléatoire Normale.
    Quant au type de test à utiliser, il dépend fortement de tes données, de la volonté de les analyser ensemble ou 2 à 2 (*), des modèles que la réflexion non statistique semble promouvoir, etc.

    Cordialement.

    (*) attention, multiplier les tests conduit souvent à des résultats significatifs par erreur. Le risque augmente rapidement avec le nombre de tests.

  3. #3
    marjo92blabla

    Re : Corrélation de données à répartition normale et non normale

    Merci encore à toi !

    Par contre tu dis que le type de test dépend de ce que je veux analyser, si je veux analyser les données ensemble ou pas, mais je ne vois pas la différence. Par exemple, si je veux analyser une corrélation de l'âge et de la motivation avec l'assiduité. Je peux très bien analyser la corrélation âge/assiduité d'un côté et motivation/assiduité de l'autre mais également analyser les 3 ensemble simplement pour aller plus vite dans mes calculs ? Sachant que la corrélation âge/motivation ne m'intéresse pas admettons.

    Et dans ce cas, si l'âge et la motivation suivent une loi normale mais pas l'assiduité, quel test me conseillerais-tu ?

  4. #4
    gg0
    Animateur Mathématiques

    Re : Corrélation de données à répartition normale et non normale

    Encore une fois, en corrélation, la Normalité on s'en moque.

    Comme tu ne parles pas du modèle que tu veux utiliser, je ne vois pas comment te conseiller : Je ne sais pas comment sont tes variables (numériques, vu les outils que tu veux utiliser, mais vraiment quantitatives ? Ou seulement des échelles, voire des codages numériques ?).

  5. A voir en vidéo sur Futura
  6. #5
    minushabens

    Re : Corrélation de données à répartition normale et non normale

    Je nuancerais la réponse qu'à faite gg0. Pour un couple de variables aléatoires normales, leur loi conjointe est déterminée par leur matrice de variance, autrement dit par les variances des lois marginales et la corrélation. En termes non mathématiques, si on connaît la corrélation entre deux variables normales on sait tout ce qu'il y a à savoir de leur relation. Pour des variables non normales on peut bien sûr calculer leur coefficient de corrélation, mais une part de la relation entre ces variables peut se cacher ailleurs.

  7. #6
    gg0
    Animateur Mathématiques

    Re : Corrélation de données à répartition normale et non normale

    Effectivement, Minushabens.

    C'est vrai pour des variables aléatoires, mais les variables statistiques ont le grand défaut de n'être généralement gaussiennes que par approximation plus ou moins forte. Ne serait-ce que parce que les données recueillies ont le gros défaut d'être des arrondis à peu de chiffres significatifs, donc fondamentalement discrètes. Et que rares sont les valeurs utilisées qui ne sont pas positives (la loi Normale ne l'est jamais -sauf cas limite de variance nulle).

    Cependant, mon insistance vient du fait qu'on peut faire de l'analyse de régression avec des variables pas du tout Normales (des dates régulièrement échelonnées, par exemple) et de la constatation que certains enseignements de "statistiques" (pour des psychologues, des médecins, et quelques autres) surestiment l'importance de la Normalité, l'imposant même quand elle n'a pas grand chose à faire, demandant systématiquement ces tests de Normalité qui ne prouvent rien, et oubliant qu'avant de faire un test de Normalité, on peut se demander de quoi on parle.

    Cordialement.

  8. #7
    minushabens

    Re : Corrélation de données à répartition normale et non normale

    La question de la régression est un peu différent de celle du coefficient de corrélation. Effectivement le théorème de Gauss Markov dit que l'estimateur des moindres carrés de la régression converge quelle que soit la loi des résidus sous les simples hypothèses d'indépendance et de finitude de la variance, mais sans la normalité les Chi2 ne sont plus des Chi2, les F des F et l'analyse de la variance peut être fallacieuse. Au passage on s'en moque que les variables mesurées soient positives, ce sont les résidus qui sont supposés normaux et eux sont par nature positifs et négatifs.

  9. #8
    gg0
    Animateur Mathématiques

    Re : Corrélation de données à répartition normale et non normale

    Minushabens,

    tu confirmes ce que je disais à la fin de ton message, en redisant que la Normalité des variables n'a pas de nécessité. Comme ce n'est pas la première fois que tu interviens sur mes explications sur ce sujet, pourrais-tu lire vraiment les questionnements des auteurs (qui demandent quoi faire quand les variables échouent aux tests de Normalité) et ce que je leur répond.

    Cordialement.

    NB : Pour un test de khi-deux non plus, il n'est pas question de Normalité des variables, elles sont qualitatives !!!

Discussions similaires

  1. Loi normale et normalisation des données
    Par invite8c93f715 dans le forum Mathématiques du supérieur
    Réponses: 16
    Dernier message: 13/08/2016, 16h14
  2. Comment trouver l'Équation normale de la droite normale d'un éllipse ?
    Par invite2f4d3616 dans le forum Mathématiques du collège et du lycée
    Réponses: 1
    Dernier message: 11/10/2015, 03h37
  3. Fonction de Répartition de la loi normale centrée et réduite
    Par invite3404d37a dans le forum Mathématiques du supérieur
    Réponses: 3
    Dernier message: 28/01/2011, 15h32
  4. simulation de données avec loi normale
    Par invite1ef601cb dans le forum Logiciel - Software - Open Source
    Réponses: 1
    Dernier message: 23/06/2010, 14h46
  5. jeu de donnees et loi normale sous Statistica?
    Par invite28b3db07 dans le forum Logiciel - Software - Open Source
    Réponses: 0
    Dernier message: 16/04/2008, 08h27