Statistiques en Biologie : corrélation
Répondre à la discussion
Affichage des résultats 1 à 3 sur 3

Statistiques en Biologie : corrélation



  1. #1
    gael

    Statistiques en Biologie : corrélation


    ------

    Bonjour,

    Je suis biologiste (donc nul en maths !) et j'ai une question sur les statistiques dans le cadre du étude que je mène actuellement.
    J'essaye de mettre en relation des épisodes de développement de plancton avec des facteurs climatiques et des polluants apportés par les rivières. J'ai donc un jeu de 18 variables avec 30 données par variable. Par exemple j'ai une variable concentration en plancton, une variable pluviométrie,une variable concentration en nitrates dans la rivière, etc.

    Pour faire des liens entre ces variables, j'ai repéré 3 outils de statistique multivariée :

    - L'analyse en composante principale (ACP), couplée avec une matrice des coefficients de corrélation de Pearson
    - La régression linéaire multiple (RLM).
    - Le modèle linéaire généralisé, que je ne maîtrise pas du tout.

    Je précise que mes données sont d'une très forte variabilité.
    J'ai essayé l'ACP et mes axes n'expliquent que peu la variabilité des résultats (45 % pour les 2 axes). Les coefficients de corrélation ne sont pas folichons (0.49 pour le meilleur).
    J'ai essayé la RLM et c'est encore pire. On obtient pas les mêmes coefficients de corrélation que pour l'ACP. Ils sont divisés par 10 !

    Je voudrais savoir quelle est la différence entre les coefficients de corrélation de Pearson et ceux calculés par le RLM ? Par exemple, le coeff entre 2 variables vaut 0.49 pour la méthode Pearson mais ne vaut plus que 0.04 pour la RLM ! Quelle méthode utliser ?

    Merci de votre aide.

    -----

  2. #2
    gael

    Re : Statistiques en Biologie : corrélation

    Bonjour,
    Devant l'absence de réponse, je me permets de préciser et simplifier ma question.

    Si je prends uniquement 2 variables.

    - 1er cas : en traçant un nuage de points sur Excel et en y traçant une courbe de tendance linéaire, on obtient un r² de 0.48

    - 2è cas : avec R, en faisant une matrice de corrélation (type Pearson) entre ces deux mêmes variables, on obtient un r² de 0.22.

    Je voudrais savoir pourquoi y a t il de telles différences entre les 2 coefficients de corrélation ? Lequel utiliser ?

    Merci.

  3. #3
    mike.p

    Re : Statistiques en Biologie : corrélation

    Salut,

    Comme personne ne voudra laisser un fil avec une réponse trop vague ou imprécise, vous finirez par avoir votre réponse :

    Pearson et RLM adressent des contextes différents. Leurs coefficients peuvent être différents mais sont corrélés.

    Dans le 1er cas, il s'agit de relevés ( mesures échantillonnées dans des distributions gaussiennes ) de toutes les observables dont on mesure la capacité de varier ensemble par des indices de corrélations de Pearson r , variant de -1 à 1. Ces corrélations sont commutatives, peu importe l'ordre des variables étudiées. Normalement, c'est votre outil principal. Si ça ne donne rien, ce ne sont peut être pas des relations linéaires. Il faut alors explorer l'utilisation des corrélations de Spearman.

    Dans le second cas, on mesure une variable en fonction d'un ou plusieurs paramètres choisis. Ces derniers ne résultent normalement pas d'un échantillonage. La RLM est plus un outil pour extrapoler la valeur de la fonction ( ou de fitting ) qu'un outil de corrélation. Il fournit un indice de qualité de la prédiction. Quand il y a plusieurs variables, cela aide à trouver les plus caractéristiques. Les Rlm ne sont pas commutatives 2 fois. Les arguments de la fonction et le résultat ne jouant pas un rôle symétrique, ils ne sont pas interchangeables. De plus, les résultats numériques seraient différents.
    quand on ne sait pas, il faut demander

Discussions similaires

  1. Statistiques : Quel test pour cette corrélation ?
    Par Pauline1016 dans le forum Mathématiques du supérieur
    Réponses: 5
    Dernier message: 02/05/2015, 14h01
  2. Statistiques : Echantillons dépendants ou indépendants ?Statistiques
    Par sitingbull dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 14/04/2015, 16h01
  3. [statistiques] corrélation variables iid
    Par invite20743174 dans le forum Mathématiques du supérieur
    Réponses: 7
    Dernier message: 08/03/2012, 12h33
  4. Statistiques en biologie
    Par invite28d01b55 dans le forum Biologie
    Réponses: 5
    Dernier message: 25/08/2011, 21h02
  5. [Divers] Statistiques en biologie
    Par invited6a4f9c7 dans le forum Biologie
    Réponses: 4
    Dernier message: 18/02/2008, 02h13