Statistique : Indépendance/dépencae, résultats du test
Répondre à la discussion
Affichage des résultats 1 à 13 sur 13

Statistique : Indépendance/dépencae, résultats du test



  1. #1
    MotionGrey

    Statistique : Indépendance/dépencae, résultats du test


    ------

    Bonjour,

    J'essaie de me remettre à jour en statistiques, et je tombe sur la notion de dépendance/indépendance d'une variable.
    Cependant j'en discute avec un professeur, qui m'indique :

    " Le fait de qualifier une variable d'indépendante ou de dépendante relève d'une hypothèse sur les relations causales entre différentes variables. [...]le choix des variables indépendantes et dépendantes détermine les procédures statistiques à appliquer, indépendamment du résulat que le test donnera. Et le résultat ne modifie pas le choix initial de dépendance des variables; il permet simplement de valider ou pas l'hypothèse de départ. "

    J'ai du mal à saisir le concept derrière la dernière phrase.

    ’hypothèse de départ s'appuie sur la relation causale (donc de dépendance) que l'on cherche à démontrer.
    Si le résultat du test valide/invalide l'hypothèse de départ, vous dites qu'il ne valide/invalide pas conséquemment la relation associée à cette hypothèse ?

    Prenons un exemple :

    L'influence de de la dose d'un médicament sur un effet observable qu'il semble avoir. -> Choix dépendance : effet observable / indépendance : dose médicament

    Une hypothèse pourrait être donc que l'augmentation de la dose augmente cet effet observable. -> Hypothèse (c'en est une parmi d'autres, j'entends)

    Si le résultat du test choisi en conséquence montre qu'il n'y a pas de corrélation, cela signifie que l'on ne peut rien dire de plus que "Il n'y pas de relation dose-effet", et qu'on ne peut pas pour autant en conclure l'indépendance de l'effet par rapport à la dose ? (autrement dit que notre choix de dépendance/indépendance des variables était faux ?)

    -----

  2. #2
    gg0
    Animateur Mathématiques

    Re : Statistique : Indépendance/dépencae, résultats du test

    Oui,

    tu as bien compris. Un exemple connu : On sait que la consommation de sel augmente les risques d'hypertension. Et donc on conseille aux hypertendus de consommer moins de sel. Mais les analyses faites au siècle dernier ont montré que la suppression du sel ne diminuait pas les conséquences de l'hypertension. On a ici deux variables dépendantes, mais une relation sans corrélation.

    Autre chose : le mot "dépendance" est utilisé de deux façons chez les statisticiens : Pour la plupart d'entre eux, c'est un lien entre deux variables (ou plus) qui fait que la connaissance de l'une donne des informations sur l'autre ou les autres (à comparer avec la notion de dépendance en probabilités). Pour certains, essentiellement en sciences humaines, on parle de variables dépendantes et de variables indépendantes, par un choix historique de mots mal venu : "indépendante" (au singulier, il n'y a qu'une seule variable) veut dire explicative, "dépendante" veut dire "expliquée". Dans ce deuxième cas, les mots désignent un choix de traitement des variables qui a été décidé par l'expérimentateur, qui cadre le traitement statistique, qui ne peut pas être changé par les résultats, puisqu'ils sont fabriqués avec.

    Cordialement.

  3. #3
    MotionGrey

    Re : Statistique : Indépendance/dépencae, résultats du test

    Bonjour,

    Merci pour la réponse

    " Dans ce deuxième cas, les mots désignent un choix de traitement des variables qui a été décidé par l'expérimentateur, qui cadre le traitement statistique, qui ne peut pas être changé par les résultats, puisqu'ils sont fabriqués avec."

    Si je vous comprends bien, entre guillemets, ce choix relève simplement de la décision de l’abscisse et de l'ordonnée en quelque sorte, c'est un peu arbitraire ?

  4. #4
    gg0
    Animateur Mathématiques

    Re : Statistique : Indépendance/dépencae, résultats du test

    Pas vraiment,

    on ne fait pas des analyses statistiques sans avoir des raisons et des idées. On va par exemple s'interroger si le surpoids a des effets sur l’insertion sociale (exemple fictif). On choisira des variables "indépendantes" (IMC, existence de maladies liées au surpoids, ..) et des variables "dépendantes" (nombre d'amis, chômage ou non, ...). Mais on a déjà en tête d'essayer d'expliquer l'insertion par le poids.

    Cordialement.

  5. A voir en vidéo sur Futura
  6. #5
    MotionGrey

    Re : Statistique : Indépendance/dépencae, résultats du test

    Bonjour,

    Merci, je n’avais pas vu la réponse.

    J'entends que l'on ne fait pas des tests au hasard,
    Mais l'idée, si je comprends, est donc de considérer l'influence de X sur Y.

    Donc X : indépendant, et Y dépendant (de X)

    Ensuite on réalise le test, qui nous dit "Oui, il y a une corrélation" ou "Non, je ne trouve pas de corrélation (sans pourvoir affirmer qu'il n'en existe pas"

    Si suffisamment de tests (notamment pour éliminer tous les biais éventuels) n'arrivent pas en conclure, on peut "supposer" qu'il n'existe pas de corrélation entre le 2 variables.

    Cordialement

  7. #6
    gg0
    Animateur Mathématiques

    Re : Statistique : Indépendance/dépencae, résultats du test

    Bonjour.
    Mais l'idée, si je comprends, est donc de considérer l'influence de X sur Y.
    Si c'est ce qu'on veut, ce ne sont pas les statistiques qu'il faut utiliser. Tout ce qu'on peut voir en statistiques est que les changements d'une variable sont concomitants, de façon généralement floue, à des changements de l'autre. C'est pour cela que les mots "dépendante" et "indépendante" sont mal choisis, d'autant qu'il existe une notion de dépendance en statistiques qui n'a rien à voir (tests de khi-deux, par exemple).
    Et malheureusement, ce que tu dis est bien dans la tête de nombreux utilisateurs de statistiques. Alors qu'il existe de nombreux exemples de corrélations sans relation causale.

    Cordialement.

  8. #7
    MissJenny

    Re : Statistique : Indépendance/dépencae, résultats du test

    Je pense qu'au lieu du couple variable indépendante/variable dépendante il vaut mieux parler de variable explicative/variable expliquée, ou bien de facteur (de risque)/réponse par exemple.

  9. #8
    MotionGrey

    Re : Statistique : Indépendance/dépencae, résultats du test

    J'ai l'impression d'être davantage en train de m'embrouiller plus qu'autre chose.

    L'idée dans ce genre de tests, c'est bien de regarder si une variation d'un paramètre (qu'on a décidé d'appeler variable indépendante) entraine une variation systématique (statistiquement au moins j'imagine) sur un autre paramètre (qu'on a décidé d'appeler variable indépendante), non ? (en émettant une hypothèse sur l'éventuelle causalité)
    Ensuite le test statistique nous indique seulement s'il y a une corrélation entre les 2, sans pour autant prouver une causalité (la causalité est-elle supposé à partir d'un nombre de tests positifs à la corrélation suffisamenet élevés ?)

    Merci

  10. #9
    MissJenny

    Re : Statistique : Indépendance/dépencae, résultats du test

    Je ne dirais pas ça comme ça. Quand tu veux étudier la relation entre deux variables mesurées sur les mêmes individus (au sens statistique) tu peux les considérer de manière symétrique (c'est ce qu'implique le mot corrélation) mais tu peux aussi faire un acte de modélisation et décider de considérer que les variations de l'une expliquent les variations de l'autre. Cet acte est peut-être ce qui fait qu'un statisticien ou un épidémiologiste ne sont pas des mathématiciens.

    En principe dans un modèle linéaire la variable explicative X est supposée non aléatoire, et on devrait même pouvoir fixer les valeurs de X. Mais le modèle linéaire est beaucoup utilisé dans un cadre non expérimental, où X est observé, de même que la variable expliquée Y.

    Parfois choisir qui est X et qui est Y est un peu arbitraire. Si on n'a aucune raison de choisir l'une plutôt que l'autre il vaut sans-doute mieux en rester à une approche symétrique. Mais d'autres fois ce choix est évident. Si par exemple je m'intéresse à la relation entre âge et gravité du covid, je vais recruter des patients de tous âges. L'âge ne sera pas fixé expérimentalement, il sera simplement observé. La gravité de la maladie (peut-être exprimée en nombre de jours d'hospitalisation, ou de façon binaire, etc) sera aussi observée. Mais il est clair que s'il y a une relation causale elle ne peut être que dans le sens âge => gravité, le contraire n'aurait pas de sens (être malade ne modifie pas l'âge). Donc c'est logique d'employer un modèle linéaire où l'âge est le X et la gravité le Y, ou éventuellement un modèle logistique si la gravité est codée de façon binaire.

  11. #10
    gg0
    Animateur Mathématiques

    Re : Statistique : Indépendance/dépencae, résultats du test

    Attention aussi à ne pas confondre test et analyse de corrélation. L'analyse de corrélation est seulement descriptive, mais ne fait pas d'hypothèse statistique au départ.
    MG : "la causalité est-elle supposé à partir d'un nombre de tests positifs à la corrélation suffisamment élevés ?" Non, je l'ai dit, la mise en évidence d'une causalité n'est pas du ressort de l'analyse statistique.
    Rappel : Il y avait, dans les années 1950, en France, une forte corrélation entre la fécondité féminine par département et le nombre de curés dans ces département. Y vois-tu une causalité ? Par contre il y a une explication, qui est que une forte pratique catholique était liée à un plus grand nombre d'enfants dans les familles, et aussi à la présence de nombreux curés.
    De même, une enquête des années 1970 sur les enfants du Middle West américain montrait une forte corrélation entre le QI et la consommation totale de sucre. Je te laisse trouver l'explication, non causale évidemment.

    Cordialement.

  12. #11
    MotionGrey

    Re : Statistique : Indépendance/dépencae, résultats du test

    La brume s'épaissit....

    Donc au final, les tests nous apportent quelle information ?

    Puisque s'ils sont négatifs, on ne peu pas conclure qu'il n'y a pas de lien, et s'ils sont positifs, on ne peut pas conclure à une causalité non plus...

  13. #12
    gg0
    Animateur Mathématiques

    Re : Statistique : Indépendance/dépencae, résultats du test

    Quels tests ? De quoi parles-tu ?

    Si c'est d'analyse de corrélation (ce n'est pas un test, je te l'ai déjà dit !), ça apporte des informations de corrélation. C'est déjà pas mal ! Les statistiques ne sont pas magiques. L'analyse de corrélation ne dit pas comment les variables sont liées concrètement, elle dit seulement qu'elles évoluent à peu près dans le même sens (corrélation positive), ou dans le sens contraire (corrélation négative), ou indépendamment (pas ou peu de corrélation). Et ça sans rien connaître de ce que sont les données. Donc c'est pas si mal !

  14. #13
    MissJenny

    Re : Statistique : Indépendance/dépencae, résultats du test

    Donc au final, les tests nous apportent quelle information ?

    Puisque s'ils sont négatifs, on ne peu pas conclure qu'il n'y a pas de lien, et s'ils sont positifs, on ne peut pas conclure à une causalité non plus...
    Il y a un mot anglais intraduisble qui décrit ce qu'apporte un test, c'est "evidence", dont le sens est à mi-chemin entre "preuve" et "indice". Un test d'association positif donne donc de l"evidence" en faveur d'une association éventuellement causale : un indice mais pas une preuve définitive. Le lien causal ne peut être invoqué qu'en faisant appel aux connaissances de la discipline particulière, les statistiques ne suffisent pas.

Discussions similaires

  1. DM de maths sur le test d'indépendance du X²
    Par Daudy22K dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 29/10/2014, 17h48
  2. Test du khi deux d'indépendance
    Par invite391f4b7c dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 19/03/2012, 16h51
  3. Test d'indépendance
    Par invitee2ef0fb7 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 03/05/2010, 08h12
  4. test d'indépendance du khi deux
    Par invite5a8b7956 dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 29/04/2010, 14h58
  5. quel test d'independance choisir
    Par invite6d42c0af dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 19/02/2010, 00h42