Il me semble qu'il est clair pour tout le monde qu'une corrélation n'est pas forcement une causalité. Maintenant comment identifiions nous une causalité à partir d'un ensemble de fait ("bruts") que nous découvrons et donc sans structure à priori donné ?
Patrick
On ne l'identifie pas. On la suppose, et tant que les déductions et inductions faites sur cette supposition sont efficaces, i.e., servent à quelque chose et n'entrent pas en contradiction avec les faits, on garde la supposition.
Au sens populaire, bien sur que non. Au sens scientifique, bien sur que oui. Une variable A est causale pour une variable B si changer la variable A, toute chose étant égale par ailleurs, provoque une variation dans la variable B. Fait-il le moindre doute que les noirs ont, toute chose étant égales par ailleurs, plus de chance d'être au chomage en Afrique du sud (et en France) qu'un blanc?
Une expérience de pensée facile à faire: supposes que tu ais le pouvoir, toute chose étant égale par ailleurs, de changer la couleur de peau. Cette procédure peut-elle aider/nuire sur le plan du chomage? Si oui, c'est une relation causale. (qu'elle soit limitée aux environnements incluant de la xénophobie ne la supprime pas!)
Maintenant supposes que tu ais le pouvoir, toute chose étant égale par ailleurs, de bloquer les ascenseurs. Cette procédure peut-elle aider/nuire sur le plan des divorces? Si non, ce n'est pas une relation causale.
Je ne réfère qu'à l'extrait que tu as cité, dont amanuensis a fort justement remarqué qu'il ne met pas en évidence la confusion corrélation/causalité, mais bien la limite de l'extrapolation à des environnements différents.
Il y a pas mal de littérature là-dessus. L'explication la plus simple est que divorcer a un coût.
J'avoue ici une certaine envie de me laisser aller au sarcasme.
Tu ne fais pas un cas particulier des situations où il est possible d'expérimenter?
Tu serais surpris... c'est une notion à la fois toute bête mais incroyablement difficile à faire rentrer. Il y a des gens qui le comprennent tout-de-suite, il y en a d'autres pas moyen que cela rentre.
En méthodologie de la recherche, les devis expérimentaux sont classiquement mis en contraste des devis observationnels en ce que les premiers permettent de conclure à un lien causal, pas les seconds.
C'est en premier lieu une relation contextuelle non ? Il suffit que les mentalités évoluent pour la supprimer. Il manque l'ensemble des propriétés participant à l’effet. On ne peut en faire une généralisation dyadique.Une expérience de pensée facile à faire: supposes que tu ais le pouvoir, toute chose étant égale par ailleurs, de changer la couleur de peau. Cette procédure peut-elle aider/nuire sur le plan du chomage? Si oui, c'est une relation causale. (qu'elle soit limitée aux environnements incluant de la xénophobie ne la supprime pas!)
Patrick
C'est l'observation pointue de la nature (et l'application d'un test statistique) qui nous en informe. Mais c'est du pinaillage à ce niveau.C'est la nature qui nous en informe ? Elle nous dit ce que l'on doit observer et que l'ensemble des "faits bruts" observés sont corrélés, plus qu'a nous d'en trouver cette corrélation qui nous serait donnée ?
Simplement, cela ne m'étonne plus depuis longtemps de trouver des variables corrélées ; c'est plutôt le contraire qui m'étonne.
La majorité des corrélations que je trouve dans le cadre de mon travail ne sont que des e..erdes en perspective.
Karlp : arrête moi si je me trompe, mais une conjonction, c'est plutôt une "co-occurence", non ?
Si oui, une corrélation, c'est beaucoup plus puissant : c'est le fait qu'une variable augmente lorsqu'une autre augmente ou diminue en suivant une relation précise.
Lorsqu'aucun autre paramètre ne varie, cela veut carrément dire que chacune deux (ou plus) variables a un pouvoir prédictif concernant les autres. Il est d'ailleurs fréquent que des modèles statistiques soient utilisés et donnent de bons résultats dans qu'aucun mécanisme ne soit explicité.
Ne faut-il pas déjà avoir une idée de ce que l'on cherche à observer ? Pour ensuite obtenir un ensemble de "données brutes" des lectures ciblés que nous avons faites ? De là nous allons chercher à organiser ces données brutes pour en faire des données organisées qui sont en fait le résultat d'une extraction et d'une disposition en fonction d'une focalisation particulière et dont la finalité est informationnelle non ?
Et au final l'information que l'on extrait n'est en fait que le résultat d'une analyse et d'une interprétation de données organisées dans un contexte défini et en fonction d'un modèle préconstruit non ?
Patrick
OK, je vois ce que tu veux dire.
Le point est intéressant, car cela, me semble-t-il est en relation avec une lien entre causalité et libre-arbitre (alors qu'il y a une relation évidente entre causalité et déterminisme).
On peut imaginer d'ailleurs que le concept de cause doit tirer son origine de l'action, du "je cause" (d'où "un humain cause", d'où "une volonté cause") plutôt que d'une idée de "cause naturelle".
C'est un processus des plus général. Cela n'a rien de spécifique à la notion de causalité.
Je pourrais retranscrire la phrase citée en termes de probabilités selon l'interprétation bayesienne, et même dire que ce n'est qu'une manière d'exprimer le théorème de Coxe-Jaynes.
Tout-à-fait. L'interprétation la couleur de peau cause le chômage semble absurde au sens populaire, parce que le sens populaire sous-entend un rôle actif du facteur causal. Au sens technique c'est équivalent à une action sur la couleur de peau causerait un effet sur le chômage, ce qui est une prédiction testable, en théorie sinon en pratique.
Primo, Jacquard, avec tout le respect qu'on lui doit, est un conteur magnifique, un grand vulgarisateur mais ses dires ne sont quand même pas paroles d'évangile.Nous nous sommes bien compris : la corrélation n'est pas la causalité et ce que dit Jacquard est qu'il faut montrer le mécanisme pour affirmer un lien causal (lequel est impensable entre les divorces, les ascenseurs et le niveau social: exemple qui correspond justement aux genres d'inepties que la hâte à conclure conduirait à concevoir).
Vous avez parfaitement raison: un corrélation ne saurait être en elle même une ineptie, puisqu'elle n'est qu'un constat.
Lorsqu'on emploie le mot de mécanisme, j'imagine toujours des engrenages bien huilés comme ceux qu'on trouve dans les horloges ou les boites de vitesses.
Or Jacquard, c'est justement ce qu'il s'efforce de faire: construire une usine à gaz pour finalement en tirer une conclusion.
Cet argument là n'est pas défendable pour une simple et bonne raison: le nombre phénoménal de variables. C'est ce nombre qui au final l'emporte sur le mécanisme déterministe.
Cela repose sur un principe bien connu: compétition ordre/désordre ou énergie/entropie c'est la même chose.
Jacquard, le grand statisticien, réfléchit comme un mécanicien.
Ce qui me semble normal puisqu'elle est sortie de son contexte (aucun élément dans la phrase font référence à un contexte) et apparaît comme une loi universelle. La différentiation qui conduit à une décision de sélectionner ou non d'un candidat pourrait porter sur autre chose que la couleur de la peau et ce lien ne serait que fortuit.
Patrick
(1) Il serait étonnant que la science donne à un concept un contour plus flou que le sens courant. ceci dit, je ne vais pas ergoter sur les mots, mais il ne faut pas alors s'étonner d'entendre des affirmations étranges (la couleur de peau cause le chômage) avec ce qu'on peut imaginer comme conséquences désastreuses.(1) Au sens populaire, bien sur que non. Au sens scientifique, bien sur que oui. Une variable A est causale pour une variable B si changer la variable A, toute chose étant égale par ailleurs, provoque une variation dans la variable B. Fait-il le moindre doute que les noirs ont, toute chose étant égales par ailleurs, plus de chance d'être au chomage en Afrique du sud (et en France) qu'un blanc?
Une expérience de pensée facile à faire: supposes que tu ais le pouvoir, toute chose étant égale par ailleurs, de changer la couleur de peau. Cette procédure peut-elle aider/nuire sur le plan du chomage? Si oui, c'est une relation causale. (qu'elle soit limitée aux environnements incluant de la xénophobie ne la supprime pas!)
Maintenant supposes que tu ais le pouvoir, toute chose étant égale par ailleurs, de bloquer les ascenseurs. Cette procédure peut-elle aider/nuire sur le plan des divorces? Si non, ce n'est pas une relation causale.
(2) Je ne réfère qu'à l'extrait que tu as cité, dont amanuensis a fort justement remarqué qu'il ne met pas en évidence la confusion corrélation/causalité, mais bien la limite de l'extrapolation à des environnements différents.
(3) Il y a pas mal de littérature là-dessus. L'explication la plus simple est que divorcer a un coût.
(4) J'avoue ici une certaine envie de me laisser aller au sarcasme.
(2) Et bien si ! la corrélation "couleur de peau"/ "chömage" n'est pas un rapport causal (c'est l'apartheid qui est cause de la discrimination). Sauf à tordre ce concept de cause de façon contestable. Si vous le souhaitez c'est votre droit. Mais ça n'en fait pas une vérité épitémologique.
(3) et le rapport avec les ascenseurs ?
(4) Faîtes donc si cela vous agrée
Si on refusait tous les arguments contrafactuels, cela diminuerait par au moins un facteur 2 les discussions dans des forums comme "débats scientifiques" par exemple.
Trop facile de les refuser quand cela arrange, et de les accepter ailleurs, quand cela arrange.
Une petite allégorie me revient en mémoire dont vous apprécierez sans doute l'humour.Une variable A est causale pour une variable B si changer la variable A, toute chose étant égale par ailleurs, provoque une variation dans la variable B.
Elle est tirée d'un ouvrage de F. Herbert :
"un vieil homme était assis chaque jour derrière une palissade percée d'une fente derrière laquelle chaque jour passait un âne.
Chaque jour il en voyait d'abord le museau, puis le reste du corps, puis la queue.
Un beau matin, il se lève en s'écriant "Eureka ! : c'est le museau qui cause la queue"
En effet, si vous supprimez la variable A (le museau), vous supprimez l'effet B (la queue)
Nous sommes tout à fait d'accord sur la possibilité d'opérer cette distinction entre conjonction et corrélation (certains auteurs les distiguent, d'autres non).Karlp : arrête moi si je me trompe, mais une conjonction, c'est plutôt une "co-occurence", non ?
Si oui, une corrélation, c'est beaucoup plus puissant : c'est le fait qu'une variable augmente lorsqu'une autre augmente ou diminue en suivant une relation précise.
Lorsqu'aucun autre paramètre ne varie, cela veut carrément dire que chacune deux (ou plus) variables a un pouvoir prédictif concernant les autres. Il est d'ailleurs fréquent que des modèles statistiques soient utilisés et donnent de bons résultats dans qu'aucun mécanisme ne soit explicité.
En effet, une corrélation implique une possibilité prédictive (qui sera toutefois parfois controuvée: si le martien quitte le pays où règne l'apartheid).
L'image employée par Jacquard le rappelle: le martien "vérifiera" sa théorie tant qu'il restera sur le même territoire, dans les mêmes conditions politiques. Ce qui signifie simplement que la vérification d'un énoncé prédictif ne prouve pas la vérité de la théorie dont il découle.
Vous faîtes preuve de beaucoup d'imagination, mais je crois qu'en l'occurence la raison est un bien meilleur guide (ce n'est pas Jacquard qui réflechit en mécanicien, mais vous qui lui prêtez vos représentations).Primo, Jacquard, avec tout le respect qu'on lui doit, est un conteur magnifique, un grand vulgarisateur mais ses dires ne sont quand même pas paroles d'évangile.
Lorsqu'on emploie le mot de mécanisme, j'imagine toujours des engrenages bien huilés comme ceux qu'on trouve dans les horloges ou les boites de vitesses.Or Jacquard, c'est justement ce qu'il s'efforce de faire: construire une usine à gaz pour finalement en tirer une conclusion.
Cet argument là n'est pas défendable pour une simple et bonne raison: le nombre phénoménal de variables. C'est ce nombre qui au final l'emporte sur le mécanisme déterministe.
Cela repose sur un principe bien connu: compétition ordre/désordre ou énergie/entropie c'est la même chose.
Jacquard, le grand statisticien, réfléchit comme un mécanicien.
Vous constaterez d'ailleurs que votre remarque relative à la complexité des situations auxquelles nous avons affaire coïncide avec le commentaire qui apparaît dans ce petit extrait.
D'accord avec vous pour dire que sa parole n'est pas un dogme; faisons lui néanmoins la grâce de nous tenir à la hauteur où il place le débat, ce à quoi nous manquons en voulant balayer ses dires d'un constat relatif à ses talents de conteur.
Un bon scientifique n'est pas forcément un bon conteur, mais il serait abusif d'admettre une relation causale stricte et réciproque et de disqualifier un auteur parce qu'en plus de ses compétences il est capable de les mettre à la portée de tous.
L'objectif n'était pas de refuser un argument contrafactuel, mais d'interroger sur l'aspect est-ce un cas de figure isolé ou est-ce une problématique rependu (Pour justifier la pertinence du lien causal nécessiterait de supposer que l'on puisse agir sur la nature des choses).
Patrick
Stricto sensu, il n'y a jamais de lien causal, seulement des liens causaux dans le cadre d'un modèle, dans le cadre de nos représentations.
Il me semble que c'est là le point délicat, karlp et jacquart semble faire allusion à un lien causal qui s'inscrit non pas dans la science mais dans une sorte d'absolu, d'une vérité profonde.
La question que cela soulève, c'est : la science doit-elle nous apporter des vérités profondes ou elle ne le peut pas et doit se contenter, du moins pour l'instant, du coté utilitaire, à ce qu'elle nous permet de faire, c'est à dire, par exemple, avancées technologiques ou encore simple satisfaction de mieux comprendre le monde.
Non, justement. Personnellement, je ne bosse pas toujours comme ça : d'un côté, je fais des expériences, et là, certes, on part d'hypothèses de départ, à tester etc...etc...Ne faut-il pas déjà avoir une idée de ce que l'on cherche à observer ? Pour ensuite obtenir un ensemble de "données brutes" des lectures ciblés que nous avons faites ? De là nous allons chercher à organiser ces données brutes pour en faire des données organisées qui sont en fait le résultat d'une extraction et d'une disposition en fonction d'une focalisation particulière et dont la finalité est informationnelle non ?
Et au final l'information que l'on extrait n'est en fait que le résultat d'une analyse et d'une interprétation de données organisées dans un contexte défini et en fonction d'un modèle préconstruit non ?
Mais j'exploite aussi des suivis, et j'ai donc des centaines de séries temporelles à "mouliner". Et là, non ; j'ai déjà les données brutes, je fais un nombre énorme de tests, je regarde les résultats pour cibler les groupes de variables sur lesquels je peux peut-être sortir quelque chose, et ensuite j'explore les relations entre variables.
Je ne pars pas dans ce cas d'un mécanisme pour chercher des observations qui le valident : j'ai un paquet d'observations, j'y cherche des patterns, et ensuite je regarde s'ils sont cohérent et explicables par un mécanisme connu.
En sachant que de toute façon, je n'ai pas les moyens techniques pour aller jusqu'aux mécanismes : il m'est impossible d'en découvrir de nouveaux.
Ok ce n'est pas parce que tu n'as pas compris pas le sens technique de "causalité" qu'il est mal définit ou tordu de façon contestable. Cela veut juste dire que tu n'as pas compris. Je soupçonne d'ailleurs que ce sont précisément les écrits de Jacquard qui t'empêche de voir la différence entre un rapport causal en science et un rapport causal au sens populaire.
Par exemple ici tu sembles croire que ce serait une relation causale au sens scientifique. Pas du tout, supprimer le museau ne supprime pas la queue, pas plus que de me couper la main ne fait disparaître mon pied.
Bonjour Ryuujin,
Merci d'avoir exposé votre retour d'expérience.
Si vous identifiez une bijection entre l'évolution de deux variables vous en déduisez la présence d'un lien causal, ou juste une corrélation possible ?
Patrick
Jiav, Karlp fait référence à l'usage des stats, pas à une expérience où on couperait le museau de l'âne !
Il n'a pas tort ! C'est en effet une erreur classique !
Pour formuler son exemple autrement, on pourrait observer que chaque arc-en-ciel est précédé d'une chute de la pression atmosphérique. Et en déduire si on est pas très fin que les arcs-en-ciels sont provoqués par des variations de la pression atmosphérique.
Dans pas mal de domaines scientifiques, on ne peut pas expérimenter, et on en est réduit à mesurer des séries temporelles et à les passer à la moulinette.
C'est valable en climato, en dendrochrono, en écophysio, en écologie etc...etc...
Et il est en effet facile de se planter et de croire que deux
Corrélation possible, tant qu'on a pas un mécanisme clair et démontré qui lie les deux.Si vous identifiez une bijection entre l'évolution de deux variables vous en déduisez la présence d'un lien causal, ou juste une corrélation possible ?
A peu près toutes mes variables sont corrélées (elles varient presque toutes avec le rayonnement lumineux).
Pas que je sache. Tu as raison que son exemple illustre effectivement la confusion corrélation/causalité, mais il l'utilise suite à une citation de la définition de la causalité en science Une variable A est causale pour une variable B si changer la variable A, toute chose étant égale par ailleurs, provoque une variation dans la variable B.
Cela laisse supposer qu'il pense mettre cette définition en défaut. Si c'est bien ce qu'il souhaite dire, il n'a juste pas compris la définition.
Pour faire une démonstration il faut au préalable un cadre théorique non ?
Mécanisme clair à quel niveau ? Dans l'organisation des données ? Une relation est une fonction, les notions de bijection, injection, surjection ne sont pas claire dans ce contexte ?
Patrick
Yep, là, c'est plutôt le travail des physiologistes et biologistes moléculaires. Nous, on l'exploite.Pour faire une démonstration il faut au préalable un cadre théorique non ?
Mécanisme clair à quel niveau ? Dans l'organisation des données ? Une relation est une fonction, les notions de bijection, injection, surjection ne sont pas claire dans ce contexte ?
En gros, on trouve une fonction qui lie une variable à l'autre, puis on cherche s'il y a un mécanisme à l'échelle physio et/ou moléculaire qui l'explique, puis enfin, on rajoute des variables mesurées à une échelle plus fine pour mettre en évidence le fonctionnement du mécanisme en question et la façon dont il relie les variables. Ou alors, carrément, on modélise pour montrer qu'on retrouve la dite relation à partir du seul mécanisme et d'une des deux variables.