Paradoxe de Simpson
Répondre à la discussion
Affichage des résultats 1 à 11 sur 11

Paradoxe de Simpson



  1. #1
    invitef7057954

    Paradoxe de Simpson


    ------

    Bonjour à tous,

    Il y a un point sur lequel j'aimerais que vous m'éclairiez concernant ce paradoxe. En effet, si j'ai bien compris (via la page Wikipédia http://fr.wikipedia.org/wiki/Paradoxe_de_Simpson) l'effet produit et les causes du problème, j'ai dû mal à voir comment dans un cas pratique cela peut être résolu.

    En effet, si je reprends le deuxième exemple de la page Wiki avec les traitements A et B contre les calculs rénaux et que je dois me décider entre les deux pour soigner un patient, quel traitement je lui donne concrètement ? Et pourquoi ?

    Merci d'avance.

    -----

  2. #2
    Amanuensis

    Re : Paradoxe de Simpson

    Le traitement A, puisque d'après les données il marche mieux que B aussi bien sur le petits calculs que sur les gros calculs.

    L'erreur est de combiner deux tests qui sont faits sur des populations non représentatives du rapport entre cas avec petits calculs et cas avec gros calculs (échantillons biaisés).
    Dernière modification par Amanuensis ; 22/03/2014 à 18h37.
    Pour toute question, il y a une réponse simple, évidente, et fausse.

  3. #3
    inviteed684306

    Re : Paradoxe de Simpson

    Salut à tous!
    Que dis-tu pour l'exemple de Lisa et Bart? Bart a toujours été au dessus mais pourtant au calcul final sur les deux semaine, il n'a amélioré que 39 articles sur 110 contre 61/110 pour Lisa.

  4. #4
    Amanuensis

    Re : Paradoxe de Simpson

    Aussi un problème d'échantillonnage. Dans ce cas biais sur le nombre d'articles par semaine.

    Par contre pour l'analyse il y a une difficulté: on ne sait pas si le travail par semaine de l'un est totalement décorrélé de l'autre. On ne peut pas dire "Bart est meilleur aussi bien les mois d'hiver que les mois d'été" (exemple au pif). Si le biais est totalement dû au hasard, il peut être plus significatif de combiner les deux.

    Il me semble qu'il n'y a pas de réponse générique dans les cas soulevant le paradoxe de Simpson, c'est l'analyse du biais d'échantillonnage qui décide.
    Pour toute question, il y a une réponse simple, évidente, et fausse.

  5. A voir en vidéo sur Futura
  6. #5
    gg0
    Animateur Mathématiques

    Re : Paradoxe de Simpson

    Bonsoir.

    Attention, ce paradoxe n'a rien à voir avec de l'échantillonnage, il est valide sur une population statistique complète (exemple de Bart et Lisa). Il révèle simplement que des comparaisons de pourcentages ne sont valides que dans des cas précis : Pourcentages d'une même population, pourcentages de quantités totalement comparables, ..).
    Dans les deux exemples, on utilise des pourcentages de populations ou d'échantillons dissemblables. On est à peu près dans la situation de la question : Jules court le 100 m en 12 s alors que Fred marque 3 buts à chaque match; quel est le meilleur ?

    Les démographes connaissent ce genre de situation : dans les années 1980 à 2000, les pays en développement avaient un taux de mortalité bien plus faible que les pays développés.

    Cordialement.

  7. #6
    gg0
    Animateur Mathématiques

    Re : Paradoxe de Simpson

    Pour le traitement des calculs rénaux, on peut espérer qu'il y a des études plus sérieuses que ce qui est présenté. Mais ce type de biais existe réellement. Par exemple des études de phase 3 faites essentiellement sur des africains (on les paie moins cher) alors que le traitement sera très rare en Afrique. Les discussions actuelles sur les statines relèvent peut-être du paradoxe de Simson : Les points de vue sont diamétralement opposés, et appuyés à chaque fois sur des études statistiques.

    Cordialement.

  8. #7
    Amanuensis

    Re : Paradoxe de Simpson

    Citation Envoyé par gg0 Voir le message
    Attention, ce paradoxe n'a rien à voir avec de l'échantillonnage, il est valide sur une population statistique complète (exemple de Bart et Lisa).
    Si c'était le cas on en aurait rien à fiche du paradoxe: aucune prédiction ni décision ne serait à faire!

    Dans le cas de Bart et Lisa il y a le choix de deux semaines particulières, il y a échantillon sur les semaines (pas sur les personnes, un échantillon n'est pas nécessairement des personnes au sein d'une population de personnes!). Ces semaines ne sont pas représentatives du travail "moyen"...
    Pour toute question, il y a une réponse simple, évidente, et fausse.

  9. #8
    gg0
    Animateur Mathématiques

    Re : Paradoxe de Simpson

    Pas d'accord, Amanuensis.

    Il y a des conclusions d'études complètes en statistiques descriptives qui doivent être fortement modulée par l'indication du champ d'étude. Et dont on tire des conclusions ! L'exemple que je donnais du taux de mortalité ne relève pas des statistiques inférentielles. Dire "on meurt moins dans les pays en développement" est une présentation fallacieuse d'un résultat de compilation statistique.

    Par contre, dans le domaine des stats inférentielles, même si le paradoxe est facile à présenter, on n'a généralement pas les deux versions en même temps. On sait seulement que Bart a des résultats meilleurs que Lisa. Que fait-on ?
    Car l'exemple de Lisa et Bart est totalement décodé, ce qui est rarement le cas.

    Cordialement.

  10. #9
    Amanuensis

    Re : Paradoxe de Simpson

    Citation Envoyé par gg0 Voir le message
    Pas d'accord, Amanuensis.
    Pour dire cela faudrait déjà montrer que le point proposé est compris.

    Il y a des conclusions d'études complètes en statistiques descriptives qui doivent être fortement modulée par l'indication du champ d'étude. Et dont on tire des conclusions !
    Je ne parle pas de "conclusion", mais de décisions et d'actions. Une stat sans utilité pour des décisions est sans utilité tout court (du journalisme...).

    L'exemple que je donnais du taux de mortalité ne relève pas des statistiques inférentielles. Dire "on meurt moins dans les pays en développement" est une présentation fallacieuse d'un résultat de compilation statistique.
    Que la présentation soit fallacieuse n'a aucune importance si les stats ne sont pas utilisées pour des décisions. On peut faire tout le bla-bla qu'on veut sur des stats "non inférentielles", cela ne coûte rien.

    Par contre, dans le domaine des stats inférentielles, même si le paradoxe est facile à présenter, on n'a généralement pas les deux versions en même temps. On sait seulement que Bart a des résultats meilleurs que Lisa.
    Non, justement. On ne sait pas cela! C'est bien le fond du paradoxe. On ne connaît que le résultat d'un échantillonnage particulier (deux semaines choisies on ne sait comment), et l'information obtenue est conditionnelle à la manière dont ce choix a été fait. La division en deux montre qu'il y a un risque sérieux de biais (quelle est la probabilité a priori d'une telle différence entre les deux semaines si on estime que le nombre d'articles par semaine est i.i.d pour les deux?).

    Que fait-on ?
    Une analyse plus poussée, et surtout une analyse donnant la vraisemblance de "Bart a des résultats meilleurs que Lisa" pour une semaine future conditionnellement au résultat de l'échantillon, en prenant en compte la vraisemblance de biais (comment ont été choisies les semaines?), ainsi qu'un prior sur les comportements de Bart et Lisa. La vraisemblance de "Bart a des résultats meilleurs que Lisa" est ce qui permet d'établir la cote pour un pari sur une semaine future (manière simple mais efficace de modéliser une décision).
    Dernière modification par Amanuensis ; 23/03/2014 à 09h22.
    Pour toute question, il y a une réponse simple, évidente, et fausse.

  11. #10
    invite179e6258

    Re : Paradoxe de Simpson

    Pour pouvoir traiter correctement le problème de Bart et Lisa, il faudrait en savoir plus sur la façon dont les articles ont été affectés à l'un ou à l'autre. Si par exemple on suppose que chaque semaine un tirage au sort a permis d'affecter les articles, alors on pourrait ajuster un modèle mixte, avec un effet aléatoire "semaine" et un effet fixe Bart/Lisa. Auquel cas on va trouver que Bart est meilleur que Lisa. Si on suppose que les articles ont été au départ affectés au hasard à Bart ou Lisa et qu'ensuite chacun a eu la liberté d'en traiter une partie la première semaine et une autre partie la deuxième semaine, alors on a un plan d'expérience à effets emboîtés et la conclusion serait inverse. Si on ne sait rien on ne peut pas dire grand-chose.

  12. #11
    gg0
    Animateur Mathématiques

    Re : Paradoxe de Simpson

    Amanuensis,

    tu sembles avoir une vue assez biaisée des statistiques et de leurs utilisations. Dommage !

    Inutile de poursuivre le débat, tu n'admets que ton propre point de vue.

    Cordialement.

Discussions similaires

  1. Transmission Simpson
    Par invite22662846 dans le forum Physique
    Réponses: 0
    Dernier message: 15/06/2010, 09h05
  2. Méthode de Simpson
    Par invited00ee48c dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 31/03/2010, 22h44
  3. methode de milne et simpson
    Par invite4ca9df98 dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 05/02/2010, 22h31
  4. Trigo - formules de Simpson
    Par invitecb241cbf dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 03/11/2009, 09h07
  5. formule de simpson
    Par invite1c8778ef dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 29/05/2009, 00h09