probabilité à plusieurs variables et intervalle de confiance
Répondre à la discussion
Affichage des résultats 1 à 18 sur 18

probabilité à plusieurs variables et intervalle de confiance



  1. #1
    AnnaMahler

    probabilité à plusieurs variables et intervalle de confiance


    ------

    Bonjour,
    Je me pose une question(des questions) concernant les corélation, intervalles de confiance, taille de populations pour des probabilité
    Meme si c'est un peu compliqué, je vais essayé d'être la plus clair possible en prenant un exemple(très schématique mais c'est un exemple)

    Imaginons une personne A
    Soit X la variable binaire "la personne est atteinte de famine"
    Soit Y la variable linéaire "taille en cm"

    On sait que :
    D'après les estimations donnant une précision de 95%:
    - 97%des européens ne sont pas atteints de famines
    -76% des américains ne sont pas atteints de famines
    -72% des asiatiques ne sont pas atteints de famines
    -47% des africains ne sont pas atteint de famines

    D'après les estimations avec une précision de 80%:
    -la taille moyenne des europeens est de 175 cms
    -la taille moyenne des américains est de 170 cms
    -la taille moyenne des asiatique est de 158 cms
    -la taille moyenne des africains est de 165 cms

    J'aimerais savoir si il est possible de donner un pourcentage de chance, suivant les caractères de monsieur A(taille et famine ou non), qu'il appartienne à chacune des 4 populations

    Par exemple si il est atteint de famine et qu'il mesure 160cms, quelle est la chance qu'il soit europeen, américain, asiatique, africain ?
    Est ce possible ? Que ce passe t-il avec les intervalles de confiances sachant que celui des différente variables et différent ? Fautil faire une moyenne pondéré ?(pourcentage de chance d'après la variable X d'etre africains*précision test X+pourcentage de chance d'etre africains d'après la variable Y*précision test Y)/(précision tets x + précision test Y) ?


    Merci

    -----

  2. #2
    toothpick-charlie

    Re : probabilité à plusieurs variables et intervalle de confiance

    1) Il faut faire une hypothèse sur la densité de probabilité de la taille (connaître la moyenne ne suffit pas).
    2) l'expression "la moyenne est tant avec une précision de 80%" n'a pas de sens pour moi.
    3) on ne dit pas d'une personne qu'elle est atteinte de famine, la famine concerne une population.

  3. #3
    AnnaMahler

    Re : probabilité à plusieurs variables et intervalle de confiance

    Oui la personne est atteinte de malnutrition effectivement

    Ok effectivement il est interressant d'avoir les données concernant les écart type de chaque tests. Imaginons qu'on les ait, est ce possible , existe t-ils des formules pour arriver à ce que je veut ?

    Pour ce qui est de la précision de l'estimation avec la moyenne j'avoue que ça veut pas dire grand chose en réflechissant 2 minutes

  4. #4
    toothpick-charlie

    Re : probabilité à plusieurs variables et intervalle de confiance

    Si tu as un modèle pour la taille (par exemple la taille suit une loi normale de paramètres donnés), tu peux utiliser l'approche bayesienne, pour laquelle il faut se donner des probabilités a priori pour une personne d'appartenir à l'une des 4 populations. Si tu n'as pas ces probabilités a priori, tu peux toujours suposer qu'elles sont égales à 1/4.

  5. A voir en vidéo sur Futura
  6. #5
    AnnaMahler

    Re : probabilité à plusieurs variables et intervalle de confiance

    Ok
    Donc si j'ai la loi de la taille de chaque population, je peux obtenir le pourcentage de chance que A appartienne à chacune des populations(comment définir le pourcentage d'erreur à se moment la si les résultats des tailles de la population provienne d'un échantillonnage ?)

    J'aurais donc le pourcentage de change que A appartienne à chaque population en prenant en compte seulement le parametre X et selon le parametre Y ceux ci ayant des "pourcentages de fiabilités) différente.
    Mais comment puis-je arriver au pourcentage finale de chance de A à appartenir à chaqu'une des populations en prenant en compte les 2 paramétres ? Et que dire de la précision à se moment la ?

  7. #6
    toothpick-charlie

    Re : probabilité à plusieurs variables et intervalle de confiance

    il faut considérer la loi conjointe du couple (X,Y). Je ne sais pas si c'est très intéressant de faire intervenir la précision sur les pourcentages de dénutris par population, à mon avis ça ne joue "au second ordre" (mais c'est pifométrique).

  8. #7
    AnnaMahler

    Re : probabilité à plusieurs variables et intervalle de confiance

    Oui après l'exemple est pas pertinent c'est clair mais c'est pour montrer ce que je veux faire en fait

  9. #8
    gg0
    Animateur Mathématiques

    Re : probabilité à plusieurs variables et intervalle de confiance

    Attention,

    dans l'exemple proposé, les deux variables ne sont pas indépendantes, ce qui rend les calculs impossibles si on n'a pas vraiment la loi jointe.
    Ce genre de question est traité dans les ouvrages de probabilités.

    Cordialement.

  10. #9
    AnnaMahler

    Re : probabilité à plusieurs variables et intervalle de confiance

    pourquoi les variables ne sont pas indépendantes ? et dans l'hypothèse ou elle le soit , comment trouver la proba en prenant en compte simultanément X et Y sachant qu'on connait la proba suivant X et suivant Y ?

    Par exemple sachant qu'on connait
    Probabilité que A soit europeen sachant qu'il mesure 1m 68 (on donne 1/4 des habitant du monde sont europeen pour simplifier comme l'a proposé Charlie)
    probabilité que A soit europeen sachant qu'il est atteint de malnutition

    Mais comment alors affiner le pourcentage de chance que A soit europeen en utilisant les deux résultats en meme temps

    Merci

  11. #10
    gg0
    Animateur Mathématiques

    Re : probabilité à plusieurs variables et intervalle de confiance

    "pourquoi les variables ne sont pas indépendantes ?"
    parce que la malnutrition empêche de grandir.

    "dans l'hypothèse ou elle le soit , comment trouver la proba en prenant en compte simultanément X et Y sachant qu'on connait la proba suivant X et suivant Y ?"
    Définition de "variables indépendantes".

    Mais dans ton exemple qui suit, on ne connaît pas la probabilité "suivant X " si X est la taille; on ne connaît que la moyenne, ce qui ne dit rien :
    Si 50% des gens mesurent 1,70 m et l'autre moitié 1,80m, la moyenne est 1,75
    Si 50% des gens mesurent 1,60 m et l'autre moitié 1,90m, la moyenne est 1,75
    La connaissance de la moyenne ne dit rien sur la répartition des valeurs ...

    Encore, pour la taille, sur une grande population, on a un modèle possible (gaussien). Sur la malnutrition, il n'y en a pas (c'est d'ailleurs une notion mal construite).

    Et si tu passais à un exemple moins contestable ? Par exemple à propos de ce que tu veux faire vraiment ... Inutile de perdre son temps à cause d'une notion floue.

    Cordialement.

  12. #11
    AnnaMahler

    Re : probabilité à plusieurs variables et intervalle de confiance

    Et bien par exemple je voudrais donner une probabilité plus précise par la réalisations de deux tests indépendants en les croisant

    Par exemple j'examine un patient qui a une tumeur: je lui fait plusieur tests pour savoir si il est atteint de tels mal
    Un premier test me montre qu'il a un taux lipide créatinine plutot élevé d'après une base de donné(réalisé sur des cas antérieur) , celà veut dire qu'il a 85% de chance d'etre atteint d'une tumeur A, 65% que la tumeur qu'il est soit la B et 86% de chance d'avoir la tumeur C
    Un deuxieme test montre que sont rapport chlonine créatin est plus élevé que la normal il a donc d'après la base de donné relative à se test :
    82% de chance d'avoir A -74% d'avoir B et 53 d'avoir C

    Mon objectif serait donc de croisser les 2 résultats pour avoir une proba de chance plus précise d'avoir tels ou tels tumeur

  13. #12
    gg0
    Animateur Mathématiques

    Re : probabilité à plusieurs variables et intervalle de confiance

    Bonsoir.

    Il serait bon que tu commences par bien comprendre les quantités que tu manipules :
    "celà veut dire qu'il a 85% de chance d'etre atteint d'une tumeur A, 65% que la tumeur qu'il est soit la B et 86% de chance d'avoir la tumeur C"
    Je n'y crois pas ! Car ça voudrait dire qu'il a au moins 36% de chances d'avoir les trois tumeurs à la fois !!!
    Je ne pense pas que ce soit vrai.

    Donc peux-tu trouver dans de la littérature scientifique la signification exacte de ces pourcentages 85%, 65% et 86% ?

    Si jamais je me trompe, et donc qu'il y a dans ce cas une assez forte probabilité d'avoir 2 voire 3 tumeurs, je te ferai de plates excuses.

    Sinon, je te rappelle que la définition de l'indépendance donne la probabilité de la réalisation simultanée de deux événements indépendants connaissant la probabilité de chacun d'eux : Si A et B sont indépendants, . Et qu'on apprend ça dans les cours de base de probabilités. Donc tu peux avoir une réponse immédiate à la question générale.

    Mais dans ton cas, es-tu vraiment sûre qu'il y a indépendance ?

    Cordialement.

  14. #13
    AnnaMahler

    Re : probabilité à plusieurs variables et intervalle de confiance

    Citation Envoyé par gg0 Voir le message
    Bonsoir.

    Il serait bon que tu commences par bien comprendre les quantités que tu manipules :
    "celà veut dire qu'il a 85% de chance d'etre atteint d'une tumeur A, 65% que la tumeur qu'il est soit la B et 86% de chance d'avoir la tumeur C"
    Je n'y crois pas ! Car ça voudrait dire qu'il a au moins 36% de chances d'avoir les trois tumeurs à la fois !!!
    Je ne pense pas que ce soit vrai.

    Cordialement.
    Non oui bien sur il faut comprendre 85% de chance que sa tumeur soit la tumeur A, 65% de chance que sa tumeur soit la B,...

    Je connais donc P(A) sachant T1 P(B) sachant T1 P(C) sachant T1 P(A) sachant T2 P(B) sachant T2 et P(C) sachant T2

    Et je voudrais donc connaitre P(A) sachant T1 et T2 et idem pour B et C Est ce possible ? Celà améliore t il la précision du diagnostique par rapport à si on utiise un test unique(intuitivement oui car plus il y a de test, plus mon diagnostique s'affine) ?

    Désolé pour mon manque de rigeur

  15. #14
    gg0
    Animateur Mathématiques

    Re : probabilité à plusieurs variables et intervalle de confiance

    Bon,

    tu répètes ce qui me semblait bizarre ("Non oui bien sur il faut comprendre 85% de chance que sa tumeur soit la tumeur A" ???). Donc tu admets qu'il y a une forte probabilité que sa tumeur soit à la fois A et C ?
    En fait, ce que je soupçonne, c'est que 85% est la probabilité d'avoir ce "taux lipide créatinine plutôt élevé" quand on a la tumeur A. A moins que ce soit encore autre chose. Mais avec une seule tumeur, on ne peut pas avoir un total de probabilité 85%+65%+86% >1 pour trois cas exclusifs.

    Sinon :
    "Je connais donc P(A) sachant T1 P(B) sachant T1 P(C) sachant T1 P(A) sachant T2 P(B) sachant T2 et P(C) sachant T2

    Et je voudrais donc connaitre P(A) sachant T1 et T2"
    A priori, il n'y a pas de raison de pouvoir le calculer : Revois un cours de base sur les probabilités conditionnelles (C'est du calcul élémentaire)

    Je pense que pour l'instant tu n'as pas assez étudié les bases des probabilités pour comprendre ce que tu manipules. Dans ce cas, le manque de rigueur est obligatoire.

    Cordialement.

  16. #15
    AnnaMahler

    Re : probabilité à plusieurs variables et intervalle de confiance

    Bonjour et merci encore de prendre du temps pour moi
    A force de vouloir allé trop vite j'en oublie le principale effectivement(somme des probas égales à 1 comme vous le signifier)
    Par contre pour la syntaxe , en reprenant votre formule, pour moi ça serait plutot
    85% est la probabilité que la tumeur qu'on a soit la A sachant que le taux de lipide créatinine est ...
    10% est la probabilité que la tumeur qu'on a soit la B sachant que le taux de lipide créatinine est ...
    5% est la probabilité que la tumeur qu'on a soit la B sachant que le taux de lipide créatinine est ...

    de même, en réalisant le tests 2 :
    70% est la probabilité que la tumeur qu'on a soit la A sachant les résultats de ce tests 2
    30% est la probabilité que la tumeur qu'on a soit la B sachant les résultats de ce tests 2
    0% est la probabilité que la tumeur qu'on a soit la C sachant les résultats de ce tests 2

    J'ai réaliser un arbre de probas(retour au bases) et bien sur il me manquait des valeurs pour chaqu'un des tests. J'ai donc mis 0.5-0.5 à chaque tests(je peux changer ses valeurs par exemple si un tests et plus ou moins précis par exemple

    Ainsi Puis-je utiliser la formule P(A)=P(T1)*P(A sachant T1)+P(T2)*P(A sachant T2) en disant que les résultats des 2 tests sont indépendant ? Et que ce passe t-il si il ne le sont pas ??

  17. #16
    gg0
    Animateur Mathématiques

    Re : probabilité à plusieurs variables et intervalle de confiance

    Ok,

    c'est plus crédible. Mais ...
    La formule "P(A)=P(T1)*P(A sachant T1)+P(T2)*P(A sachant T2) " est la formule des probabilités totales qui suppose que T1 et T2 soient incompatibles (à priori ce n'est pas le cas) et que leur réunion soit l'univers des possibles (donc que n'importe qui soit dans le cas T1 ou dans le cas T2), donc pour 2 événements, qu'ils soient complémentaires; ça me semble tiré par les cheveux ...

    Tu te situes dans une situation où, en présence d'une tumeur, on a 100 % des patients qui ont T1 ( le taux de lipide créatinine est ...). Idem pour T2. Et on a un problème, c'est que le test 2 interdit la possibilité de la tumeur C (Je ne connais pas assez le domaine pour savoir si c'est crédible). Donc on se retrouve avec seulement les possibilités A (85%) et B(10%) donc les probabilités sachant maintenant que ce n'est pas C sont (85/95 =) 89,5% et 10,5%.
    Ensuite les différences de résultats entre le test 1 et le test 2 ont comme seule signification qu'on a des tests peu cohérents. En les supposant indépendants, on va pouvoir assurer qu'avec (89,5%*70%)=63% de confiance, on peut dire que c'est A, et avec (10,5%*30%) 3,15% de confiance penser que c'est B (Et il reste 33,85% de probabilité que les deux tests donnent des résultats contradictoire). Les probabilités ont diminué !

    Une chose me gène : D'une part, des tests qui donnent toutes les bonnes réponses, c'est rare, d'autre part la plupart des tests donnent des faux positifs et des faux négatifs. C'est dans ce cadre qu'on peut avoir des tests qui donnent des probabilités différentes.

    Comme je suis maintenant un peu perdu face à ce type de questionnement, je m'interroge : Est-ce vraiment un cas réel ?
    Car ce qui se passe en biologie est différent : On obtient des taux, on n'a pas des probabilités si nettes, seulement des indications statistiques un peu floues, qui dépendent des valeurs obtenues dans le test, de façon plutôt continue.

    Si c'est un cas réel, le test 1 donne l'indication que c'est très probablement A, le test 2 ne remet pas en cause ce diagnostic, donc probabilités ou pas, on reste sur la conclusion du test 1.

    Cordialement.

  18. #17
    AnnaMahler

    Re : probabilité à plusieurs variables et intervalle de confiance

    En fait je n'ai pas vraiment de cas réel sous la main

    Comment cela se passe t il en biologie alors ?

    Cordialement

  19. #18
    gg0
    Animateur Mathématiques

    Re : probabilité à plusieurs variables et intervalle de confiance

    Alors je ne comprends pas ce que tu fais ...

    A priori, tu es dans un cas qui ne relève pas vraiment du calcul de probabilités (trop peu de connaissance).

Discussions similaires

  1. intervalle de confiance et intervalle de pari
    Par bboop8 dans le forum Mathématiques du supérieur
    Réponses: 7
    Dernier message: 08/04/2014, 13h14
  2. intervalle de confiance à 95%
    Par nono1789 dans le forum Physique
    Réponses: 2
    Dernier message: 12/09/2012, 08h30
  3. intervalle de confiance
    Par invite29c3e7f2 dans le forum Mathématiques du supérieur
    Réponses: 6
    Dernier message: 13/05/2012, 14h45
  4. intervalle de confiance
    Par invite007e6582 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 07/02/2010, 22h50
  5. Probabilité: densité d'une combinaison de plusieurs variables aléatoires
    Par invite8747f3d6 dans le forum Mathématiques du supérieur
    Réponses: 7
    Dernier message: 31/08/2009, 21h14