Comparaison de deux proportions à l'aide d'intervalles de confiance
Répondre à la discussion
Affichage des résultats 1 à 14 sur 14

Comparaison de deux proportions à l'aide d'intervalles de confiance



  1. #1
    mgtoul

    Comparaison de deux proportions à l'aide d'intervalles de confiance


    ------

    Bonjour,

    Supposons que nous ayons tiré deux échantillons donnant lieu à deux fréquences et d'un certain critère dans deux populations et . On cherche à savoir si les proportions du critère dans et dans peuvent être considérée comme "égales".

    Le test utilisé en classe de terminale est le suivant : on calcule les intervalles de confiance et associés aux fréquences et ; si ces intervalles sont disjoints on considère que la différence entre et est significative et que les proportions et sont différentes; si ces intervalles ne sont pas disjoins on considère que la différence entre et n'est pas significative et que les proportions et sont "égales".

    Première question : peut-on évaluer le risque d'erreur de se tromper ? Considérer que les proportions sont distinctes alors qu'elles ne le sont pas, ou considérer qu'elles sont égales alors qu'elles ne le sont pas.

    Il me semble comprendre "la philosophie" du test : si l'intersection est non vide alors pour toute proportion p dans cette intersection, les fréquences et sont dans l'intervalle de fluctuation de p et sont donc "vraisemblables". Ces deux fréquences sont peuvent être issues de populations présentant la même proportion p du caractère où p est dans l'intersection des intervalles de confiance.

    Mais ce qui me dérange énormément c'est de ne pas comprendre comment l'on peut évaluer le risque de se tromper.

    Pourriez-vous m'éclairer sur la question ?

    Merci.

    -----

  2. #2
    mgtoul

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Plus précisément ma question est : peut-on évaluer la probabilité que p appartiennent à l'intersection des intervalles de confiances aléatoires associés à et (variables aléatoires associant à tout échantillon de taille n la fréquence du caractère dans l'échantillon) ?

  3. #3
    gg0
    Animateur Mathématiques

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Bonjour.

    Ta question est mal posée, car p n'est pas aléatoire, donc parler de la probabilité que p fasse ceci ou cela n'a pas de sens. En fait, pour poser correctement cette question, il faut utiliser la théorie des tests d'hypothèse, et alors on n'a plus besoin de tout ce fatras. Et aussi, la notion de "risque de se tromper" n'a pas trop d'existence, elle ne se mathématise pas.

    D'ailleurs ces raisonnements sur l'intersection ou pas des intervalles de confiance ne reposent justement sur rien. On peut avoir des intervalles qui se recouvrent et conclure, par un test sérieux, qu'il est préférable de rejeter l'hypothèse que la proportion est la même dans les deux populations.

    Je ne sais pas combien de temps on continuera à faire ces exercices absurdes, la nécessité de connaissances statistiques réelles pour pas mal de disciplines au niveau bac+2 à bac+4 est forte, ce qui est fait en lycée, loin d'y être une introduction, amène des confusions et plus de travail pour les enseignants ensuite.

    Cordialement.

  4. #4
    mgtoul

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    p n'est pas aléatoire mais et si. Dans les intervalles de confiance, je remplace et par et et ainsi je peux parler de la probabilité que p appartienne à l'intersection de ces deux intervalles aléatoires.

  5. A voir en vidéo sur Futura
  6. #5
    gg0
    Animateur Mathématiques

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Pour p fixé, tu peux calculer cette probabilité. C'est l'idée des tests d'hypothèse. Mais si p est fixé, est-t-il raisonnable de parler des intervalles de confiance ? Puisqu'on connaît p (et qu'on fait l'hypothèse que les proportions sont égales), on ne peut plus considérer que la proportion est inconnue. Mais on peut alors calculer la probabilité qu'on ait tiré un échantillon qui donne la fréquence , et aussi un échantillon qui donne la fréquence . Je te laisse faire, ce genre de calculs, très peu pour moi ...

    Cordialement.

  7. #6
    mgtoul

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Après une bonne nuit de sommeil, il m'est venu le raisonnement suivant :

    Supposons que nous ayons une population E pour laquelle un caractère donné est en proportion p. Introduisons la variable aléatoire F qui à tout échantillon de taille n associe la fréquence du caractère dans l'échantillon (on considère que la prise d'échantillon s'effectue au hasard et avec remise). Notons IF(p) l'intervalle de fluctuation de p au seuil de 95% et IC(F) l'intervalle de confiance au seuil de 95% de p.
    Alors d'où
    Considérons l'expérience aléatoire qui consiste à tirer successivement et indépendamment deux échantillons de taille n dans E. Notons la fréquence du caractère dans le premier échantillon et la fréquence du caractère dans le deuxième échantillon. Les tirages étant indépendants, les variables et sont indépendantes et de même loi. Ainsi les évènements et sont indépendants d'où

    Ce qui permettrait de conclure que le risque de rejeter à tort l'hypothèse "les proportions sont identiques" serait de environ 10%.

    Ce que je dis est peut être totalement faux... Mais au moins j'ai tenté quelque chose.

  8. #7
    gg0
    Animateur Mathématiques

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Effectivement,

    ce que tu dis est assez cohérent, en ayant bien à l'esprit que p est une valeur fixe et que les variables aléatoires en cause sont . En fait, les deux premières sont suffisantes, puisqu'elles définissent les intervalles.
    Cependant, ce raisonnement n'a de sens que lors du tirage de deux échantillons indépendants dans une seule et même population. ce qui élimine d'office la comparaison de deux populations (on ne peut plus assurer la constance de p, c'est justement ce qu'on voudrait justifier). Et même la comparaison de deux échantillons pris à des dates différentes.
    Je ne connais pas les exercices qu'on fait en terminale aujourd'hui, s'agit-il de comparer deux échantillons indépendants pris dans des conditions identiques ?

    Cordialement.

  9. #8
    mgtoul

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Ce que je cherche à quantifier c'est une probabilité conditionnelle.
    Je m'y connais très peu en statistiques mais voilà ce que j'ai cru comprendre pour l'instant :
    Dans le langage des tests statistiques, il y a ce que l'on appelle l'hypothèse et l'hypothèse . Dans le cas qui m'intéresse et
    Le risque de rejeter à tort l'hypothèse appelé "risque " est la probabilité conditionnelle .
    Je me place donc dans le cas où est vraie.
    J'ai donc .
    Maintenant, je ne crois pas qu'il y ait de différence entre tirer un échantillon de taille n "simultanément dans les deux urnes" ou "successivement et indépendamment dans une seule et même urne".
    De toute façon quand on tire des échantillons, on se place toujours dans le cas où les épreuves de Bernoulli sont indépendantes, sinon on ne peut pas appliquer la théorie sur les intervalles de fluctuation et de confiance.

  10. #9
    gg0
    Animateur Mathématiques

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Désolé,

    je ne comprends pas tes deux derniers paragraphes. Pour le dernier, c'est surtout que ce que tu dis n'est pas vrai (on sait traiter les proportions sur un tirage sans remise, avec la loi hypergéométrique). Celui d'avant m'est par contre obscur.

    Pour la comparaison de proportions entre deux échantillons, on a toujours (si les effectifs sont suffisants) la possibilité d'utiliser un test du Khi-deux. On voit d'ailleurs que le classique test de comparaison de proportions (effectifs d'échantillons importants pour utiliser l'approximation gaussienne), analogue au t-test de Student, donne exactement les mêmes résultats. Mais la question du risque se pose différemment, et la probabilité que tu veux calculer est en fait une donnée du test : On choisit avant le test le risque de rejeter H0 à tort.

    Cordialement.

  11. #10
    Dlzlogic

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Bonjour,
    J'ai un peu de mal à trouver où est une faute à partir d'un raisonnement qui met en cause des notions mal définies, je veux parler de l'intervalle de confiance à 95%, c'est à dire 2 écarts-types. C'est une limite fréquemment utilisée mais un peu simplifiée, ce qui fait qu'elle perd une partie de son sens.

    On a deux ensembles EA et EB et un critère C à tester, le même pour les deux ensembles, sinon cela l'a pas de sens.
    On en déduit une proportion pA et pB pour chaque ensemble satisfaisant ce critère. Conformément au TCL, la proportion d'éléments satisfait la loi normale. Cette proportion est pA et pB, une table ou une simple appréciation graphique donnera le rapport de probabilité, qui n'a en l'occurrence aucune raison d'être 2 écarts-type, il est ce que donne le calcul.
    Peut-être un exemple numérique et une représentation graphique permettrait d'éclaircir le problème.
    Il est important de définir la variable étudiée et le test effectué.

  12. #11
    bon prof math

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    bonjour
    Citation Envoyé par Dlzlogic Voir le message
    J'ai un peu de mal à trouver où est une faute à partir d'un raisonnement qui met en cause des notions mal définies, je veux parler de l'intervalle de confiance à 95%, c'est à dire 2 écarts-types.
    tout est bien défini, pas de souci, il suffit d'ouvrir un livre de proba-stats pour voir les définitions.

    << intervalle de confiance à 95%, c'est à dire 2 écarts-types. >> est généralement un contre-sens. Tout dépend de la loi de probabilité suivie par la variable aléatoire...

    Citation Envoyé par Dlzlogic Voir le message
    Il est important de définir la variable étudiée et le test effectué.
    C'est parfaitement fait ! Il suffit de lire (et comprendre) les messages ci-dessus...

  13. #12
    Dlzlogic

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    J'ai écrit ce message à l'attention de l'auteur de la question.
    En effet, ceci ne lui semble pas clair, puisqu'il a éprouvé le besoin de dire :
    Je sais que le raisonnement suivant est faux mais je ne vois pas où et pourquoi il est faux : [...]
    (source : un autre forum).

    Une façon d'expliquer les choses : l'écart-type se calcule suivant une formule précise. Que ce soit un échantillon ou la liste complète des éléments ne change rien. Sur un ensemble, on aura un écart-type eA, sur l'autre on aura un écart-type eB. Il n'y a aucune raison que ses deux valeurs soient égales.
    Maintenant sur le taux de confiance. On adopte souvent 95%. Pourquoi, je n'ai pas trouvé d'autre explication que ça correspondait à environ 2 écarts-types. Deux valeurs faciles à mémoriser.
    A partir du moment où on utilise ces valeurs (95% ou 2e-t) cela sous-entend qu'on est en droit de le faire, donc que l'on connait la répartition des écarts. Or on ne l'a pas calculée, puisque l'on n'a effectué qu'une seule mesure.
    C'est là qu'est la faute, cela pourrait se résumer sous la forme "si une erreur était connue, ce ne serait plus une erreur" (L-P).

  14. #13
    feanorel

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Une façon d'expliquer les choses : l'écart-type se calcule suivant une formule précise. Que ce soit un échantillon ou la liste complète des éléments ne change rien. Sur un ensemble, on aura un écart-type eA, sur l'autre on aura un écart-type eB. Il n'y a aucune raison que ses deux valeurs soient égales.
    Encore une fois il faut distinguer l'écart-type d'une série de données de l'écart-type d'une variable aléatoire.
    Prenons un exemple :
    - je considère l'ensemble des Français, et m'intéresse à leur taille (en cm). Il s'agit d'une série de valeur, qui a une moyenne m, et un écart-type s.
    - La taille d'un Français tiré au hasard (uniformément sur l'ensemble des Français) est une variable aléatoire à valeurs réelles (entre 0 et 250 par exemple). Elle a une espérance (égale à m) et un écart-type (égale à e).
    - Je note le taille de N=1000 individus choisit au hasard successivement (en pouvant éventuellement reprendre le même). Cela consistue donc une liste de 1000 valeurs A, dont je peux calculer la moyenne mA et l'écart-type eA.
    - je recommence et obtient mB et eB.

    eA est une estimation de e (en effet, plus N est grand plus eA sera proche de e). Elle est biaisée (la moyenne des eA sur l'ensemble des tirages possible n'est pas l'écart-type de la population totale). Pour avoir un estimateur non biaisé il faut prendre la division par N-1.
    eB est aussi une estimation de e.

    Il y a de bonnes raison de penser que sA est proche de sB.

  15. #14
    bon prof math

    Re : Comparaison de deux proportions à l'aide d'intervalles de confiance

    Dlzlogic
    Ton laïus est hors sujet : personne, à part toi, ne parle d'écart-type, ce n'est pas le sujet !! On parle d'intervalles de confiance, d'intersection, etc.. As-tu au moins appris ce qu'est un intervalle de confiance ? (car il n'y a encore quelques semaines, tu ignorais totalement cette notion : http://forums.futura-sciences.com/ma...ml#post5894199 ...)

Discussions similaires

  1. Intervalles de confiance
    Par MDC21 dans le forum Mathématiques du supérieur
    Réponses: 4
    Dernier message: 17/11/2013, 16h58
  2. stats : intervalles de confiance
    Par invite81777991 dans le forum Mathématiques du supérieur
    Réponses: 3
    Dernier message: 18/11/2009, 20h35
  3. Comparaison de deux proportions sur ech appariés
    Par invite18803671 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 10/11/2008, 18h07
  4. Statistique : Test de Comparaison de deux proportions
    Par invite3a28dcc6 dans le forum Mathématiques du supérieur
    Réponses: 5
    Dernier message: 23/01/2006, 20h50
  5. [Statistiques]Test de comparaison de deux proportions
    Par invite3a28dcc6 dans le forum TPE / TIPE et autres travaux
    Réponses: 0
    Dernier message: 21/01/2006, 22h57