Statistiques : Intervalle de confiance
Répondre à la discussion
Affichage des résultats 1 à 25 sur 25

Statistiques : Intervalle de confiance



  1. #1
    invite4bbc41d7

    Question Statistiques : Intervalle de confiance


    ------

    Bonjour,

    J'ai un petit problème concernant cet exercice. J'espère que vous pourriez me mettre sur la voie

    Voici l'énoncé

    En avril 2002 le candidat Jean-Marie Le Pen a surpris tout le monde en battant Lionel Jospin au premier tour des élections présidentielles en France. Une semaine avant le premier tour, une sondage donnait 14% d'intentions de vote pour J-M Le Pen et 18% pour L. Jospin.

    Soit p1 et p2 la proportion des votes pour les candidats Le Pen et Jospin. p1 et p2 sont inconnues : on cherche à les évaluer par un sondage sur 1000 personnes.

    1) Soit f1 et f2 la proportion des votes pour les candidats Le Pen et Jospin sur le sondage dont on a donné le résultat précedemment, donner la valeur de f1 et f2.

    2) On va réaliser une simulation pour trouver expérimentalement un intervalle de confiance pour chacune des valeurs de p1 et p2.
    On a fait une simulation avec un jeu où l'on a 14 % de chance de gagner.

    En lisant le graphique, proposer un intervalle de confiance autour de la valeur 0.14 qui contient tous les points sauf les 5 points ayant les valeurs les plus éloignées de 0.14. Cet intervalle correspondra à un intervalle de confiance au niveau 95 %.

    Voici le graphique : http://hpics.li/5345826

    3) On a fait une simulation identique avec un jeu où l'on a 18 % de chance de gagner.
    Proposer un intervalle de confiance autour de la valeur 0.18 qui contient tous les points sauf les 5 ayant les valeurs les plus éloignées de 0.18.

    Voici le graphique : http://hpics.li/b365706

    4) Au vu de ces deux intervalles de confiance, était-il envisageable que J-M Le Pen batte L.Jospin ?

    5) Le résultat du 1er tour fut le suivant : L. Jospin a obtenu 16.18% des voix et J-M Le Pen 16.86 %.

    a) Donner alors la valeur de p1 et p2

    b) Ces deux valeurs appartiennent-elles aux intervalles de confiance au niveau 95 % trouvés ci-dessus ?

    Ce que j'ai fait

    1) f1 = 0.14 et f2 = 0.18

    2) et 3) Ici, j'hésite puisque je ne sais pas si je me trompe en lisant les deux graphiques. Il faut exclure les 5 points les plus éloignées de 0.14 pour 1er graphique et 0.18 pour le deuxième graphique.

    Pour le premier graphique, l'intervalle de confiance est de [0,12;0.16] et pour le deuxième graphique, j'ai fait [0,16;0.20]

    4) Je ne sais pas comment procéder pour cette question.

    Merci d'avance.

    -----

  2. #2
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Bonjour.

    Effectivement, tu as pris les intervalles qui semblent approximativement convenir.

    Pour la question 4, si le pourcentage de votes pour chaque candidat est dans son intervalle de confiance, Le Pen peut-il battre Jospin ?

    Cordialement.

  3. #3
    invite4bbc41d7

    Re : Statistiques : Intervalle de confiance

    Tout d'abord, je vous remercie de m'avoir répondu.

    0.14 appartient à l'intervalle [0.12;0.16] et 0.18 appartient à l'intervalle [0.16;0.20]

    En fait, je sais pas comment je peux utiliser ce que je viens d'écrire pour dire si Le Pen peut-il battre Jospin.

    Je vous remercie de m'aider, je suis un peu perdu.

  4. #4
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    0,14 n'est pas le pourcentage de votes, mais le résultat du sondage. le sondage porte sur 1000 personnes, le vote sur des millions ..

  5. A voir en vidéo sur Futura
  6. #5
    invite4bbc41d7

    Re : Statistiques : Intervalle de confiance

    Il y a écrit ''un sondage donnait 14% d'intentions de vote pour J-M Le Pen et 18% pour L. Jospin''

    Donc 14% et 18% sont bien le pourcentage de vote ?

    Merci de m'éclaircir davantage.

  7. #6
    invite51d17075
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Non, « intentions » de vote, et à la date T.
    Tu oublies au moins deux facteurs importants ( outre la taille de l’échantillon )
    -Les instituts de sondage savent que les électeurs FN ont une tendance plus importante que les autres à « cacher » leurs intentions de vote, même si on leur assure que le sondage est anonyme.
    Ce facteur est pris en compte, mais sur des bases heuristiques liées aux élections passées.
    Or , l’élection présidentielle a un poids considérable constitutionnellement dans notre pays.
    Et la dernière élection présidentielle ( si spécifique dans notre beau pays )remontait 7 ans auparavant.
    Et il me semble assez systématique que les votes FN dépassent tj les prévisions des sondeurs.
    -Par ailleurs, il n’est pas exclus, que fort de la certitude que Jospin soit au deuxième tour
    ( liée justement aux derniers sondages ), beaucoup d’électeurs aient voté « alternatif » au premier, en réservant leur « vote utile » au second.

    Les algorithmes des instituts sont très complexes, mais leur validité dépend étroitement des variables d’ajustement qu’ils y introduisent.

  8. #7
    Boumako
    Invité

    Re : Statistiques : Intervalle de confiance

    Je ne vois pas très bien le rapport entre cette réponse et l'exercice posé.

    14% et 18% sont le pourcentage d'intention de vote. Si on prend un autre échantillon de 1000 personnes ces valeurs ne seront pas forcément les mêmes. L'intervalle de confiance prend en compte cette variabilité.

  9. #8
    invite51d17075
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Cela me semblait pourtant une réponse.
    En premier lieu, il y a bien une différence entre intention « déclarée » et vote effectif, pour les raisons que j’ai donné.

    On pourrait y ajouter les indécis ou presque indécis ( qui hésitent entre ecolo ou socialiste ) au premier tour à 45%/55% et qui finissent par « légèrement changer leur intention ou s’abstenir, en ayant pourtant donné une intention au sondeur.

    Quand à l’échantillon, effectivement son nombre intervient dans la marge d’erreur du modèle, mais pour avoir collaboré avec un institut de sondage dans le cadre d’une mission de consulting, le choix de l’échantillon est très minutieusement construit de manière à réduire au maximum la marge d’erreur.
    Reste que ce point est important ( d’ailleurs je le mentionne en introduction )

    En quoi penses tu que ma réponse est un peu « à coté de la plaque » dans les éléments que je présente ?
    Cordialement

  10. #9
    invite51d17075
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Mais tu rejoins indirectement ce que je dis, l’intervalle de confiance inclus de nombreux paramètres, dont l'incertitude liée à l'échantillon, mais pas que ça, et le poids de chacun correspond au modèle de l’institut et a une influence très importante sur la fiabilité des sondages.

  11. #10
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Ansset,

    dans cet exercice (probablement de seconde), les aspects non statistiques des prévisions sondagières ne sont pas en cause. Bien que ce soit une aberration, l'intention de l'auteur est de faire comme si le sondage était fait sur les votes (puis de voir qu'il y a eu une modification entre les intentions et les votes. C'est un très mauvais exercice !

    Cordialement.

  12. #11
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Kiwi11 :

    Sur les 1000 personnes interrogées, on a trouvé 18% pour Jospin. Sur un autre échantillon de 1000, on aurait probablement trouvé un autre pourcentage, et si on avait pu interroger tous les futurs votants, encore un autre pourcentage. L'intervalle de confiance est justement fait pour dire où se trouvent probablement tous ces pourcentages, donc entre 16 et 20.

    Maintenant, tu es assez intelligent pour conclure toi-même sur le fait que Le Pen puisse battre Jospin si les votes suivent les intentions.

    Cordialement.

    NB : On peut te donner une réponse toute faite, qui ne t'apprendra rien. Mais ce n'est pas la règle sur le forum.

  13. #12
    invite51d17075
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    bonjour gg0,

    Citation Envoyé par gg0 Voir le message
    Ansset,

    dans cet exercice (probablement de seconde), les aspects non statistiques des prévisions sondagières ne sont pas en cause. Bien que ce soit une aberration, l'intention de l'auteur est de faire comme si le sondage était fait sur les votes (puis de voir qu'il y a eu une modification entre les intentions et les votes. C'est un très mauvais exercice !

    Cordialement.
    Tu as totalement raison sur le fond.
    Puisqu’à la base, il s’agit d’un exercice de statistique.
    Mais d’un autre coté, il est parfois justement utile de refaire un tour dans le monde réel pour expliquer par les faits à quoi correspondent les modèles mathématiques.
    Et ici justement de faire apparaitre la diff entre intention de vote et vote.
    Si l’exercice, ou le prof, ne l’évoque pas, c’est ……balot ! ( euphémisme )

    Cdt

  14. #13
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Voilà pourquoi je ne donnais jamais d'exercice sur les intensions de vote quand j'enseignais les statistiques. Seulement sur les résultats partiels de dépouillement. Quitte à faire une digression sur les sondages préélectoraux lors de la correction.
    C'est aussi pourquoi les sondeurs ne donnent jamais leurs "recettes de cuisine".

    Cordialement.

  15. #14
    invite4bbc41d7

    Re : Statistiques : Intervalle de confiance

    Bonjour,

    Merci de m'avoir répondu.

    Si les votants suivent les intentions, il n'était pas envisageable pour que J-M LePen batte L. Jospin puisque 0.16>0.12.

    Merci d'avance.

  16. #15
    invite51d17075
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    D’où la très grande pertinence mathématique de l’exercice !!!!
    Enfin tout dépend un peu ensuite du prolongement explicatif du prof.
    Laissons lui le bénéfice du doute.
    Mais c’est pas gagné, justement parce qu’il ne peut expliquer simplement les recettes des sondeurs, les paramètres pris en compte et le pourquoi quantitatif des différences.
    Et qu’il ne peut dire non plus que les sondeurs font n’importe quoi .

  17. #16
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Je ne comprends pas le " puisque 0.16>0.12".

    Manifestement, Kiwi111, tu ne comprends pas ce qu'est un intervalle de confiance.
    D'après les résultats du sondage, quel est probablement le nombre de français qui avaient l'intention de voter Le Pen ?

  18. #17
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Ansset : Effectivement !

    La notion d'intervalle de confiance est délicate parce qu'elle demande de réfléchir (pas de choisir au hasard ou de "faire comme"). Quand en plus, on la traite dans un cadre malsain ...

    Cordialement.

  19. #18
    Boumako
    Invité

    Re : Statistiques : Intervalle de confiance

    Citation Envoyé par ansset Voir le message
    Mais tu rejoins indirectement ce que je dis, l’intervalle de confiance inclus de nombreux paramètres, dont l'incertitude liée à l'échantillon, mais pas que ça, et le poids de chacun correspond au modèle de l’institut et a une influence très importante sur la fiabilité des sondages.
    C'est sur ce point que je ne suis pas d'accord, l'intervalle de confiance correspond uniquement à la taille de l’échantillon choisi, sans considération sur le parti politique ou autre.
    L'évoquer ici ne peut à mon avis qu'égarer l'auteur de la question (surtout que ce n'est pas juste).

  20. #19
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Boumako,

    l'intervalle de confiance sur un échantillon de grande taille choisi au hasard ne dépend que de la taille de l'échantillon. Mais ici, on a un résultat "redressé" par le sondeur qui a interrogé 1000 personnes pas vraiment choisies au hasard (il faut bien qu'ils acceptent de répondre !!) et qui ne donnent pas obligatoirement leur choix.
    Faire faire des exercices de statistiques pour débutants sur des situations aussi floues n'est pas leur rendre service. Ou alors, il faut poser très clairement le problème de la différence entre la théorie et la réalité.

    Cordialement.

  21. #20
    Boumako
    Invité

    Re : Statistiques : Intervalle de confiance

    Je suis tout a fait d'accord sur le fond, mais ici il s'agit d'un exercice statistique. Peux tu me montrer où dans l'énoncé il est question de variable corrective, fonction du parti politique ou autre ?

    Je pense que ce qui ne rend pas service ce sont ces remarques hors sujet, et qui surtout sont fausses, car si on calcule l'intervalle de confiance d'un échantillon de 1000 personnes avec les pourcentages donnés on retombe bien sur les mêmes intervalles, et ceci indépendamment de la nature du sondage.

  22. #21
    gg0
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Si tu relis l'ensemble,

    tu verras qu'il n'y a eu qu'une seule intervention adressée à Kiwi111 qui évoque le sujet. manifestement, il n'en a pas tenu compte, et n'importe comment, il semble ne pas saisir non plus le lien entre ses cours et cet exercice qu'on n'aurait jamais dû lui poser (faux concret).

  23. #22
    Boumako
    Invité

    Re : Statistiques : Intervalle de confiance

    Peut être, mais une seule intervention c'est déjà trop. C'est un peu comme si pour un exercice de trains qui se croisent posé par un élève de seconde on faisait remarquer qu'il faut effectuer une correction relativiste sur les vitesses : C'est hors sujet.

  24. #23
    invite51d17075
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    Citation Envoyé par Boumako Voir le message
    Je suis tout a fait d'accord sur le fond, mais ici il s'agit d'un exercice statistique. Peux tu me montrer où dans l'énoncé il est question de variable corrective, fonction du parti politique ou autre ?

    Je pense que ce qui ne rend pas service ce sont ces remarques hors sujet, et qui surtout sont fausses, car si on calcule l'intervalle de confiance d'un échantillon de 1000 personnes avec les pourcentages donnés on retombe bien sur les mêmes intervalles, et ceci indépendamment de la nature du sondage.
    Certes , ce n’est pas dans l’énoncé, et malheureusement les résultats sortent des clous, ce qui est génant tout de même pour un exercice mathématique.

    Pour le reste :

    Les statisticiens, notamment en matière de sondages politiques opèrent un grand nombre de corrections des données obtenues. Par exemple, les données CVS, corrigées des variations saisonnières, tentent de corriger les effets dus à la saisonnalité du phénomène mesuré. Si certains sont particulièrement évidents - une forte baisse de l'activité économique en août n'est pas le signe d'un effondrement économique - d'autres en revanche sont plus sujets à caution. En matière de sondages électoraux par exemple, on corrigera certains décalages entre déclaration et réalité des votes passés effectifs. On observe par exemple un décalage entre les déclarations d'intention de vote Front National et les votes réels, plus nombreux. Les statisticiens mesurent cet écart et le reportent pour les mesures suivantes afin de donner un chiffre plus représentatif de la réalité, c'est ce que l'on nomme le « redressement des résultats bruts ». Les détracteurs des sondages considèrent que l'on sort ici de la stricte mesure des déclarations d'intention de vote pour donner un chiffre ayant la prétention d'indiquer ce que les électeurs comptent faire en réalité, d'autant plus qu'aucune entreprise de sondages ne publie les pourcentages réellement exprimés ou leur multiplicateur. (wiki)

    d'autre part :il y a eu débat ( et peut etre encore ) sur la nature de l’échantillon : modèle aléatoire ou modèle dit représentatif.
    De fait sur un grand échantillon, un modèle aléatoire semble être privilégié 10000u 20000 ) mais sur un échantillonnage plus réduit ( 1000 ) les quota sont privilégiés.
    Mais qu’en est –il de la méthodologie utilisée pour définir un échantillon « représentatif ».
    La, il semble aussi, tout comme les coefficient de redressement que ce soit de la cuisine propre à chaque institut.

    globlement, c'est un sujet très mal choisi pour faire des stats.

  25. #24
    Boumako
    Invité

    Re : Statistiques : Intervalle de confiance

    Une fois encore je n'ai jamais dis le contraire, je dis simplement que ces précisions n'apportent rien à l'auteur du sujet.

  26. #25
    invite51d17075
    Animateur Mathématiques

    Re : Statistiques : Intervalle de confiance

    D’accord Boumako, l’aparté fut trop long et ne correspond pas à l’attente du primo-posteur.
    Lui doit évaluer les écarts types des intentions de vote en fonction de ses nuages de points pour calculer ses intervalles de confiance.
    C’est le sens de son exercice mathématique.
    S’il nous suit toujours, a nous de l’aider dans cette voie.
    cordialement

Discussions similaires

  1. intervalle de confiance et intervalle de pari
    Par invite9f31e17a dans le forum Mathématiques du supérieur
    Réponses: 7
    Dernier message: 08/04/2014, 14h14
  2. intervalle de confiance à 95%
    Par inviteb609e1c0 dans le forum Physique
    Réponses: 2
    Dernier message: 12/09/2012, 09h30
  3. Intervalle de confiance
    Par invitec88c91ab dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 24/03/2011, 18h17
  4. Intervalle de confiance
    Par inviteaad14840 dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 30/06/2010, 13h29
  5. intervalle de confiance
    Par invite007e6582 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 07/02/2010, 23h50