Statistiques, comment évaluer un intervalle d'erreur.....
Répondre à la discussion
Affichage des résultats 1 à 11 sur 11

Statistiques, comment évaluer un intervalle d'erreur.....



  1. #1
    Cielbleu92

    Statistiques, comment évaluer un intervalle d'erreur.....


    ------

    Bonjour à tous,
    J'ai deux échantillons de 47 éléments chacun, il s'agit de 47 mesures présentées sous la forme de valeurs numériques. Ces mesures ont toutes été faites au hasard sur deux machines différentes.
    Je sais que chacun des échantillons obéit à une distribution de gausse. Je connais l'écart type de chaque distribution, 13 pour la première et 20 pour la deuxième. Par contre, je ne connais pas la moyenne.

    Je calcule les deux moyennes, disons M1 et M2 (excusez des notations, juste plus simple ici dans le corps du message).
    Comment faire pour estimer la marge d'erreur associée à la différence des moyennes calculées ? en gros, quel est le calcul qui utiliserait les écart types et le nombre d'éléments des échantillons pour en déduire une estimation de la réelle différence des moyennes ?

    Toute aide bienvenue, grand merci d'avance.

    -----

  2. #2
    gg0
    Animateur Mathématiques

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    Bonjour.

    Tu as dû voir en cours que chacune des moyennes d'échantillon suit une loi Normale de même moyenne, de variance divisée par l'effectif. Si X est la variable aléatoire "moyenne d'un échantillon de type 1", X suit la loi Normale de moyenne M1, de variance 13²/47; idem pour Y, la variable aléatoire "moyenne d'un échantillon de type 2". Si X et Y sont indépendants (il ne s'agit donc pas de 2 échantillons d'une même population, mais par exemple de mesures par des procédés différents, ou de cotes sur des machines différentes), alors X-Y, la différence des moyennes, suit la loi Normale de moyenne M1-M2, de variance 13²/47+20²/47 (pour des variables indépendantes, la variance est additive, et -Y a la même loi que Y au signe de la moyenne près).

    Cordialement.

  3. #3
    Cielbleu92

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    Bonjour gg0,

    Merci de votre réponse. Voyons voir. Oui, les moyennes 1 et 2 calculées sur des échantillons au hasard des pop 1 et 2 suivent une loi normale avec la même moyenne que les populations 1 et 2. ok. Je sais et je comprends. Par contre, je ne comprends pas bien la phrase "de variance divisée par l'effectif". Certes, plus l'échantillon est important, moindre est la variance, je le conçois. Mais je ne comprends pas "de variance divisée par l'effectif". Dans mon cas concret, la variance de pop 1 est 13 et l'effectif de l'échantillon extrait de pop1 est 47. Dois-je divisé 13 par 47 ? NB: plutot 13^2 si je regarde bien l'application numérique (détail mais je précise juste pour être sûr). Je conçois que si j'avais tiré 1 mesure au lieu de 47, j'aurais effectivement la même variance que la pop sous-jacente. Si j'avais 2... hum, oui, pourquoi pas une variance 4 fois moindre.... c'est bien l'idée ?

    Ci dessus, c'était ma première remarque-question.

    Ensuite, sur le reste.... la notation M1 dans mon message représente la moyenne des 47 mesures, ce n'est pas la moyenne de la pop 1. Parle-ton bien de la même chose avec M1 dans votre message et mon message ? Je ne suis pas sûr. C'est important de clarifier pour que je puisse bien suivre le reste de votre explication.

    Dans l'attente de vous lire, grand merci !! passionnant....

  4. #4
    gg0
    Animateur Mathématiques

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    Je n'ai fait que rappeler et utiliser des règles de cours :

    * Soit X une variable gaussienne (*) de moyenne m, de variance v. La moyenne M d'un échantillon pris au hasard de n valeurs de X est une variable gaussienne de moyenne m, de variance v/n.
    * Si X et Y sont des variables gaussiennes indépendantes, X+Y est une variable gaussienne.
    * Propriétés des moyennes et des variances
    * Symétrie de la densité d'une variable gaussienne.

    Si ça te perturbe, remplace mes M1 et M2 par m1 et m2, les moyennes vraies.

    (*) = Normale.

  5. A voir en vidéo sur Futura
  6. #5
    Cielbleu92

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    Bonsoir gg0,

    Merci de votre réponse. En fait, j'ai deux séries de points (importantes séries, en gros 2400 points pour la série A et 1000 points pour la série B). Ces points représentent la performance d'une machine A et celle d'une machine B. En reportant chacun des 3400 points, j'obtiens deux tracés. Clairement, ces tracés ne sont pas exactement des distributions gaussiennes mais elles s'en rapprochent pas mal quand même (voir fichier Excel en pj).

    Ma machine A a une performance moyenne m1 de 79.2 (ce sont des % en pratique, peu importe) tandis que ma machine B a une perf moyenne m2 de 64.1. C'est visible dans le fichier excel.

    Ok. Je souhaite prendre un intervalle de confiance à 95% sur la différence des moyenne m1 et m2.

    En gros, j'aimerais pouvoir dire avec 95% de certitude que la différence entre la machine A et la machine B est de [14.7;15.9] (par exemple). Je cherche à calculer les bonnes valeurs de cette intervalle. Et je galère. Comment feriez-vous pour présenter la différence des performances entre A et B ? peut-être que mon approche est fausse...

    curieux...

    Grand merci...
    Fichiers attachés Fichiers attachés
    Dernière modification par Cielbleu92 ; 14/09/2021 à 20h05.

  7. #6
    gg0
    Animateur Mathématiques

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    Pas du tout interprétable, ton fichier. Et tu as laissé tomber le 47 ???

    L'analyse que j'ai faite devrait pouvoir convenir, car une moyenne de très grand nombre de valeurs étalées suit approximativement une loi Normale. En admettant que ce sont de vrais échantillons et pas la population globale (*), tu peux supposer que la différence suit une loi Normale de moyenne inconnue M, de variance 13²/n1+20²/n2 = s² (s est l'écart type, n1 et n2 les tailles d'échantillon) , et en déduire l'intervalle de confiance sur la vraie moyenne : avec 95% de confiance, la différence mesurée, d, vérifie m-2s<d<m+2s, d'où on tire d-2s<M<d+2s. Et tu as ton intervalle.

    Cordialement.

    (*) sur la population globale, il n'y a pas d'intervalle de confiance, ou si tu veux, à 100% de confiance, la différence est 79,2-64,1. Si on a pris toutes les valeurs sur une période, les conclusions qu'on va en tirer seront soumises à l'hypothèse forte "si les conditions de fabrication ne changent pas" (hypothèse peu crédible, car les machines s'usent).

  8. #7
    Cielbleu92

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    A nouveau, grand merci.

    En fait, les 2 échantillons de 47, c'est une question en parallèle, ce sont 47 mesures de la machine A et 47 mesures de la machine B. Mais les conditions de fonctionnement étaient pas suffisamment semblables entre les deux échantillons donc on ne peut pas tirer grand chose de la comparaison des deux séries de 47 si ce n'est que chacune est compatible avec les grandes séries de 2394 sur la machine A et de 1069 sur la machine B.

    Oui, la distribution des 2394 de la machine A est pas trop loin d'une distrib normale même si on voit quand même qu'elle est plus étalée sur la partie gauche et plus abrupte sur la partie droite. Mais faut resté simple dans ce premier calcul, donc restons sur la simplification consistant à dire distrib normale. Même raisonnement sur les 1069 points de la machine B.

    Commentaire1: Il n'y a pas vraiment de population car il s'agit de deux machines qui exécutent chacune une tache. Ces machines ont la même vocation, celle d'atteindre les 100%, et la machine A dispose d'une technologie supplémentaire (type IA) par rapport à la machine B. Je cherche à valider l'effet et donc ensuite la valeur de cet apport technologique présent dans la machine A. Pour revenir au sujet de "population", elle n'existe pas car ces machines tournent tous les jours, les données sont produites en permanence.

    Commentaire2: L'affirmation "la différence des deux machines suit une loi normale", n'est pas évidente. Je note que tu en fais une hypothèse d'ailleurs. Y'a t-il un moyen de creuser un peu cet aspect particulier ? comment puis-je étayer l'idée que la différence de performance suit une loi normale également ?

    Commentaire3: Acceptons l'hypothèse avancée, ie, la différence suit bien une loi normale. Ok, donc elle se caractérise par m et s² avec s²= (13²/2394+20²/1096) soit s²=0.47. Ma première réaction est de voir que la variance de la différence est super faible, ça me semble bizarre. J'ai raté quelque chose ?

    Dans l'attente de vous lire.


  9. #8
    gg0
    Animateur Mathématiques

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    1) OK.
    2) On fait des statistiques, des maths appliquées, donc un modèle imparfait vaut mieux que pas de méthode.
    3) Rien de surprenant, tu as de très grands échantillons.

    Cordialement.

    NB : la forme des distributions n'intervient pas ici puisque c'est la distribution des moyennes qui est utilisée. Je n'avais parlé de loi Normale que parce que tu en avais parlé.

  10. #9
    Cielbleu92

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    Bonsoir,

    Il me semble que la variance (Sd) de la différence entre la performance de la machine A et la machine B est Sd²=Sa² + Sb². Donc Sd²=20²+13², donc Sd=23.8. Dans notre échange, à un moment, on trouve Sd=0.47. Je trouvais cela très faible et vous aviez indiqué que "possible car grande série".

    Donc question... pourquoi divisez-vous Sa² par Na et pareil pour Sb² qui est divisé par Nb ? désolé si ma question parait un peu naïve, mais je ne comprends pas bien.

    Ensuite, je cherche à calculer la moyenne (Md) de la différence et, naturellement, il vient Ma-Mb à l'esprit, soit 15.1. Par contre, cette valeur Md doit s'accompagner d'un intervalle de confiance. La taille de cet intervalle dépend du niveau de confiance que l'on cherche. Si je cherche 95% par exemple, j'applique ce que nous énoncez dans votre message:

    "la différence mesurée, d, vérifie m-2s<d<m+2s, d'où on tire d-2s<M<d+2s. Et tu as ton intervalle."

    ça donne

    Md-2s<15.1<Md+2s
    15.1-2s<Md<15.1+2s

    Je ne sais pas où trouver la valeur de s compte tenu des 95% recherchés. Sauf erreur, la valeur de s est dispo dans une table, non ?

    A nouveau, merci de votre réponse et suivi sur ce thread....

    : - )

  11. #10
    gg0
    Animateur Mathématiques

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    Bon, manifestement, tu ne me fais pas confiance quand j'applique les méthodes classiques des statistiques. Il n'y a qu'une seule façon pour toi d'avoir tes réponses : Apprendre les statistiques (*), puis appliquer les méthodes générales à ta situation particulière. Pour ma part, je ne tiens pas à passer des heures à écrire sur un forum ce qui est dans tous les bons bouquins de statistiques. J'arrête là.

    Cordialement.

    NB : Je suis sûr que si quelqu'un vient redire ce que j'ai expliqué tu seras content alors que tout est déjà dit.

    (*) Ça peut se faire seul dans des bouquins, c'est comme ça que j'ai commencé, et même enseigné au niveau universitaire.

  12. #11
    Cielbleu92

    Re : Statistiques, comment évaluer un intervalle d'erreur.....

    Bonjour gg0, je ne remets pas en question ce que vous dites, bien au contraire, j'apprécie la forte qualité de vos messages. Je partageais juste mon raisonnement pour que vous puissiez me montrer où il s'égare. Il ne faut pas prendre les choses comme ça, je suis désolé si vous vous êtes senti contrarié, sincèrement 1000 excuses. C'était juste un échange et une discussion. Bien cordialement.

Discussions similaires

  1. Intervalle de dispersion Statistiques
    Par invite3a39a912 dans le forum Mathématiques du collège et du lycée
    Réponses: 1
    Dernier message: 03/12/2017, 15h42
  2. Réponses: 5
    Dernier message: 14/02/2015, 13h12
  3. Statistiques : Intervalle de confiance
    Par kiwi111 dans le forum Mathématiques du collège et du lycée
    Réponses: 24
    Dernier message: 21/04/2014, 14h48
  4. statistiques : évaluer la dispersion de 2 valeurs
    Par invite83581e68 dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 05/06/2012, 17h23
  5. CXX0030: Erreur*: impossible d'évaluer l'expression
    Par invite8a011b82 dans le forum Programmation et langages, Algorithmique
    Réponses: 5
    Dernier message: 20/01/2011, 10h37