statistique à 2 variables
Répondre à la discussion
Affichage des résultats 1 à 24 sur 24

statistique à 2 variables



  1. #1
    quentino

    statistique à 2 variables


    ------

    Bonjour,
    J'aimerai bien savoir comment je dois faire pour résoudre un problème en statistique 2 variables . On me demande de faire une étude complète mais je ne vois pas ce que je dois calculer .
    D'après vous dois je faire des classes pour la variable en X et Y?
    Dois je représenter un graphique avec les points en (x;y),calculer le point moyen en x et y,trouver l'équation de la droite (régression linéaire). Par contre n=1 et N=20 (car 10 tôles pour A et 10 tôles pour b)? et variance et covariance et coefficient de corrélation sont aussi à déterminer? Je vous avoue être un peu perdu.
    Voici l'énoncé:

    Des tôles sont soumises à un traitement protecteur par galvanisation. IL est impératif de
    contrôler régulièrement l’épaisseur du revêtement protecteur. On dispose pour cela de deux
    procédés possibles : le premier (procédé A) est peu coûteux, mais peu précis ; le second
    (procédé B) est plus fiable, mais coûteux car il nécessite la destruction du revêtement. On a
    comparé les deux procédés en contrôlant 10 tôles. Sur le tableau ci-après, on trouvera les
    épaisseurs, exprimées en micron, estimées par chacun des deux procédés :

    N° de tôle Épaisseur x (procédé A) Épaisseur y (procédé B)
    1 44 41
    2 43 40
    3 45 44
    4 63 75
    5 53 58
    6 55 64
    7 57 65
    8 61 70
    9 47 46
    10 50 53



    Réalisez une étude statistique de ces données

    -----

  2. #2
    Dlzlogic

    Re : statistique à 2 variables

    Bonjour,
    Un ensemble de mesures indépendantes est caractérisé
    1- par la moyenne
    2- par l'écart-type.
    Dans un premier temps, il me parait utile de vérifier que chacune des deux expériences respecte la répartition normale. En d'autres termes, cela sous entend et vérifie que les tôles sont bien choisies de façon aléatoire, et qu'il n'y a pas de valeur "invraisemblable".
    On peut suppose que les mesures du type A ont une précision "parfaite". On peut donc considérer que la moyenne résultant de la mesure A est la moyenne vraie, chacune des épaisseur étant une épaisseur vraie..
    Les mesures faites avec la méthode B permettent de calculer, pour chacune des 10 tôles, l'écart à l'épaisseur vraie. On en déduit l'écart-type résultant de la méthode B.
    La comparaison des deux écarts-type permettra d'aider dans la décision du choix de la méthode de test.

  3. #3
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par quentino Voir le message
    le premier (procédé A) est peu coûteux, mais peu précis
    Citation Envoyé par Dlzlogic Voir le message
    On peut suppose que les mesures du type A ont une précision "parfaite".
    bizarre bizarre...

    Personnellement, je regarderais la corrélation entre les résultats des deux procédés A et B (nuage de points en 2 D), et en effet, la corrélation est très importante, ce qui encouragerait à privilégier le procédé A (car moins coûteux), tout en lui apportant une correction (donnée par la régression linéaire calculée sur l'analyse des 10 tests) afin de récupérer un résultat proche du procédé B (que l'on sait être plus précis).
    Dernière modification par leon1789 ; 22/12/2012 à 21h57.

  4. #4
    Dlzlogic

    Re : statistique à 2 variables

    Bonjour,
    Bien vu, j'ai inversé les lettres A et B.
    Ceci étant dit les procédés A et B ne sont pas comparables puisque de qualité différente, mais l'un peut servir de référence pour apprécier la fiabilité de l'autre, et c'est le but de l'étude.

  5. A voir en vidéo sur Futura
  6. #5
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    Ceci étant dit les procédés A et B ne sont pas comparables puisque de qualité différente, mais l'un peut servir de référence pour apprécier la fiabilité de l'autre, et c'est le but de l'étude.
    Ce que tu dis est encore une fois étrange : si l'un sert de référence (B) pour apprécier l'autre (A), c'est que l'on compare l'autre (A) à l'un (B).
    Mais dans aucun cas, on peut supposer que B donne des valeurs "vraies".
    Il se trouve que les résultats de (A) et (B) sont corrélés, sans faire d'hypothèse.

  7. #6
    Dlzlogic

    Re : statistique à 2 variables

    Bon, un peu plus d'explication.
    On a une méthode de mesure précise mais chère.
    On suppose, d'après l'énoncé que on a trouvé une méthode de mesure moins précise mais moins chère.
    La question se pose : "peut-on valablement remplacer la méthode chère pas la nouvelle ?".
    Sur 10 tôles on mesure l'épaisseur avec la méthode précise. Il n'existe pas d'autre moyen de mesure plus précise, contexte de l'énoncé.
    Dans un premier temps, on vérifie (inutile mais élémentaire) que les 10 mesures sont homogènes, c'est à dire qu'aucune n'est invraisemblable.
    Ensuite pour chaque tôle, on calcule la différence entre la mesure économique et la mesure de base.
    On entire une moyenne et un écart type.
    La moyenne est une erreur systématique qui permettra de corriger la mesure économique si elle est adoptée, l'écart-type est la précision avec laquelle on aura la mesure new-look.
    Là j'ai pas trop le temps, sinon, je ferais le calcul.
    Heureusement que les résultats de A et B sont corrélés. Il est tout de même à espérer que l'erreur entre les 2 types de mesure est inférieure à l'erreur de fabrication.
    A mon avis le piège de l'exercice est de ne pas se tromper avec le dénominateur de la formule de l'écart-type.
    Le calcul tel que je l'ai décrit est très rapide à faire.

    Imagine que notre ami aille voir son directeur en lui disant "pas de problème, les 2 listes sont corrélées !".

  8. #7
    leon1789

    Re : statistique à 2 variables

    Je ne vois ce qu'il y a d'évident à ce que les deux résultats soient corrélés avec un coefficient supérieur à 0.99 (!) J'ai vu pas mal de situations où ce coefficient est bien moindre... voir tellement loin de 1 qu'on ne pouvait pas tirer quoi que ce soit d'une régression linéaire.

    Par ailleurs, tu expliques que tu peux trouver un moyen de corriger les résultats de (A) en utilisant uniquement la moyenne des différences des mesures économique (A) et celles de base (B), et l'écart-type de ces différences. Je voudrais voir comment et à quoi tu arrives précisément comme mesure new-look .

    Personnellement, j'ai fait des calculs (une régression linéaire) pour trouver la formule B ~ 1.76 A - 35.6.

    A mon avis le piège de l'exercice est de ne pas se tromper avec le dénominateur de la formule de l'écart-type.
    A mon avis, il n'y a pas de piège dans l'exo, et le but est de voir que l'on peut utiliser le procédé économique (A) et une transformation x --> ax+b pour obtenir un résultat très proche du procédé précis (B). Cela n'était en rien évident (pour moi).

  9. #8
    Dlzlogic

    Re : statistique à 2 variables

    Bien-sûr, il n'est pas question pour moi d'essayer de te convaincre. Voila le résultat des calculs (sous réserve de faute de frappe).
    Vérification de séries aléatoires
    Nombre = 10 Moyenne = 61.78 emq=14.22 ep=9.48
    Classe 1 nb= 0 0.00% théorique 0.35%
    Classe 2 nb= 0 0.00% théorique 2%
    Classe 3 nb= 2 20.00% théorique 7%
    Classe 4 nb= 2 20.00% théorique 16%
    Classe 5 nb= 2 20.00% théorique 25%
    Classe 6 nb= 3 30.00% théorique 25%
    Classe 7 nb= 1 10.00% théorique 16%
    Classe 8 nb= 0 0.00% théorique 7%
    Classe 9 nb= 0 0.00% théorique 2%
    Classe 10 nb= 0 0.00% théorique 0.35%
    C'est le calcul de la liste B (les tests précis)
    La moyenne 61.78 est sans intérêt, puisqu'on ne connait pas l'épaisseur nécessaire. Par contre l'écart-type (emq) 14.22 est la précision attachée à la fabrication.
    Vérification de séries aléatoires
    Nombre = 10 Moyenne = -3.80 emq=5.57 ep=3.72
    Classe 1 nb= 0 0.00% théorique 0.35%
    Classe 2 nb= 0 0.00% théorique 2%
    Classe 3 nb= 1 10.00% théorique 7%
    Classe 4 nb= 3 30.00% théorique 16%
    Classe 5 nb= 1 10.00% théorique 25%
    Classe 6 nb= 1 10.00% théorique 25%
    Classe 7 nb= 4 40.00% théorique 16%
    Classe 8 nb= 0 0.00% théorique 7%
    Classe 9 nb= 0 0.00% théorique 2%
    Classe 10 nb= 0 0.00% théorique 0.35%
    Les valeurs utilisées pour le calcul sont, pour chaque tôle, la différence signée entre le test couteux et le test new-look.
    Il en résulte une moyenne : -3.80 qui est la correction systématique à apporter aux résultats de ce test, et un emq = 5.57, qui est l'incertitude entre la mesure précise et le test économique.
    On constate que 5.57 est sensiblement inférieur à la précision de fabrication, donc avec cette méthode plus économique on ne va pas nuire au résultat final.
    C'est la réponse que je donnerais si on me le demandait. Toujours sous réserve de vérification de calcul.

  10. #9
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    C'est le calcul de la liste B (les tests précis)
    La moyenne 61.78 est sans intérêt, puisqu'on ne connait pas l'épaisseur nécessaire. Par contre l'écart-type (emq) 14.22 est la précision attachée à la fabrication.
    Je me demande bien comment tu as pu trouver une moyenne avec 2 chiffres après la virgules alors que c'est une moyenne sur 10 nombres entiers.
    Pour (B), je trouve une moyenne de 55.6 et l'écart-type 12.6 (estimateur sans biais, comme tu as utilisé).

    Citation Envoyé par Dlzlogic Voir le message
    Les valeurs utilisées pour le calcul sont, pour chaque tôle, la différence signée entre le test couteux et le test new-look.
    Pourquoi renommer le procédé (A) en new-look ? Je pensais que tu allais donner une nouveau précédé en disant new-look.

    Citation Envoyé par Dlzlogic Voir le message
    (...) donc avec cette méthode plus économique on ne va pas nuire au résultat final.
    Donc pour toi, le test économique (A) est suffisamment précis pour les mesures faites, parce l'écart-type sur les différences entre (A) et (B) est plus petit que l'écart-type de (B).

    Malgré cela, (A) n'est pas aussi précis que le procédé (B), ok ?

    Et que penses-tu des résultats du procédé A suivi de la transformation 1.76 A - 35.6 ? Ce n'est pas plus coûteux que (A) et aussi précis que (B), non ?

  11. #10
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic
    Il en résulte une moyenne : -3.80 qui est la correction systématique à apporter aux résultats de ce test, et un emq = 5.57, qui est l'incertitude entre la mesure précise et le test économique.
    On constate que 5.57 est sensiblement inférieur à la précision de fabrication, donc avec cette méthode plus économique on ne va pas nuire au résultat final.
    Je rectifie mes dernières questions car j'avais oublié la correction systématique.

    Pour toi, le test économique (A) + 3.8 est suffisamment précis pour les mesures faites, parce l'écart-type sur les différences entre (A) et (B) est plus petit que l'écart-type de (B) ;
    c'est bien ça ?

    Que penses-tu des résultats du procédé 1.76 (A) - 35.6 ? Ce n'est pas plus coûteux que (A) et quasiment aussi précis que (B), non ?
    Dernière modification par leon1789 ; 24/12/2012 à 08h39.

  12. #11
    Dlzlogic

    Re : statistique à 2 variables

    Bonjour,
    Léon, je ne sais pas ce que tu cherches, mais ce serait bien que tu le trouves vite.
    Pour la question concernant le nombre de décimales, elle aurait été plus "sérieuse" si tu avais parlé de "nombre de chiffres significatifs", j'ai utilisé un module existant, j'ai juste changé les données.
    Cette expression "estimateur sans (ou avec) biais" m'a toujours amusé.
    Le calcul de l'écart-type est le calcul d'un écart moyen quadratique. Soit la valeur observée est une valeur connue, alors le diviseur est N, soit elle est inconnue, alors le diviseur est (N-1). Le qualificatif de biaisage est comique, mais effectivement a l'approbation générale. Je confirme ce que je dis l'écart type est le résultat d'un calcul, il ne s'agit en aucun cas de l'estimer.

    J'ai renommé les procédés juste pour éviter de recommencer l'inversion que j'ai faite dans ma première réponse.

    Je trouve que le procédé le plus économique est suffisant parce que son emq est environ le tiers de l'emq dû à la fabrication. Mais ce n'est que mon avis personnel, pas forcément celle du directeur de production.
    Pour décider, il faut mettre en balance le coût de la précision à la fabrication et le coût des tests, compte tenu de toute sorte de facteurs que j'ignore, problèmes de délais, d'augmentation de production etc. Je me contente de dire que l'imprécision du test économique est 3 fois plus faible que l'imprécision due à la fabrication.

    Ben, évidemment, le test A est moins précis que le test B, c'est dit dans l'énoncé, mais il est impossible d'en avoir confirmation avec les chiffres cités.
    Le seul moyen de le savoir est de mesurer 10 fois LA MEME VALEUR avec les 2 méthodes, éventuellement avec 10 personnes différentes.

    Pour ta question de la réponse suivante. Je dis que l'emq du test A est 1/3 de l'emq du test B. En d'autres termes, l'incertitude due à la mesure est 1/3 de l'imprécision due à la fabrication.

    Concernant les coûts, il y a des information que j'ignore parce qu'elles sont liées à des problèmes commerciaux, donc, je n'ai aucun avis.
    Je ne comprends pas très bien pourquoi tu me demandes ce que je pense en matière de coût, n'ayant aucune information, je ne peux évidemment pas répondre.
    Par contre, je peux répondre à d'autres question concernant ce topic.
    Dernière modification par Dlzlogic ; 24/12/2012 à 13h14.

  13. #12
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    Léon, je ne sais pas ce que tu cherches, mais ce serait bien que tu le trouves vite.
    je cherche à comprendre ce que tu expliques. Et ça avance, pas de souci. T'énerves pas !

    Citation Envoyé par Dlzlogic Voir le message
    Pour la question concernant le nombre de décimales, elle aurait été plus "sérieuse" si tu avais parlé de "nombre de chiffres significatifs", j'ai utilisé un module existant, j'ai juste changé les données.
    Ben c'est effectivement sérieux et élémentaire : quand on prend un nombre entier (ou un somme de nombres entiers si tu préfères) et qu'on le divise-le par 10, on n'a pas 2 chiffres après la virgule, c'est évident : cela montre que ta moyenne est fausse. Et cela n'a rien à voir avec les chiffres significatifs...
    Mais maintenant, tu dis que tu as changé les données, alors pourquoi as-tu changé les données ??

    Citation Envoyé par Dlzlogic Voir le message
    Cette expression "estimateur sans (ou avec) biais" m'a toujours amusé.
    Le calcul de l'écart-type est le calcul d'un écart moyen quadratique. Soit la valeur observée est une valeur connue, alors le diviseur est N, soit elle est inconnue, alors le diviseur est (N-1). Le qualificatif de biaisage est comique, mais effectivement a l'approbation générale.
    Là tu es en train de dire que la théorie des statistiques est comique. Bon, si tu veux, c'est toi qui le dit...

    Citation Envoyé par Dlzlogic Voir le message
    Je confirme ce que je dis l'écart type est le résultat d'un calcul, il ne s'agit en aucun cas de l'estimer.
    Là, tu confirmes que tu ne comprends pas la différence entre l'écart-type d'une série donnée (/ N) et un estimateur (avec ou sans biais) d'un écart-type d'une population, etc.
    Dans notre exo, soit on calcule l'écart-type de la série des 10 tests de (B) ou (A) : on divise par le nombre de tests (= 10)
    soit on estime l'écart-type de la fabrication lu par le procédé (B) : on divise par le nombre de tests -1 (= 9) car on ne connait pas la moyenne théorique (ou vraie si tu préfères).
    Bref, passons.

    Citation Envoyé par Dlzlogic Voir le message
    Je trouve que le procédé le plus économique est suffisant parce que son emq est environ le tiers de l'emq dû à la fabrication. Mais ce n'est que mon avis personnel, pas forcément celle du directeur de production.
    Pour décider, il faut mettre en balance le coût de la précision à la fabrication et le coût des tests, compte tenu de toute sorte de facteurs que j'ignore, problèmes de délais, d'augmentation de production etc. Je me contente de dire que l'imprécision du test économique est 3 fois plus faible que l'imprécision due à la fabrication.
    c'est le test économique ... auquel on ajoute 3.8 : c'est (A) + 3.8 dont tu parles, il me semble. Sinon, je ne comprends pas...

    Citation Envoyé par Dlzlogic Voir le message
    Pour ta question de la réponse suivante. Je dis que l'emq du test A est 1/3 de l'emq du test B. En d'autres termes, l'incertitude due à la mesure est 1/3 de l'imprécision due à la fabrication.
    ok, car tu as supposé que le procédé (B) donne des valeurs exactes. Mais ça n'est qu'hypothétique, nul part on dit que (B) est exact.

    Citation Envoyé par Dlzlogic Voir le message
    Concernant les coûts, il y a des information que j'ignore parce qu'elles sont liées à des problèmes commerciaux, donc, je n'ai aucun avis.
    Je ne comprends pas très bien pourquoi tu me demandes ce que je pense en matière de coût, n'ayant aucune information, je ne peux évidemment pas répondre.
    Par contre, je peux répondre à d'autres question concernant ce topic.
    Dans l'énoncé, il est dit que (B) est plus coûteux que (A). On ne demande pas de savoir pourquoi.

    Maintenant, au lieu de considérer ton (A) + 3.8 , je te propose 1.76 (A) - 35.6 : il est évident que le coût des calculs x --> x +3.8 et de x --> 1.76x - 35.6 est nul, donc on n'augmente pas le coût de (A). Mais de ton côté, tu obtiens avec (A) + 3.8 une méthode qui ajoute un écart-type de 5.7 en imprécision de méthode sur la méthode (B), de mon côté, via une régression linaire très classique, j'obtiens avec 1.76(A) - 35.6 une méthode qui ajoute un écart-type de ... beaucoup moins que 5.7 !
    D'où ma question : pourquoi ne pas faire une simple régression linéaire qui apporte un meilleur résultat au final ?

  14. #13
    Dlzlogic

    Re : statistique à 2 variables

    Ben c'est effectivement sérieux et élémentaire : quand on prend un nombre entier (ou un somme de nombres entiers si tu préfères) et qu'on le divise-le par 10, on n'a pas 2 chiffres après la virgule, c'est évident : cela montre que ta moyenne est fausse. Et cela n'a rien à voir avec les chiffres significatifs...
    Mais maintenant, tu dis que tu as changé les données, alors pourquoi as-tu changé les données ??
    C'est marrant, généralement, c'est plutôt moi qui insiste pour éviter l'abus de chiffres inutiles et sans signification.
    Pour être plus rigoureux dans ma réponse. La mesure dont il s'agit est une épaisseur en microns. L'appareil servant à le mesurer ne sait pas mesurer des fractions de microns, donc n'en affiche pas. Si l'unité choisie était le 1/10 mm, alors on aurait des valeurs du genre 0.4 ; 0.43. Mais moi, j'écrirais plutôt 0.40 ; 0.43.
    Donc, il ne s'agit en aucun cas de nombres entiers.

    Pour l'expression "changer les données", ça veut dire "J'ai un module qui calcule une répartition d'écart. J'utilise toujours le même module quelles que soient les données. Quand je passe d'une série de données à un autre, alors je change les données."

    Là tu es en train de dire que la théorie des statistiques est comique. Bon, si tu veux, c'est toi qui le dit...
    Je ne dis sûrement pas que la théorie des statistiques est comique, je dis que l'expression et surtout les discussions que cela entraine est comique. A delà d'un certain nombre de valeurs de l'expérience, la distinction entre N et N-1 est vraiment négligeable.

    Là, tu confirmes que tu ne comprends pas la différence entre l'écart-type d'une série donnée (/ N) et un estimateur (avec ou sans biais) d'un écart-type d'une population, etc.
    Dans notre exo, soit on calcule l'écart-type de la série des 10 tests de (B) ou (A) : on divise par le nombre de tests (= 10)
    soit on estime l'écart-type de la fabrication lu par le procédé (B) : on divise par le nombre de tests -1 (= 9) car on ne connait pas la moyenne théorique (ou vraie si tu préfères).
    Bref, passons.
    Un écart-type d'une série de valeurs est l'écart moyen quadratique.
    Un estimateur d'écart-type peut être un outil, une méthode pour calculer l'écart-type d'une série de valeurs.
    c'est le test économique ... auquel on ajoute 3.8 : c'est (A) + 3.8 dont tu parles, il me semble. Sinon, je ne comprends pas...
    Là, il me semble que tu confonds ou amalgames "test économique", "test A" que j'ai appelé "new-look" et "économie" au niveau de la société, c'est à dire coût de production et coût de vérification.

    ok, car tu as supposé que le procédé (B) donne des valeurs exactes. Mais ça n'est qu'hypothétique, nul part on dit que (B) est exact.
    C'est vrai qu'il n'est pas exact, on n'a aucune idée de sa précision intrinsèque, la seule chose qu'on sache est qu'il est "plus précis". On n'a pas d'autre choix que de l'adopter comme référence.

    Jusque maintenant, tes seules interventions étaient pour dire que j'avais tort, c'est ton choix dans un forum.

    Maintenant, considérant l'énoncé de l'exercice "Faire une analyse statistique", que répondrais-tu ? et avec quels arguments et quelles justifications ?

  15. #14
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    (...)Donc, il ne s'agit en aucun cas de nombres entiers.
    Ben regarde la séries (A) et (B) : ce sont des nombres entiers ! 40, 53 , 70, etc. C'est incroyable ta mauvaise fois. Donc la moyenne des 10 valeurs de (A) et (B) ne peuvent avoir 2 chiffres après la virgule... mais a-t-on la même définition de la moyenne ?


    Citation Envoyé par Dlzlogic Voir le message
    Un écart-type d'une série de valeurs est l'écart moyen quadratique.
    Je préfère dire que c'est la racine carré de la moyenne des écarts quadratiques, mais on est d'acord.

    Citation Envoyé par Dlzlogic Voir le message
    Un estimateur d'écart-type peut être un outil, une méthode pour calculer l'écart-type d'une série de valeurs.
    Absolument pas... Reprends la définition sur une source sûre.
    Mais bon passons.

    Citation Envoyé par Dlzlogic Voir le message
    Jusque maintenant, tes seules interventions étaient pour dire que j'avais tort, c'est ton choix dans un forum.
    absolument pas, encore une fois. Le problème est que, comme d'habitude, tu ne tiens pas la route dès que l'on gratte un peu. C'est dommage...

    Citation Envoyé par Dlzlogic Voir le message
    Maintenant, considérant l'énoncé de l'exercice "Faire une analyse statistique", que répondrais-tu ? et avec quels arguments et quelles justifications ?
    Donc tu n'as rien compris à ce que j'ai proposé... Coefficient de corrélation proche de 1, donc régression linaire justifiée, qui donne C = 1.76 A - 35.6. Ceci donne une méthode pas plus coûteuse que (A) et quasi aussi précise que (B). Et pour te convaincre, non seulement la moyenne des différences entre (C) et (B) est nulle, mais l'écart-type entre (C) et (B) est 5 fois plus faible que ton 5.57 qui te satisfait déjà...

    Donc je pense que devant le directeur (comme tu dis ), il n'y a pas photo, surtout que je n'ai toujours pas compris si tu utilises (A) + 3.8 ou simplement (A) puisque tu ne veux pas le dire clairement (mais que tu t'amuses à renommer test (A) en new-look, économie, etc.) ...
    Dernière modification par leon1789 ; 24/12/2012 à 16h49.

  16. #15
    Dlzlogic

    Re : statistique à 2 variables

    Bon, un point que j'avais oublié :
    Mais de ton côté, tu obtiens avec (A) + 3.8 une méthode qui ajoute un écart-type de 5.7 en imprécision de méthode sur la méthode (B),
    Les écarts accidentelles donc les écarts-type se combinent quadratiquement.
    Donc la précision du test sera
    14.22 écart de fabrication
    5.57 écart supplémentaire du à l'utilisation d'une méthode moins chère, donc moins précise.
    racine (14.22² + 5.57²) = 15.27
    C'est pas très grave, c'est une erreur courante.

    Petit test : supposons, que l'on se soit trompé (comme dans ma première réponse) et qu'on ait inversé A et B.
    Nombre = 10 Moyenne = 51.80 emq=7.15 ep=4.76
    Classe 1 nb= 0 0.00% théorique 0.35%
    Classe 2 nb= 0 0.00% théorique 2%
    Classe 3 nb= 0 0.00% théorique 7%
    Classe 4 nb= 4 40.00% théorique 16%
    Classe 5 nb= 1 10.00% théorique 25%
    Classe 6 nb= 2 20.00% théorique 25%
    Classe 7 nb= 2 20.00% théorique 16%
    Classe 8 nb= 1 10.00% théorique 7%
    Classe 9 nb= 0 0.00% théorique 2%
    Classe 10 nb= 0 0.00% théorique 0.35%
    L'écart-type dû à la fabrication serait 7.15
    Dans ce cas, la variation de l'écart-type serait toujours de 5.57, puisqu'elle résulte de différences de mesures, seul le signe de la correction systématique change, à comparer à 7.15, ce qui n'est plus du tout négligeable.

    Avec ton ajustement linéaire, tu obtiendrais quoi?
    Tu sais, il y a des mots et des expressions qu'il vaut toujours mieux éviter d'employer, même si on est sûr de soi.

  17. #16
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    Les écarts accidentelles donc les écarts-type se combinent quadratiquement.
    Donc la précision du test sera
    14.22 écart de fabrication
    5.57 écart supplémentaire du à l'utilisation d'une méthode moins chère, donc moins précise.
    racine (14.22² + 5.57²) = 15.27
    C'est pas très grave, c'est une erreur courante.
    Tu as raison de préciser (et je n'aurais pas dû dire "qui ajoute" mais "qui augmente").

    Mais là, tu "combines" l'écart-type des différences entre (A) et (B) avec l'écart-type de (B).
    Depuis plusieurs messages, tu dis qu'il est satisfaisant d'utiliser un procédé de mesure lorsque l'écart-type des erreurs de mesures est sensiblement inférieur à l'écart-type de fabrication.
    Ok, on détectera des anomalies de fabrication, mais on les cernera moins bien qu'avec un procédé de mesure précis... Je trouve ça dommage, et je préfère un procédé plus précis qui ne coûte rien de plus.


    Citation Envoyé par Dlzlogic Voir le message
    Avec ton ajustement linéaire, tu obtiendrais quoi?
    L'écart-type entre (C) et (B) est de 1.23 (comme je disais, c'est 5 fois moins que ton 5.57)
    Donc l'imprécision de (C) sera assez proche celle de (B), et cette dernière, je ne la connais pas...

    Citation Envoyé par Dlzlogic Voir le message
    Tu sais, il y a des mots et des expressions qu'il vaut toujours mieux éviter d'employer, même si on est sûr de soi.
    Joyeux Noël !

  18. #17
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    Les écarts accidentelles donc les écarts-type se combinent quadratiquement.
    Donc la précision du test sera
    14.22 écart de fabrication
    5.57 écart supplémentaire du à l'utilisation d'une méthode moins chère, donc moins précise.
    racine (14.22² + 5.57²) = 15.27
    J'aurais bien voulu savoir ce que tu calcules ici en mélangeant des écart-types ...
    Tu veux déterminer l'écart-type de "fabrication + test (A) " ? Non, car ça on connaît depuis le début : c'est 7.15
    Donc ton 15.27, c'est quoi ???

  19. #18
    Dlzlogic

    Re : statistique à 2 variables

    Bonjour,
    Je sais pas trop ce que je peux expliquer de plus, mais je vais essayer.
    Le but de cette méthode de test est de vérifier la qualité de la fabrication de galvanoplastie.
    On n'a pas l'information de l'épaisseur de métal, supposons du zinc, théoriquement déposé, mais c'est sans importance.
    Le test actuel (B) coûteux mais précis, puisqu'on mesure l'épaisseur réelle après grattage fournit des résultats sur 10 tôles.
    L'observation des résultats montre que la précision de fabrication est 14.22 µ.
    Etant donné la méthode de mesure utilisée, on peut, et c'est la seule solution, considérer que ces 10 mesures sont des valeurs vraies. Cela signifie que il n'existe pas de moyen plus précis connus pour mesurer cette épaisseur de zinc.

    On cherche une autre méthode de test, plus économique et en particulier qui évite de devoir gratter la tôle.
    Sur les 10 échantillons, on a pris la précaution de réaliser le test (A) AVANT, on a une liste de 10 valeurs.
    On compare ces 10 valeurs aux 10 valeurs mesurées avec le test précis (B).
    Il en résulte un écart systématique de 3.8µ, c'est une information importante , puisque c'est l'étalonnage de la méthode, et un écart-type de 5.57µ.

    Lorsque l'on va tester de nouvelles tôles, on va obtenir une valeur d'épaisseur de zinc en µ.
    Pour chaque tôle l'épaisseur mesurée sera comparée à l'épaisseur souhaitée. On aura fait la correction systématique résultant de l'étalonnage, mais la question posée est quelle est la précision du résultat ? La tolérance sur la fabrication est une valeur connue (pas par moi) ; la question reste, cette méthode de test plus économique va-t-elle avoir une influence sensible sur le chiffre qui va permettre de dire : "tôle bonne ou pas".
    En matière de mesure, les écarts accidentels se composent quadratiquement. L'écart d'épaisseur de zinc mesurée résulte de deux écarts
    1- l'écart de fabrication
    2- l'écart de test
    L'écart de fabrication est 14.22µ, l'écart de test est 5.57µ l'écart sur l'épaisseur est donc 15.27µ
    Par "écart", il faut comprendre "écart-type", moi, je préfère "emq" au moins on sait ce que c'est.

    Dis-moi si c'est plus clair.

    Relecture faite, je n'avais pas inversé A et B, sauf dans le texte.
    Donc effectivement, l'emq sur la mesure sera à calculer avec 7.15 et non 14.22.
    Les calculs sont à inverser, mais pas la logique.
    Donc si j'ai pas encore inversé l'inversion, il ne faut pas changer de méthode de test.
    S'il te plait, évite les commentaires désobligeants, j'ai inversé A et B, même B et A, par contre, je n'ai pas changé un iota sur mon argumentation qui est parfaitement claire dans mon esprit.

  20. #19
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    On cherche une autre méthode de test, plus économique et en particulier qui évite de devoir gratter la tôle.
    Sur les 10 échantillons, on a pris la précaution de réaliser le test (A) AVANT, on a une liste de 10 valeurs.
    On compare ces 10 valeurs aux 10 valeurs mesurées avec le test précis (B).
    Il en résulte un écart systématique de 3.8µ, c'est une information importante , puisque c'est l'étalonnage de la méthode, et un écart-type de 5.57µ.
    écart systématique de 3.8 ? Non, c'est seulement un écart moyen entre (A) et (B).

    Citation Envoyé par Dlzlogic Voir le message
    On aura fait la correction systématique résultant de l'étalonnage,
    donc tu utilises (A) + 3.8 , ok.

    Citation Envoyé par Dlzlogic Voir le message
    mais la question posée est quelle est la précision du résultat ? La tolérance sur la fabrication est une valeur connue (pas par moi) ; la question reste, cette méthode de test plus économique va-t-elle avoir une influence sensible sur le chiffre qui va permettre de dire : "tôle bonne ou pas".
    Dis-moi si c'est plus clair.
    oui, jusqu'ici tu fais un bon résumé, je dois le dire. Et la question est bien "tôle bonne ou pas".

    Citation Envoyé par Dlzlogic Voir le message
    Relecture faite, je n'avais pas inversé A et B, sauf dans le texte.
    Donc effectivement, l'emq sur la mesure sera à calculer avec 7.15 et non 14.22.
    Les calculs sont à inverser, mais pas la logique.
    Donc si j'ai pas encore inversé l'inversion, il ne faut pas changer de méthode de test.
    bon, là, je suis perdu... Mais je vais quand aller jusqu'au bout de ton raisonnement (me semble-t-il) avec une simulation concrète qui va dans ton sens de la pratique.

    En considérant
    - que l'épaisseur visée par le fabriquant est 56 (je prends environ la moyenne de (B), mais on peut changer si tu veux )
    - que la tolérance est ... au pif 20 % (là aussi, on peut changer si tu veux).
    Notre hypothèse que (B) est exacte : ainsi, les épaisseurs > 67 ou < 45 mesurées par (B) seront déclarées mauvaises.

    Je reprends les 10 tests : on accepte 5 tôles, et on en écarte 5 autres : celles étant mesurées à 41,40,44,75,70 par (B).

    Alors maintenant :
    - en utilisant le procédé (A)+3.8 que tu proposes, on accepte les 10 tôles, aucune n'est refusée !
    - en utilisant le procédé 1.76(A)-35.6 que je propose, on en refuse cinq, celles mesurées à 44,43,45,63,61 par le procédé (A), ce qui correspond aux 5 tôles éliminées par le procédé (B).

    Ta conclusion ?

  21. #20
    Dlzlogic

    Re : statistique à 2 variables

    Alors maintenant :
    - en utilisant le procédé (A)+3.8 que tu proposes, on accepte les 10 tôles, aucune n'est refusée !
    - en utilisant le procédé 1.76(A)-35.6 que je propose, on en refuse cinq, celles mesurées à 44,43,45,63,61 par le procédé (A), ce qui correspond aux 5 tôles éliminées par le procédé (B).

    Ta conclusion ?
    L'écart systématique n'a pas grand-chose à voir. C'est l'étalonnage, cela ne rentre pas dans un calcul d'erreur. Supposons que ta montre retarde de 10 mn, tu le sais, tu en tien compte, ça n'a rien à voir avec les aléas de la circulation et des feux rouges, qui sont des écarts "accidentels".
    Dans le cas présent on ne sait pas l'écart de fabrication sur les 10 tôles servant au test.
    La seule question à se poser "est-ce que l'imprécision du test le plus économique est négligeable ou pas ?".
    Il n'est pas possible dans ce domaine de mélanger le calcul d'écarts systématiques (étalonnage) et le calcul d'écart accidentel qui est une conséquence directe des lois de probabilité.
    Dans le cas présent, on peut imaginer qu'on a fait des tests sur 10 tôles, alors que la production journalière est d'une centaine de tôles. Encore une fois, on ne connait pas l'épaisseur théorique, ou minimum acceptée pour le zinc.
    Point de vocabulaire "procédé ... que je propose" la seule question posée et à laquelle il faut répondre : "doit-on conserver le test B ou peut-on le remplacer par le test A, plus économique ?".
    Pour mémoire La Palice à dit : "si une erreur était connue, ce ne serait plus une erreur". D'après mes infos, c'est historique.

  22. #21
    gg0
    Animateur Mathématiques

    Re : statistique à 2 variables

    Pour mémoire La Palice à dit : "si une erreur était connue, ce ne serait plus une erreur". D'après mes infos, c'est historique.
    Révise tes infos !!!

  23. #22
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    Dans le cas présent on ne sait pas l'écart de fabrication sur les 10 tôles servant au test.
    Dans la réalité on ne sait pas, je suis d'accord.
    Mais comme ton hypothèse est que (B) est un procédé exact ("c'est la seule solution" comme tu dis), alors on connait l'écart-type de fabrication sur les 10 tests : il est donné par les 10 résultats de (B) !
    En revanche, on ne connait pas l'écart-type "théorique" de fabrication.

    Citation Envoyé par Dlzlogic Voir le message
    La seule question à se poser "est-ce que l'imprécision du test le plus économique est négligeable ou pas ?".
    Donc tu changes maintenant de question (avant, c'était : "tôle bonne ou pas").
    Ok, partons pour "est-ce que l'imprécision du test le plus économique est négligeable ou pas ?"

    Mais négligeable par rapport à quoi ?

    Citation Envoyé par Dlzlogic Voir le message
    la seule question posée et à laquelle il faut répondre : "doit-on conserver le test B ou peut-on le remplacer par le test A, plus économique ?".
    ah, tu changes encore de question... car là, il y a une question de coût, contrairement à la question précédente.

    Là, ma réponse a toujours été "oui, on peut conserver le procédé (A), mais en lui apportant une modification donnée par x --> 1.76 x -35.6 , et ainsi récupérer à moindre coût quelque chose qui ressemble fortement au procédé (B) réputé précis".

    Toi, tu as répondu "oui, on peut conserver le procédé (A) en tenant compte de l'erreur 3.8".
    Malheureusement, une simple simulation (on peut en faire d'autres si tu veux) montre que ta solution n'est pas satisfaisante, puisqu'elle ne permet aucun séparation entre les bonnes et mauvaises tôles.

    Citation Envoyé par Dlzlogic Voir le message
    Pour mémoire La Palice à dit : "si une erreur était connue, ce ne serait plus une erreur". D'après mes infos, c'est historique.
    Bref, tu ne sais plus comment tourner autour du pot pour t'en sortir, mais maintenant cela fait moins illusion qu'au début de la discussion, où je pensais que tu pouvais peut-être avoir effectivement une idée cohérente.

  24. #23
    Dlzlogic

    Re : statistique à 2 variables

    Bonsoir,
    Il est surprenant d'observer des mathématiciens qui n'ont comme seul argument que des chose du genre "c'est pas vrai" et d'autres réflexions qui n'ont rien à faire dans un forum.
    J'ai remarqué que cette tendance, au lieu d'être ponctuelle, semble se généraliser. En tout cas, j'espère que dans le contexte professionnel, cette pratique n'est pas trop utilisée.

    Bien-sûr je n'ai pas de preuve que La Palice a dit "si une erreur était connue, ce ne serait pas une erreur" mais avez-vous une preuve que ce n'est pas vrai ?
    Il est certain que La Palice a étudié très soigneusement ce type de problème, par contre, j'avoue que comme les magnétophones n'existaient pas à cette époque, et que je n'ai pas de documents certifiés conformes, je m'en remets à ce que j'ai lu.

    Concernant le problème en cours, et en essayant de rester sérieux, je n'ai certainement pas changé le contexte, j'ai peut-être essayé de l'expliquer, mais pas plus.
    Donc, la question posée (sous forme d'étude statistique) est : on dispose d'une méthode de test précise. On cherche à la remplacer par une méthode plus économique, mais, naturellement, donnant la même satisfaction, c'est à dire qui permet de vérifier que l'épaisseur de zinc est conforme au cahier des charges (je sais, là je traduis un peu l'énoncé).
    Donc pour résumer, le test B est plus précis que le test A.
    Une méthode d'étude statistique qui compare à égalité A et B et qui conclue que A est aussi bon que B est forcément fausse, pour la simple raison que on sait que B est PLUS précis que A. Donc, la relation d'ordre "B plus précis que A" n'aurait plus de sens, ce qui est contraire à l'énoncé.

    @ Léon :Je note par ailleurs que tu profites de l'inversion que j'ai faite entre A et B. Moi, j'appelle ça de la mauvaise foi, mais probablement ce terme n'a pas le même sens pour toi. Pour toi, tous tes arguments sont bons et de bonne foi, concernant les autres, une simple erreur de virgule est une preuve évidente de mauvaise foi.
    @gg0 : j'aurais préféré une réaction plus "constructive".

    Je constate qu'encore une fois, tu ne cherche que la contradiction (pour éviter un autre terme) donc, pour moi c'est terminé.

  25. #24
    leon1789

    Re : statistique à 2 variables

    Citation Envoyé par Dlzlogic Voir le message
    Il est surprenant d'observer des mathématiciens qui n'ont comme seul argument que des chose du genre "c'est pas vrai" et d'autres réflexions qui n'ont rien à faire dans un forum.
    C'est vrai que corriger toutes tes interventions qui embarquent les forumeurs sur de fausses pistes est une travail à plein temps...
    Je t'ai demandé plusieurs fois d'arrêter ton flood, mais bon, ça ne fonctionne pas, donc...


    Citation Envoyé par Dlzlogic Voir le message
    J'ai remarqué que cette tendance, au lieu d'être ponctuelle, semble se généraliser.
    Ben oui, elle est générale en ce qui concerne tes messages puisque tu racontes souvent des contre-vérités.

    Citation Envoyé par Dlzlogic Voir le message
    En tout cas, j'espère que dans le contexte professionnel, cette pratique n'est pas trop utilisée.
    Je pense que les professionnels sont rigoureux.

    Citation Envoyé par Dlzlogic Voir le message
    Bien-sûr je n'ai pas de preuve que La Palice a dit "si une erreur était connue, ce ne serait pas une erreur" mais avez-vous une preuve que ce n'est pas vrai ?
    Mort de rire. Tu gardes au moins le sens de l'humour, c'est hautement mathématique

    Citation Envoyé par Dlzlogic Voir le message
    je m'en remets à ce que j'ai lu.
    ah... des références précises s'il te plait ?
    Tu sais, la régression linéaire, c'est dans tous les bouquins. Je croyais même que tu l'utilisais souvent puisque tu ne fais que parler (sauf dans cette discussion) de méthode des moindres carrés. Mais là, étrangement, tu n'as pas lancer l'idée...

    Citation Envoyé par Dlzlogic Voir le message
    Concernant le problème en cours, et en essayant de rester sérieux, je n'ai certainement pas changé le contexte, j'ai peut-être essayé de l'expliquer, mais pas plus.
    Donc, la question posée (sous forme d'étude statistique) est : on dispose d'une méthode de test précise. On cherche à la remplacer par une méthode plus économique, mais, naturellement, donnant la même satisfaction, c'est à dire qui permet de vérifier que l'épaisseur de zinc est conforme au cahier des charges (je sais, là je traduis un peu l'énoncé).
    Donc pour résumer, le test B est plus précis que le test A.
    Une méthode d'étude statistique qui compare à égalité A et B et qui conclue que A est aussi bon que B est forcément fausse, pour la simple raison que on sait que B est PLUS précis que A. Donc, la relation d'ordre "B plus précis que A" n'aurait plus de sens, ce qui est contraire à l'énoncé.
    Seulement personne n'a dit que (A) est aussi précis que (B)...

    Les stats montrent une corrélation très forte entre les procédés (A) et (B) (d'ailleurs, tu te moquais un peu car pour toi c'était évident... je me demande si tu comprends vraiment) donc cela donne un moyen statistique de passer de (A) à (B). Je te l'ai démontré, expliqué, calculé, expérimenté, en long large travers. Je ne peux rien faire de plus pour toi, tu refuse l'évidence.

    Citation Envoyé par Dlzlogic Voir le message
    @ Léon :Je note par ailleurs que tu profites de l'inversion que j'ai faite entre A et B. Moi, j'appelle ça de la mauvaise foi, mais probablement ce terme n'a pas le même sens pour toi. Pour toi, tous tes arguments sont bons et de bonne foi, concernant les autres, une simple erreur de virgule est une preuve évidente de mauvaise foi.
    Excuse moi, mais quand je te signale qu'une somme de nombres entiers divisée par 10 ne peut pas avoir 2 chiffres après la virgules, et que tu me renvois des arguments "divers et variés" voulant prouver que tu as bien calculé la moyenne de 41,40, 44, 75, 58, 64, 65, 70, 46, 53 en donnant 61.78, ça montre à quel point tu es de mauvaise foi, en effet.

    Tu parles des "autres", qui par exemple ? Il n'y a que toi qui s'obstine à raconter encore et encore des contre-vérités sur les forums de maths. Mais pourquoi continues-tu ???

    Citation Envoyé par Dlzlogic Voir le message
    Je constate qu'encore une fois, tu ne cherche que la contradiction (pour éviter un autre terme) donc, pour moi c'est terminé.
    ...jusqu'à la prochaine... comme d'hab !
    Dernière modification par leon1789 ; 26/12/2012 à 00h18.

Discussions similaires

  1. Modèle statistique régulier - statistique exhaustive
    Par invitee75a2d43 dans le forum Mathématiques du supérieur
    Réponses: 6
    Dernier message: 16/05/2013, 10h07
  2. Statistique - générer des variables fortement corrélées sur R
    Par invitec1f6f106 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 23/04/2011, 00h22
  3. statistique : reduction du nombre de variables explicatives
    Par inviteb6ed0931 dans le forum Mathématiques du supérieur
    Réponses: 6
    Dernier message: 12/02/2010, 10h34
  4. Influence des variables d'une fonction à 2 variables
    Par invitee2a62e92 dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 18/07/2008, 02h54
  5. Statistique
    Par invite09aa2239 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 13/03/2006, 16h45