Répondre à la discussion
Affichage des résultats 1 à 11 sur 11

Série statistique et test du khi-deux

  1. #1
    SEP12

    Série statistique et test du khi-deux

    Bonjour, J'ai deux interrogations:

    Voilà mon premier souci j'ai une série statistique de 3221 points et j'aimerais savoir si cette série suit le loi normale et je me souviens qu'on m'avait un jour parlé de test de khi-deux pour comparer deux série statistiques. Ma série à une moyenne de 7.8 et un écart-type de 0.87 une valeur minimale à 3.84 et maximale à 12.15. J'ai commencé par calculer la proportion de valeurs que j'avais entre 3 et 3.5 puis entre 3.5 et 4 puis ainsi de suite jusqu'à entre 12 et 12.5. J'ai fait la même chose avec la fonction Excel LOI.NORMALE.N et j'obtiens donc au final deux séries. Lorsque j'utilise la fonction excel "test.khideux il me sort un résultats égal à 1, ça veut dire quoi mathématiquement parlant? J'ai un livre qui me donne la formule du khi-deux et il y est écrit aussi que plus le test du khi-deux est petit plus les deux série sont identiques.Est-ce que le test du khi-deux est le plus approprié (je sais qu'il en existe d'autres mais je ne les connais pas du tout j'en ai même jalmais entendu parler)? ERt ce 1 je dois le comparer à quelle valeur (moyenne, écart-type, autre)? en lisant mon livre j'ai peur qu'il faille que je le compare avec mon écart-type voir même avec ma variance.

    Mon deuxième petit souci est dans une série statistique on considère qu'une valeur est aberrant à partir de quel moment? Par exemple dans la série précédente j'ai considéré comme aberrant des valeurs à 0.1 1.4 15.5 et 20. Je pense que vous allez me répondre ça dépend mais n'existe-t-il pas une formule qui dit qu'à partir de moyenne+-4 écart-types la valeur est aberrante.

    Merci de votr aide sur ces points

    A noter que je suis juste ingénieur chimiste et pour le moment je travaille sur la maîtrise statistique des procédés avec des cartes de contrôle et toutes les réjouissances qui vont avec.

    -----

    Le futur m'interesse car j'ai l'intention d'y passer mes prochaines années

  2. Publicité
  3. #2
    gg0

    Re : Série statistique et test du khi-deux

    Bonjour.

    Pour tester la Normalité d'une série statistique, le test du khi-deux sur un ensemble de classes par intervalles est une mauvaise idée, car le résultat dépend fortement du choix des bornes d'intervalles. Il existe de nombreux tests classiques, bien plus solides (voir ce document), le plus utilisé étant Shapiro-Wilks; mais on utilise de plus en plus le Jarque-Bera.
    Les logiciels statistiques donnent une "valeur limite" ou "p-value". Si elle est supérieure au risque de première espèce choisi, on conclut qu'on n'a pas de raison de douter de la Normalité des données; si elle est inférieure, on peut douter, au risque choisi. Dans tous les cas, on n'a aucune preuve que les valeurs de l'échantillon sont des réalisations d'une variable gaussienne (Normale).

    Dans ton cas, ton 1 est une p-value, supérieure à n'importe quel risque classique (les risques sont des pourcentages proche de 0). Donc ta méthode ne contredit pas que tes valeurs puissent être issues d'une variable aléatoire gaussienne.
    Un conseil : lis un peu de cours de statistiques sur les tests d'hypothèse, pour savoir ce que tu es en train de pratiquer.

    "dans une série statistique on considère qu'une valeur est aberrante à partir de quel moment? ". Ça dépend. Eh oui, je le dis quand même, car la notion de "valeur aberrante" n'est pas une notion précise. Si tu traites des notes sur 20, 22 ou -3 sont aberrantes, de même que 12,315, qui est probablement issue d'un oubli de taper sur la touche entrée entre 12,3 et 15. Pour une série gaussienne, les valeurs à plus de 4 écarts types sont très rares, mais pas nécessairement aberrantes. De plus, si on les enlève avant de tester la Normalité, on triche !

    Cordialement.

  4. #3
    SEP12

    Re : Série statistique et test du khi-deux

    Merci pour cette réponse. Je vais lire ton document dans les prochains jours. J n'avais pas beaucoup d'info sur les tests de normalité, merci.

    La notion de valeur aberrant est assez difficile à définir dans mon cas c'est un pourcentage d'O2 dans les fumées de combustion donc un pourcentage supérieur à 21 serait aberrant comme une valeur négative mais le reste est possible je vois bien 2 ou 3 raisons pouvant l'expliquer (à vérifier).

    Merci encore de ta réponse.
    Le futur m'interesse car j'ai l'intention d'y passer mes prochaines années

  5. #4
    SEP12

    Re : Série statistique et test du khi-deux

    Bonjour,

    Je me demandais si on pouvait utiliser les "boites à moustaches" pour identifier les points apriori aberrants d'une serie statistique?

    Merci
    Le futur m'interesse car j'ai l'intention d'y passer mes prochaines années

  6. #5
    gg0

    Re : Série statistique et test du khi-deux

    Effectivement, ça peut donner une idée des valeurs très éloignées du gros de la population. Reste à savoir si elles sont aberrantes, ou seulement exceptionnelles. Dans ton cas, si les valeurs entre 0 et 21 sont possibles, il n'y a pas de raison de rejeter une valeur éloignée des autres, mais entre 0 et 21. Sauf si tu as une autre raison que l'éloignement.

    Cordialement.

  7. #6
    SEP12

    Re : Série statistique et test du khi-deux

    Je comprends, j'ai juste vu ce point dans le document que tu m'as transmis ce matin. Un point extrème à 20 me fera penser à une marche anormmale de l'installation et une ouverture intempestive du "chapeau" de la cheminée pour faire rentrer de l'air de combustion (normalement il ne rentre pas par la cheminée).
    J'ai aussi essayer un test de Jarque-bera qui à l'air plus simple de mise en oeuvre et j'ai un applatissement à 0.3 et un assymétrie de 0.12. La encore je ne sais pas si c'est plutôt bon ou pas ou alors quel risque je prends à dire que ma distribution suit une loi normale.
    Le futur m'interesse car j'ai l'intention d'y passer mes prochaines années

  8. #7
    minushabens

    Re : Série statistique et test du khi-deux

    Citation Envoyé par SEP12 Voir le message
    quel risque je prends à dire que ma distribution suit une loi normale.
    ça dépend de ce que tu en fais. Il y a des méthodes d'analyse statistique qui sont robustes vis à vis de la distribution sous-jacente, d'autres moins. Et tu peux éviter totalement de faire des hypothèses distributionnelles peu sûres en utilisant des méthodes dites "non-paramétriques".

  9. #8
    gg0

    Re : Série statistique et test du khi-deux

    Ok.

    je suppose qu'il s'agit des valeurs utilisées dans le test, pas des valeurs de base.. Dans ce cas, au risque classique de 5%, il n'y a pas de raison de rejeter la Normalité des données, si tu as des raisons de penser qu'elles sont gaussiennes. Quant à "quel risque je prends à dire que ma distribution suit une loi normale" on n'en sait rien. Là encore, bien lire sur un cours ce que c'est qu'un test d'hypothèse te servirait.

    Cordialement.

  10. #9
    SEP12

    Re : Série statistique et test du khi-deux

    En fait je veux juste vérifier si ma série suit le loi normale car nous suivons certains paramètres par cartes de contrôle. Nous voulons réduire le nombre de cartes de contrôle que nous avons si un paramètre est stable depuis septembre 2014 qu'il ne dépasse pas ou très peu les limites que nous nous sommes fixées on supprimera la carte de contrôle. Par contre d'autres paramètres n'ont pour l'instant pas de carte de contrôle et nous voulons en mettre sur certains. Pour savoir quelles limites mettre comme nous n'avons aucune idée de ce que l'on est capable de faire on voulait prendre un écart à moyenne +-3 sigmas pour commencer et pour être sûr que la majorité de points (99.7%) se trouvent à l'interieur de cet intervalle il faut que ma distribution suivent la loi normale, d'où ma volonté de vérifier si ma série suit la loi normale et également mon intention de supprimer les valeurs aberrantes par les boites à moustaches. mais pour ces boites je demanderais à mon ami qui est prof de math au lycée qui si connait en proba mais pas en stats.

    Au vu de ce que je viens d'écrire vous allez peut-être me dire que ca ne sert à rien de vérifier la normalité de la distribution mais c'est quelquechose que je ne sais pas faire pour l'instant et je suis sûr que savoir le faire serait interessant.

    Merci pour le temps que vous prenez pour m'expliquer les petits détails qui font toute la différence.
    Le futur m'interesse car j'ai l'intention d'y passer mes prochaines années

  11. #10
    gg0

    Re : Série statistique et test du khi-deux

    Le problème est qu'aucun test statistique ne prouve que les valeurs obtenues proviennent d'une variable gaussienne. Alors qu'on a souvent de fortes raisons de savoir que c'est approximativement le cas, sans aucune statistique. C'est le cas lorsque la valeur obtenue est la somme de nombreuses valeurs aléatoires indépendantes du même ordre de grandeur; plus généralement, quand une mesure est aléatoirement variable autour d'une valeur cible pour des raisons nombreuses, mal contrôlées, mais dont aucune n'est dominante. Donc dans la plupart des cas en contrôle industriel.

    Pour une carte de contrôle, si on a ce genre de raisons, on s'en contente, et tout au plus, on va faire sur un début de production un test de Normalité qui sera non significatif (*). Vu ce que tu as pratiqué, le test sera non significatif, et on pourra utiliser l'hypothèse de Normalité sans trop de craintes.
    Dans ce cadre, les "valeurs aberrantes" sont importantes, car elles peuvent justement être l'un des outils de détection des problèmes. Sur 3221 valeurs, on peut s'attendre à avoir environ 10 valeurs en dehors des 6 sigmas. valeurs qui ne sont en rien aberrantes.

    Cordialement.

    (*) s'il l'est, on considère la production comme hors contrôle et on recherche les raisons de ces variations anormales.

  12. #11
    SEP12

    Re : Série statistique et test du khi-deux

    Merci pour toutes les infos que tu as pu me donner. Je vais suivre l'exemple sur le document que tu m'as transmis et voir ou ça me mène. Je vais pas trop me prendre la tête avec des calculs statistiques à n'en plus finir et surtout voir si mes paramètres sont stables dans le temps pour supprimer certaines cartes qui sont en trop et/ou obsolètes et pourquoi pas en rajouter d'autres ou besoin.

    Merci à vous deux gg0 et minushabens pour votre aide.
    Le futur m'interesse car j'ai l'intention d'y passer mes prochaines années

Discussions similaires

  1. Test statistique Khi deux
    Par Lou5931 dans le forum Mathématiques du supérieur
    Réponses: 5
    Dernier message: 23/01/2018, 20h59
  2. choisir un test statistique adéquat pour comparer deux appareils
    Par ganguroangel dans le forum Mathématiques du supérieur
    Réponses: 23
    Dernier message: 08/02/2017, 15h08
  3. Statistique : Test khi-deux et Student
    Par carottg dans le forum Mathématiques du supérieur
    Réponses: 5
    Dernier message: 05/01/2013, 18h53
  4. statistique : le test khi deux
    Par mellerosy dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 12/04/2012, 17h58
  5. Statistique : Test de Comparaison de deux proportions
    Par lololem dans le forum Mathématiques du supérieur
    Réponses: 5
    Dernier message: 23/01/2006, 20h50