Répondre à la discussion
Affichage des résultats 1 à 9 sur 9

Distribution d'une variable non normale! Comment faire une analyse de variance?



  1. #1
    valj

    Question Distribution d'une variable non normale! Comment faire une analyse de variance?


    ------

    Bonjour tout le monde.

    Dans le cadre d'un cours de stat, j'ai choisi d’étudier des données concernant l’absentéisme de 350 ouvriers. Pour chacun d’eux, je connais :
    - le nombre total de jours où ils sont malades
    - leur sexe
    - la catégorie (=niveau de qualification) auquel ils appartiennent
    - l’année durant laquelle ils sont arrivés chez Danone
    - leur année de naissance
    - le département dans lequel ils travaillent.

    Je voudrais étudier le nombre de jours où chaque ouvrier est malade (variable dépendante) en fonction des autres données.
    Le problème que je rencontre est que la distribution du nombre de jours de maladie n’est pas une normale. La plupart des ouvriers ne sont pas malades et les autres sont malades de 1 à 25 jours. Donc la distribution est tout à fait dissymétrique. Ce qui m'empeche de faire une ANOVA (j'utilise SAS).
    Est-ce qu’il existe des transformations de variables qui pourraient arranger ce problème? Que pourrais-je faire?

    Merci d'avance

    -----

  2. Publicité
  3. #2
    valj

    Re : Distribution d'une variable non normale! Comment faire une analyse de variance?

    Citation Envoyé par valj Voir le message
    Bonjour tout le monde.

    Dans le cadre d'un cours de stat, j'ai choisi d’étudier des données concernant l’absentéisme de 350 ouvriers. Pour chacun d’eux, je connais :
    - le nombre total de jours où ils sont malades
    - leur sexe
    - la catégorie (=niveau de qualification) auquel ils appartiennent
    - l’année durant laquelle ils sont arrivés chez Danone
    - leur année de naissance
    - le département dans lequel ils travaillent.

    Je voudrais étudier le nombre de jours où chaque ouvrier est malade (variable dépendante) en fonction des autres données.
    Le problème que je rencontre est que la distribution du nombre de jours de maladie n’est pas une normale. La plupart des ouvriers ne sont pas malades et les autres sont malades de 1 à 25 jours. Donc la distribution est tout à fait dissymétrique. Ce qui m'empeche de faire une ANOVA (j'utilise SAS).
    Est-ce qu’il existe des transformations de variables qui pourraient arranger ce problème? Que pourrais-je faire?

    Merci d'avance

    Je me rends compte que je ne suis pas du tout claire dans mes explications. Je réexplique.

    Je voudrais étudier le nombre de jours où chaque ouvrier est malade (variable dépendante) en fonction de son sexe par exemple. Le soucis est que, si je fais une analyse de variance avec le nombre de jours de maladie comme variable dépendante et le sexe comme variable explicative, mes résidus ne sont pas normaux.

    Que puis-je faire? Ou quelle conclusion en tirer?

    Merci

  4. #3
    invite986312212
    Invité

    Re : Distribution d'une variable non normale! Comment faire une analyse de variance?

    bonjour,

    l'outil de choix est le modèle linéaire généralisé. Dans ton cas, à moins que l'absentéisme ne soit extrêmement fréquent, je verrais bien une distribution poissonienne sur le nombre de jours d'absence par an (si c'est par an).
    si tu ne connais pas ces modèles, fais une recherche sur le net avec ces termes: generalized linear model

    sous SAS: proc glm

  5. #4
    valj

    Re : Distribution d'une variable non normale! Comment faire une analyse de variance?

    Merci Ambrosio


    J'ai effectué quelques recherches et je pense qu'une solution est la régression logistique (ça c'est une méthode brièvement abordée au cours). Dans ce cas, j'étudie l'événement "non absent" (0 jours) ou "absent" (au moins 1 jour).


    En régression logistique, est-ce que les résidus doivent suivre une loi particulière? Est-ce qu'il y a des hypotheses que doivent satisfaire mon modèle.

    Merciiii

  6. #5
    kinette

    Re : Distribution d'une variable non normale! Comment faire une analyse de variance?

    Bonjour,
    Dans ce genre de cas on a plusieurs solutions, et pas toujours facile de défénir la meilleure:
    Si on reste avec des méthodes paramétriques

    - normaliser les données (par exemple en utilisant la transformation "arcsinus")-> vérifier si c'est normal cette fois, et dans ce cas, ANOVA
    Tu peux passer en pourcentages de jours non-travailler, et transformer ces pourcentages en Arcsinus
    - utiliser une régression logisitique (solution que j'aime bien).
    - utiliser un modèle linéaire généralisé avec la loi de poisson (mais d'abord vérifier si ça suit bien cette loi).

    En méthode non paramétriques, il y a le test de Kruskal-Wallis (mais pas possible de faire des trucs compliqués avec).

    Si tu as envie de passer à des trucs plus compliqués (et plus élégants aussi ), il ya les modèles mixtes.
    (tu peux trouver des explications sur ce forum: http://forums.cirad.fr/logiciel-R/index.php par contre je suis pas certaine que SAS permette de faire ça).

    K
    Nomina si nescis, perit et cognito rerum.

  7. A voir en vidéo sur Futura
  8. #6
    invite986312212
    Invité

    Re : Distribution d'une variable non normale! Comment faire une analyse de variance?

    pour valj: oui, tu peux faire ça mais c'est un peu dommage de ne pas distinguer quelqu'un qui est absent 1 jour de quelqu'un qui est absent 100 jours. Il y a perte d'information.

    pour Kinette: le modèle mixte s'adresse à un autre problème (que celui de non normalité): le cas où la matrice de variance du modèle n'est pas diagonale. Et oui, SAS permet de faire du modèle linéaire généralisé (et du modèle mixte).

  9. Publicité
  10. #7
    valj

    Re : Distribution d'une variable non normale! Comment faire une analyse de variance?

    Merci pour vos réponses.

    Kinette je ne comprends pas bien comment la transformation arcsinus pourrait résoudre mon problème de normalité des résidus

  11. #8
    valj

    Re : Distribution d'une variable non normale! Comment faire une analyse de variance?

    Dans la régression logistique, est-ce que les résidus doivent aussi être normaux? Comment est-ce que je peux obtenir les résidus avec SAS?

    Merciiii

  12. #9
    valj

    Re : Distribution d'une variable non normale! Comment faire une analyse de variance?

    D'après ce que j'ai pu obtenir comme information, les résidus doivent suivre une loi normale de moyenne nulle et de variance constante. Mais je ne comprends pas comment faire cette analyse sous SAS! En régression linéaire, il y a moyen d'afficher les résidus grace à l'option "residual" du output de la procédure PROC REG. ET ensuite je fais une PROC UNIVARIATE sur ces résidus. Mais l'option "residual" n'existe pas apparemant dans la PROC LOGISTIC. Comment dois-je faire?

Sur le même thème :

Discussions similaires

  1. Comment faire une copie d'une image vidéo
    Par roro123 dans le forum Logiciel - Software - Open Source
    Réponses: 4
    Dernier message: 29/12/2009, 16h50
  2. Variance d´une variable aléatoire
    Par christophe_de_Berlin dans le forum Mathématiques du supérieur
    Réponses: 4
    Dernier message: 16/11/2007, 07h46
  3. distribution de chaleur - comment faire
    Par efa dans le forum Habitat bioclimatique, isolation et chauffage
    Réponses: 0
    Dernier message: 26/10/2007, 14h49
  4. analyse de la variance ?
    Par BillBaroud__ dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 13/03/2007, 10h37
  5. SVP comment faire une copie d'écran d'une liste d'options
    Par roro123 dans le forum Logiciel - Software - Open Source
    Réponses: 9
    Dernier message: 14/05/2006, 09h40