Bonjour tout le monde.
Dans le cadre d'un cours de stat, j'ai choisi d’étudier des données concernant l’absentéisme de 350 ouvriers. Pour chacun d’eux, je connais :
- le nombre total de jours où ils sont malades
- leur sexe
- la catégorie (=niveau de qualification) auquel ils appartiennent
- l’année durant laquelle ils sont arrivés chez Danone
- leur année de naissance
- le département dans lequel ils travaillent.
Je voudrais étudier le nombre de jours où chaque ouvrier est malade (variable dépendante) en fonction des autres données.
Le problème que je rencontre est que la distribution du nombre de jours de maladie n’est pas une normale. La plupart des ouvriers ne sont pas malades et les autres sont malades de 1 à 25 jours. Donc la distribution est tout à fait dissymétrique. Ce qui m'empeche de faire une ANOVA (j'utilise SAS).
Est-ce qu’il existe des transformations de variables qui pourraient arranger ce problème? Que pourrais-je faire?
Merci d'avance
-----