| Re : logiciel SAS
bonjour,
c'est un peu normal que les données manquantes ne soient pas prises en compte! La plupart des logiciels (et je pense que c'est le défaut dans SAS) excluent les lignes de la matrice de données dès qu'elles comportent des cases non renseignées.
Il existe des techniques de "remplissage de trous" qui sont utilisables tant que les trous ne sont pas trop nombreux. L'une d'elles consiste à remplacer la valeur manquante par la moyenne de la variable, prise sur les individus ayant les mêmes valeurs des autres variables, ça revient à faire une régression locale. Une autre méthode est l'imputation multiple, qui consiste en gros à remplacer successivement la valeur manquante par des valeurs issues de la distribution empirique de cette variable, toujours conditionnelle aux valeurs observées sur les autres variables. On peut ensuite faire une sorte de moyenne des estimateurs ainsi obtenus (et on a aussi une idée de la variablilité).
|