Bonjour,
j'ai un jeu de données d'élèves (différenciés par leur Nom) que j'ai mesuré lors de 4 sessions (T0 à T3).
Je souhaite évaluer si mes variables mesurées (par ex: le poids) sont identiques ou différentes au moins pour 2 instants. Je choisis le test stat de Friedman dans le logiciel R.
Dans mon tableau, les données comportent des valeurs manquantes pour 1 élève pour une session, T1.
Je supprime donc les lignes correspondant à cet élève de T0 à T3 (ne sachant comment procéder autrement...).
Cependant quand je fais ensuite le test de friedman, ça me met une erreur.Code:donnees_sans_NA <- donnees[!donnees$Nom==nom_eleve, ]
Je crois que cela vient du fait que lorsque j'ai supprimé les lignes, l'indexation du tableau donnees_sans_NA ne part plus de 1 mais de 5Code:print(friedman.test(Poids ~ Session | Nom, data=donnees_sans_NA)) Error in friedman.test.default(c(41, 42, 42, 42, 48, 47, 47, 47, 69, 69, : not an unreplicated complete block design
(pour le coup, les 4 lignes que j'ai supprimé étaient les lignes 1,2,3 et 4).
En effet, lorsque je procède d'une autre manière (je crée le csv de données en supprimant directement dans Excel cet élève qui a des valeurs manquantes), et que je refais le test stat après importation du csv dans R, il n'y a aucune erreur !!!
Code:print(friedman.test(Poids ~ Session | Nom, data=donnees)) Friedman rank sum test data: Poids and Session and Nom Friedman chi-squared = 5.4767, df = 3, p-value = 0.14
D'où mes questions :
- comment se fait-il qu'il y ait une erreur quand j'utilise le tableau donnees_sans_NA pour le test ? Est-ce que cela vient de l'indexation qui ne commence pas à 1 ? Comment corriger cela ?
- et par ailleurs, peut-on faire Friedman avec des valeurs manquantes pour une session, par ex T1 ? (autrement qu'en supprimant l'élève aux 4 sessions de mesures)
Merci par avance pour votre aide
-----