Bonjour à tous,
Je décris ci-dessous les méthodes que j'ai employées pour calculer la valeur p suite à une de mes études statistiques. Je requiers votre aide car les résultats que j'obtiens me semble aberrants.
Dans le cadre de mon mémoire, je viens de réaliser un recueil de données : ce dernier a consisté à faire passer un test à 3 groupes d'étudiants d'âges différents ; ce test permettant d'attribuer un score à chacun d'entre eux. Voici les résultats que j'obtiens :
L'hypothèse nulle est que l'âge n'influe pas sur les résultats de ce test. L'hypothèse alternative est donc que l'âge influe sur les résultats du test. Je souhaite donc connaître la valeur p afin d'affirmer si ces valeurs sont significatives.Code:Groupe Moyenne Nombre A1 11,68 248 A2 10,71 151 A3 9,91 131 Total 10,97 530
Afin de calculer celle-ci, j'ai suivi le tuto présent sur ce site : http://fr.wikihow.com/calculer-la-valeur-P
1e étape : déterminer les résultats attendus. Le test en question n'ayant jamais été réalisé dans les conditions définies dans le cadre de mon expérimentation, je ne peux me baser sur aucun autre résultat. Cependant, si l'hypothèse nulle est vraie, nous devrions obtenir la même moyenne pour chaque groupe. Par conséquent, les résultats attendus sont les suivants :
Moyenne(A1) = 10,97
Moyenne(A2) = 10,97
Moyenne(A3) = 10,97
2e étape : déterminer les résultats observés (cf. mon premier tableau)
3e étape : déterminer le degré de liberté. Ayant trois groupes, mon degré de liberté est de 2 (3-1).
4e étape : calculer le khi-deux.
Si je ne me trompe pas dans la formule, le calcul est le suivant :
X² = (11,68-10,97)²/10,97+(10,71-10,97)²/10,97+(9,91-10,97)²/10,97 = 0,155
5e étape : choisir le seuil de significativité. Pour faire original, je choisis un seuil de 5%.
6e étape : déterminer la valeur p à l'aide d'un tableau. J'obtiens p > 25% (et même largement supérieur).
En réfléchissant un peu, je me suis dit que ma méthode de calcul était biaisée. En effet, le nombre de personnes ayant répondu au questionnaire n'est pas prise en compte. Par conséquent, j'ai décidé de refaire le calcul en me basant, non plus sur les moyennes, mais sur la somme des scores obtenus par chacun des groupes. Mes résultats sont donc les suivants :
Je reprends donc mes étapes dans l'ordre.Code:Groupe Moyenne Nombre Somme des scores A1 11,68 248 2897 A2 10,71 151 1617 A3 9,91 131 1298 Total 10,97 530 5812
1e étape : déterminer les résultats attendus. Là encore, si mon hypothèse nulle est vraie, la somme des scores d'un groupe doit valoir SommeTotale/NombreTotal*NombreGroupe. Par exemple, pour A1, je devrais obtenir 5812/530*248 = 2719,58.
Somme(A1) = 2719,58
Somme(A2) = 1655,87
Somme(A3) = 1436,55
4e étape : calculer le Khi-Deux.
X² = (2897-2719,58)²/2719,58+(1617-1655,87)²/1655,87+(1298-1436,55)²/1436,55 = 25,84
6e étape : déterminer la valeur p à l'aide d'un tableau. J'obtiens p < 0,005% (et même largement inférieur).
Dans les deux cas, les valeurs p que j'obtiens me semblent aberrantes : soit largement trop élevée, soit largement trop basse.
Dans le premier cas, je ne peux absolument pas rejeter l'hypothèse nulle alors que je suis totalement en droit de le faire dans le cadre de mon second mode de calcul.
J'aimerais donc avoir votre avis sur la méthode que j'emploie : est-elle correcte ou ai-je réalisé des erreurs dans mon calcul ?
Merci pour votre retour.
-----