Bonjour,
Je suis en train de lire un livre de psychologie expérimentale qui traite d'une partie de statistiques sur l'hypothèse nulle :
Soit la population A Contrôle
Soit la population B Traitée
Soit B_v un échantillon de B de taille fixée N.
On définit p comme la probabilité que l'échantillon B_v n'ait pas été traitée et fasse partie de la population A.
J'ai beaucoup de mal à travailler avec cette définition, mais je la comprends de cette manière :
Dans le cas idéal où on connaît la population A :
Soit (Ai) inclus dans A la suite de tous les échantillons de taille N de A. Soit mi la moyenne de Ai.
Sur un bind de taille epsilon, on calcule la fréquence de mi :
fréquence_epsilon ( mi ) = card({mp} tel que mp appartient à [mi- epsilon/2, mi+ epsilon/2] pour un p).
On trace ainsi la courbe de fréquences des moyennes :
voici 3 exemples : dont la variabilité est différente. (ce n'est pas exactement des courbes de fréquences de moyennes mais c'est juste pour donner une idée).
soit m(B_v) la moyenne de B_v.
Il me paraît naturel de définir (pas de manière formelle mais de manière intuitive !) le p comme le quotient entre l'aire située entre m(B_v) et la fin de la courbe à droite et l'aire totale de la courbe. (dans le cas où m(B_v) est à droite du centre de la courbe).
Ainsi, on voit que pour m(B_v) fixée, l'aire de la courbe sera de plus en plus importante lorsque la variabilité devient importante (voir la figure en pièce jointe). Ce que je ne comprends pas, c'est que sur ces figures, ils définissent la zone hachurée comme la zone où p<0.05 et cette zone est d'autant plus grande que la variabilité est faible... pour moi ce n'est pas cohérent ? Comment pourrait-on définir le p dans cette situation idéale ?
Soyez indulgent, les stats, c'est pas mon truc !!
Merci de votre aide
-----