Bonjour,
Je suis actuellement en train d'analyser des données biologiques, et je bloque devant un problème statistique qui, je pense, est tout bête et sera évident à résoudre pour vous.
J'ai un échantillon (n=3) provenant d'une même population (3 embryons de souris au même stade, issue de la même mère).
Sur ces trois individus, on mesure l'expression d'un gène : .
On normalise par rapport à un gène de référence : .
Donc finalement, j'ai
La technique utilisée (et la théorie qu'il y a derrière), nous dit que l'expression "réelle" du gène, appelée enrichissement vaut :
J'en arrive à mes questions.
Est-ce que je dois calculer un moyen puis appliquer ma formule d'enrichissement ?
Est-ce que je dois calculer trois enrichissements et calculer ensuite la moyenne ?
J'ai choisi le second cas pour une raison pratique : la standard deviation est beaucoup plus facile à gérer... Alors que dans le premier cas, je patauge.
Et je me suis dit que si je me plantais, je me plante de partout ... Et comme ce n'est pas la valeur d'expression de mon gène qui m'intéresse mais sa variation au cours du temps (l'expérience citée plus haut a été faite plusieurs fois à différents stades), ça ne devrait pas avoir d'impact sur mes analyses et mes conclusions.
Aussi, si c'est le premier cas qui est correct d'un point de vu statistique, comment je gère ma SD ? =)
-----