Bonjour,
Je travaille sur un projet de transcriptome chez la souris. Le travail consiste à comparer les profiles d'expression de tous les gènes dans 3 conditions (individus):
- souris mutant,
- souris double mutant,
- témoin
Pour chaqu'une de ces conditions (témoin, souris mutant, et souris double mutant) j'utilise 5 individus pour en extraire les RNA totaux, synthétiser les cDNA marquées et les hybrider ensuite sur des lames "Oligochip" contenant tout le génome de la souris.
Les résultats ressemblent à ce qui est dans le tableau ci dessous.
Je m'adresse à ceux qui ont un peu de l'expérience dans le domaine du transcriptome et l'analyse des donnée à haut débit pour leur précieux conseils, et je leur en serais très reconnaissant.
L'idée de cette étude, comme vous le devinez!, est de trouver des gènes qui sont différentiellement exprimés dans les mutants (simple ou double mutant) par rapport au témoin.
Pour cela j'aimerais savoir;
- Quels seraient les tests statistiques les plus pertinents pour trouver les gènes différentiellement exprimés (entre les 3 conditions indiquées)? Est-ce l'ANOVA ou le test de Student (T-test) ou autres ?
- Pour effectuer, justement, un test ANOVA dans Excel, faut-il moyenner les valeurs de chaque gène, par individu et par puces (par ligne donc dans le tableau ci-dessous), ou les laisser telles qu'elles?
Par exemple, si je je veux tester le gène 2 (dans le tableau cidessous), est-ce que je dois moyenner ses valeurs dans les 3 conditions les comparer ou les laisser telles quelles ? sinon, quels sont les cellules à sélectionner comme plage d'entrée dans excel pour effectuer proprement et correctement un test d'ANOVA ou Student pour ce gène ? En fait, j'ai essayé dans excel, mais je ne suis pas sûr d'avoir fait la bonne manip !
- Par ailleurs, j'ai lu qu'il faudrait transformer les valeurs en log2 (c'était surtout pour les puces où on utilise 2 couleurs, Cy3 et Cy5 pour le marquage, ce qui n'est pas le cas ici), alors pourquoi la transformation en log et est-ce que cette transformation indispensable, sachant que j'ai un seul type de marquage (donc pas de Cy3 et Cy5 à la fois).
- Est-ce que la normalisation globale (calculer chaque valeur comme pourcentage de la sum totale de tous les gènes sur la puce) ou il y a d'autres moyens de normalisation plus appropriées ?
En vous remerciant beaucoup par avance et vous souhaitant une très bonne journée.
-----