Bonjour à tous,
Je me suis plongée dans les analyses phylogénétiques il y a une semaine et là je ne m'en sors plus. J'espère que vous saurez m'aider...
J'ai cloné des produits pcr que j'ai séquencé par la suite. J'ai 4 banques de clones et quelques 200 séquences en tout à moi plus 40 séquences de référence de genbank. Les 4 banques sont pour 4 états différents et le but s'est de comparer la diversité microbienne dans les 4 états.
Les premiers arbres que j'ai fait était pas du tout lisibles, vu le grand nombre de séquences.
Pour réduire au max, j'ai traduit en séquences protéiques et regroupé celles qui sont similaires à +97% (tout ça sous Excel). Je me suis retrouvé avec 7 grands groupes de séquences (dans chaque groupe j'ai des représentants des 4 banques de clones) et 62 séquences individuelles (total 69).
Première question: Est-ce que cette façon de faire vous semble correcte?
Question 2: Est-ce que mes 7 groupes sont des OTUs (operational taxonomic unit)?
J'ai analysé ces 69 séquences sous Phylip en utilisant Neighbor et Parsimony et les arbres se ressemblent (ouf!) Mais le fait d'avoir des groupes avec des séquences des 4 banques me gène un peu. On m'a conseillé de procéder ainsi pour voir l'apparition/disparition d'espèces entre les 4 états étudiées.
Pour tester la representativité des banques et leur diversité, j'utilise Mothur. Je m'y suis plongée qu'aujourd'hui... Le logiciel utilise des matrices de distances calculées sous Phylip et me fais des différents groupes d'OTUs en utilisant des différents "cutoff"
Question3: c'est quoi les "cutoff"en Mothur? Comment choisir le meilleur?
Question4: est-ce que je peux utiliser les OTUs que Mothur me fait, pour revenir à l'étape précédente et réduire le nombre de mes séquences?
Question5: si réponse oui à question 4, est-ce que je procède banque par banque ou encore une fois les 4 ensemble? J'ai vu que Mothur peut séparer les séquences en groupes, je peux utiliser cette fonction dans ce cas?
Voilà en gros. J'espère avoir été claire, si c'est pas le cas remarques et questions sont les bienvenues.
Merci à tous!