Bonjour,
je me retrouve confronté à un petit problème de lecture de données :
je dois analyser un eu de donnée se présentant sous la forme d'un tableau, avec pour titre de colones :
Site, Année, Inidividus, sexe, et locus A, locus B, locus, C ...
Ma question concerne les données que j'ai dans les colonnes "locus" :
en effet, je me retrouve avec des allèles codés a 3 chiffres
1) (ex : 100110 pour le locus A), donc, si j'ai bien compris, cela signifie que mon individu possède, au locus A, l'allèle 100 sur un chromosome, et l'allèle 110 sur l'autre chromosome?
2) parfois, j'ai 000174, qu'est ce que les "000" signifie? qu'il n'y a pas dd'allèle ? ou bien qu'il n'a pas été possible d'identifier l'allèle?
3) je pensais enlever tout les individus qui possèdent un "000" pour mon analyse, est ce le bon choix?
4)d'ailleur, une derniere question, est ce que, en ayant que ces données, je peut avoir la taille des allèles??? (est ce que, par exemple, un allèle "178" sera plus grand que l'allèle "119" par exemple? (ou bien s'agit-il uniquement de leur "nom de code"?)
5) car je dois utiliser un modele de regression linéaire sur ces données, mais je ne vois pas trop quelle question me poser, quelle problématique dois-je aborder avec ces données
-----