Bonjour à tous !
J'ai téléchargé le génome humain complet séquencé sur le site du NCBI (Centre de recherche biologique américain).
Les fichiers sont au format "FASTA" : Les nucléotides sont représentés par les lettres A-T-G-C, et les nucléotides indéterminés sont écrits "N".
Sur le premier chromosome, il y a environ 250 millions de nucléotides dont 18 millions indéterminés. Ces-derniers sont regroupés par paquet de plusieurs milliers tout au long du chromosome.
Comment peut-on réussir à décoder autant de nucléotides et ne pas réussir avec d'autres ?
Merci d'avance, je suis curieux de connaître la réponse.
-----