Bonjour, travaillant sur un projet dans le cadre d'un module de Bio-Informatique, j'aimerais faire appel à des gens calés sur ce domaine.

En fait à partir d'une séquence protéique, où nous demande d'interroger la base de donnée Swissprot ainsi que NR pour valider l'hypothèse quand à la fonction de la séquence prédite avec InterProScan.

Selon InterProscan, ma séquence semble coder pour une partie d'une Methylmalonyl-CoA Mutase. Le problème c'est que quand j'interroge la base de donnée SwissProt, les 4 séquences homologues de plus faible E-value (pour un query cover de 100%) codent pour Isobutyryl-CoA Mutase, et on trouve la Methylmalonyl CoA Mutase seulement en 5ème E-Value la + faible (beaucoup + élevée que pour l'isobutyryl).

Du coup dans mon rapport j'ai dis que finalement la séquence codait surement pour une isobutyryl, mais nouveau problème, lorsque j'interroge NR cette fois-ci, on me ressort la Methylmalonyl.

Du coup je n'arrive pas à savoir à quelle protéine j'ai à faire entre les deux, j'ai deux résultats qui se rejoignent pas. Je me disais peut-être que ces deux protéines étaient très proches et qu'il fallait donc garder l'isobutyryl, SwissProt étant une base de donnée plus précise ?


J'espère que j'arrive à me faire comprendre, j'ai peu de notions en bio-informatique la réponse est peut être toute bête mais là je bloque