Bonjour,
Nous avons séquencé le transcriptome de glande salivaire d'une espèce d'insecte. J'aimerais déterminer quelles protéines sont codées par ces transcrits et si ces protéines sont secrétées. Voici les différentes étapes que je compte faire pour mon analyse :
1/ Filtrer mon fichier transcriptome avec un blastx contre la banque nr
-> j'obtiens deux résultats les transcrits qui ont matchés contre la banque nr (protéines potentielles) et ceux qui n'ont pas matchés
2/ Traduire mes deux fichiers précédents en séquences protéique avec prodigal
-> Je trie les ORF complets (codon start + stop) et incomplets
3/ chercher le signal de sécrétion avec signalP et secretomeP
->j'obtiens le secrétome potentiel avec un fichier annoté et un autre non annoté
4/Le secrétome annoté et le secrétome non annoté je peux faire un interproscan pour avoir des informations sur le domaine et motifs protéique.
Ma question que je me pose n'est-il pas mieux que je fasses la traduction dès le début, puis faire un blastp sur les séquences protéiques traduites, car peut-être que la traduction en séquence protéique ne donne pas du tout le même résultat que le blastx ?
Merci pour votre aide
-----