Script Bash pour extraire des séquences fasta
Répondre à la discussion
Affichage des résultats 1 à 11 sur 11

Script Bash pour extraire des séquences fasta



  1. #1
    Oceane666

    Script Bash pour extraire des séquences fasta


    ------

    Bonjour à tous,
    J'aurais besoin d'aide concernant l'élaboration d'un script bash pour extraire des séquence fasta.

    J'ai un fichier nommé test.txt qui a ce type de format :
    1739 3.27 0.00 0.00 contig_1 21700 21913 (1813093) RM2_rnd-1_family-0#LTR/Gypsy 1666 1879 (4848) m_b1s001i0

    contig_1 21700 AATGCTTATAGAGAAAGCTGTCAGACTTGA TGATAGGCTTTTTGAAAGAA 21749
    i
    RM2_rnd-1_fam 1666 AACGCTTATAGAGAAAGCTGTCAGACTTGA TGATAGGCTTTTTGAAAGAA 1715

    contig_1 21750 GAAAGGAGAAGAACCAAGACTGGCATCCAA CAAGAAATTTCAACAATTAC 21799

    RM2_rnd-1_fam 1716 GAAAGGAGAAGAACCAAGACTGGCATCCAA CAAGAAATTTCAACAATTAC 1765

    J'aimerai que le script garde la ligne ou il detecte LTR (s'il détecte autre chose il ne doit pas la garder), et une fois qu'il a détecter dans une ligne LTR, il doit regarder dans les lignes d'en bas qui contiennent contig et extraire la séquence donc j'obtiendrai quelque chose du style :

    1739 3.27 0.00 0.00 contig_1 21700 21913 (1813093) RM2_rnd-1_family-0#LTR/Gypsy 1666 1879 (4848) m_b1s001i0
    contig_1 21700 AATGCTTATAGAGAAAGCTGTCAGACTTGA TGATAGGCTTTTTGAAAGAA 21749
    contig_1 21750 GAAAGGAGAAGAACCAAGACTGGCATCCAA CAAGAAATTTCAACAATTAC 21799

    Merci pour votre aide !

    -----

  2. #2
    MissJenny

    Re : Script Bash pour extraire des séquences fasta

    Si tu connnais le logiciel R tu peux utiliser le package seqinr, il permet la lecture et toutes sortes de manipulations de fichiers fasta.

  3. #3
    Oceane666

    Re : Script Bash pour extraire des séquences fasta

    Merci pour votre réponse,
    Je préférerais l'utilisation de bash, car mon fichier n'est pas réellement un fasta car il n'a pas le même formatage. J'aimerai juste extraire uniquement les séquences qui sont en corrélation avec LTR dans le nom et ne pas prendre toute les autres. Je vais regarder le package que vous m'avez conseillé mais je ne suis pas très à l'aise avec Rstudio.

  4. #4
    pm42

    Re : Script Bash pour extraire des séquences fasta

    Je ne connais pas le format et ton exemple n'est pas très clair : c'est quoi "les lignes d'en bas" ?

    Mais pour faire ce genre de choses de nos jours, le bon point de départ est de demander à ChatGPT en lui expliquant ce qu'on veut, éventuellement un exemple et de partir du code qu'il génère.

  5. A voir en vidéo sur Futura
  6. #5
    Oceane666

    Re : Script Bash pour extraire des séquences fasta

    j'ai déjà demandé à chatgpt mais ce qu'il me donne comme résultat n'est pas cohérent, mais je pense avoir réussi à obtenir à peu près ce que je voulais merci encore

  7. #6
    polo974

    Re : Script Bash pour extraire des séquences fasta

    Code:
    grep 'LTR\|^contig' fichier
    ça ne garde que les lignes contenant LTR ou commençant par contig

    pas besoin d'enquiquiner un chat pour ça, il va finir par donner des coup de griffes...
    Jusqu'ici tout va bien...

  8. #7
    Stan_94

    Re : Script Bash pour extraire des séquences fasta

    bonjour,
    juste pour savoir... GREP, c'est uniquement sous un système de type Unix, non ?
    donc si la primo posteuse est sous Windows, y-a-t-il un équivalent simple et rapide ?

  9. #8
    albanxiii
    Modérateur

    Re : Script Bash pour extraire des séquences fasta

    Citation Envoyé par Stan_94 Voir le message
    donc si la primo posteuse est sous Windows, y-a-t-il un équivalent simple et rapide ?
    Installer cygwin ou msys2. Sinon, Microsoft propose une installation de linux dans Windows.
    Ou encore un petit script python, mais cela sera plus spécifique à la tâche à effectuer (on ne va pas réécrire grep en python).
    Not only is it not right, it's not even wrong!

  10. #9
    pm42

    Re : Script Bash pour extraire des séquences fasta

    Citation Envoyé par Stan_94 Voir le message
    juste pour savoir... GREP, c'est uniquement sous un système de type Unix, non ?
    donc si la primo posteuse est sous Windows, y-a-t-il un équivalent simple et rapide ?
    Vu qu'il a demandé une solution en bash, cela résout le problème : soit il est sur un système Unix, soit il a un équivalent.


    Citation Envoyé par polo974 Voir le message
    Code:
    grep 'LTR\|^contig' fichier
    ça ne garde que les lignes contenant LTR ou commençant par contigu
    pas besoin d'enquiquiner un chat pour ça, il va finir par donner des coup de griffes...
    Sauf que de ce que j'ai compris, il veut extraire aussi les lignes suivantes ce qui ne peut pas se faire avec un simple grep.

  11. #10
    polo974

    Re : Script Bash pour extraire des séquences fasta

    J'ai répondu avec ce que j'ai interprété de la question, mais vu l'imprécision de la demande, j'ai peut-être tapé à côté.

    Sinon, avec de bonnes explications, on doit pouvoir le faire avec un sed (de la mort qui tue... ).

    Ou quelques lignes de shell...

    Il y en a qui aiment aussi perl...

    Les goûts et les couleurs, ça ne se discute pas...
    Jusqu'ici tout va bien...

  12. #11
    pm42

    Re : Script Bash pour extraire des séquences fasta

    Citation Envoyé par polo974 Voir le message
    J'ai répondu avec ce que j'ai interprété de la question, mais vu l'imprécision de la demande, j'ai peut-être tapé à côté.
    Pareil d'où ma demande sur "les lignes plus bas" restée sans réponse.

    Citation Envoyé par polo974 Voir le message
    Sinon, avec de bonnes explications, on doit pouvoir le faire avec un sed (de la mort qui tue... ).
    Ou quelques lignes de shell...
    Il y en a qui aiment aussi perl...
    Oui ou avec awk ou les fonctions de lecture de fichier de bash comme ci-dessous... Les possibilités sont infinies.
    Code:
    while read -r line; do
      if [[ "$line" == *"LTR"* ]]; then
         found_ltr=true
      fi
    done
    Citation Envoyé par polo974 Voir le message
    Les goûts et les couleurs, ça ne se discute pas...
    Non même si perl, ça se discute (et j'en ai beaucoup fait)

Discussions similaires

  1. Découpe d'un fichier fasta
    Par invite7753e15a dans le forum Programmation et langages, Algorithmique
    Réponses: 18
    Dernier message: 07/03/2017, 14h54
  2. Tri d'un fichier FASTA
    Par invite7753e15a dans le forum Biologie
    Réponses: 7
    Dernier message: 12/11/2016, 23h15
  3. [Biochimie] conversion fasta/PDB
    Par invitecc7146d2 dans le forum Biologie
    Réponses: 1
    Dernier message: 16/01/2008, 14h20
  4. Logiciel pour sequences vidéo
    Par invitee6825c80 dans le forum Logiciel - Software - Open Source
    Réponses: 5
    Dernier message: 21/10/2007, 20h27
  5. séquences d'un couple d'amorces pour pcr
    Par invitee2a6b456 dans le forum Biologie
    Réponses: 3
    Dernier message: 03/03/2006, 15h02