Bonjour à tous,
J'aurais besoin d'aide concernant l'élaboration d'un script bash pour extraire des séquence fasta.
J'ai un fichier nommé test.txt qui a ce type de format :
1739 3.27 0.00 0.00 contig_1 21700 21913 (1813093) RM2_rnd-1_family-0#LTR/Gypsy 1666 1879 (4848) m_b1s001i0
contig_1 21700 AATGCTTATAGAGAAAGCTGTCAGACTTGA TGATAGGCTTTTTGAAAGAA 21749
i
RM2_rnd-1_fam 1666 AACGCTTATAGAGAAAGCTGTCAGACTTGA TGATAGGCTTTTTGAAAGAA 1715
contig_1 21750 GAAAGGAGAAGAACCAAGACTGGCATCCAA CAAGAAATTTCAACAATTAC 21799
RM2_rnd-1_fam 1716 GAAAGGAGAAGAACCAAGACTGGCATCCAA CAAGAAATTTCAACAATTAC 1765
J'aimerai que le script garde la ligne ou il detecte LTR (s'il détecte autre chose il ne doit pas la garder), et une fois qu'il a détecter dans une ligne LTR, il doit regarder dans les lignes d'en bas qui contiennent contig et extraire la séquence donc j'obtiendrai quelque chose du style :
1739 3.27 0.00 0.00 contig_1 21700 21913 (1813093) RM2_rnd-1_family-0#LTR/Gypsy 1666 1879 (4848) m_b1s001i0
contig_1 21700 AATGCTTATAGAGAAAGCTGTCAGACTTGA TGATAGGCTTTTTGAAAGAA 21749
contig_1 21750 GAAAGGAGAAGAACCAAGACTGGCATCCAA CAAGAAATTTCAACAATTAC 21799
Merci pour votre aide !
-----