Répondre à la discussion
Affichage des résultats 1 à 19 sur 19

Langage R et Biologie Moléculaire



  1. #1
    La_moo

    Exclamation Langage R et Biologie Moléculaire


    ------

    Bonjour et Bonne année à vous !

    Voila, au labo, il faut mettre en place un programme sur R qui compte le nombre d'apparitions de chaque codon dans le code génétique et renverra un vecteur avec le nombre d'apparitions de chaque codon tout ça à partir d'un tableau de dimension 2.
    Quelqu'un aurait la gentillesse de m'aider un peu, je suis un peu perdue la...

    Si vous voulez plus de détails, je suis à votre disposition =)

    -----

  2. Publicité
  3. #2
    defender19

    Re : Langage R et Biologie Moléculaire

    Bonjour,

    En gros, en entrée tu auras quoi? Un fichier à lire ou des données déjà remplies?

    Pourquoi ne fais tu pas ça avec Perl ? beaucoup plus simple à faire

  4. #3
    La_moo

    Re : Langage R et Biologie Moléculaire

    Bonjours,
    Je dispose de deux fichiers : codons.txt et sequence.txt.
    Je sais très bien qu'il y a plus simple, mais malheureusement les autres chercheurs utilisent R et bien entendu je ne suis pas formée sur ce genre de langage...

  5. #4
    Dlzlogic

    Re : Langage R et Biologie Moléculaire

    Bonjour,
    C'est pas tant le langage qui est important, mais l'algorithme.
    Rédigez votre algorithme, l'écriture avec R ou C ou je ne sais quoi sera simple.

  6. A voir en vidéo sur Futura
  7. #5
    La_moo

    Re : Langage R et Biologie Moléculaire

    Merci de vos réponses, mais le soucis, c'est que je ne sais vraiment plus quoi faire, je suis compltement perdue

  8. #6
    luckylucky

    Re : Langage R et Biologie Moléculaire

    Salut,

    tu cherches quelque chose comme ça :

    t=read("codons.txt")
    table(t)

    ?

  9. Publicité
  10. #7
    photon57

    Re : Langage R et Biologie Moléculaire

    Hello,

    Tu bosses pour un labo dans lequel on utilise un logiciel que tu ne connais pas, une solution : autoformation.
    Une recherche sur google te donnera accès rapidement à des tuto et autres fiches pratiques :

    http://abcdr.allstat.fr/
    http://math.univ-lille1.fr/~jacques/Download/Cours/Commandes-R.pdf
    http://math.univ-lille1.fr/~jacques/Download/Cours/Intro-R.pdf
    ...

  11. #8
    Dlzlogic

    Re : Langage R et Biologie Moléculaire

    Bonjour Photon,
    Avec mon esprit tordu, je proposerai une autre solution, écrire le truc dans le langage connu, le traduire en algorithme, la réécriture en langage R ne devrait pas poser de problème.
    Bon, pardon pour mon esprit mal tourné, mais je crois que la première chose à faire par notre amie La_moo est de prendre un papier et un crayon et d'écrire avec des mots ce qu'il faut faire.
    A partir de là, on pourra l'aider.

  12. #9
    La_moo

    Re : Langage R et Biologie Moléculaire

    Auto-formation, je veux bien, on me donne ça via mail ce matin à rendre demain 8h ...
    J'ai déjà fait les 3 premières parties qui était une application de la théorie mais là je bloque.

  13. #10
    Dlzlogic

    Re : Langage R et Biologie Moléculaire

    Moi, je veux bien vous aider, il faudrait au moins que vous décriviez le problème.
    Evitez d'employer des mots que je ne connais pas comme codon, ou alors il faut les décrire.
    Que contiennent vos deux fichiers ?
    Vous pouvez par exemple joindre une copie des 10 ou 20 premières lignes des 2 fichiers
    Dites-moi ce que vous appelez un vecteur. C'est un objet mathématique qui peut représenter tout et n'importe quoi. Pour vous ça doit représenter quelque-chose de très précis, groupe sans logique, groupe hiérarchisé, colonne de la matrice d'une application ...?

  14. #11
    La_moo

    Re : Langage R et Biologie Moléculaire

    Un codon est une séquence de 3 bases. Comme il y a 4 bases possibles, cela donne 64 séquences de 3 bases. Le fichier codons.txt présente ces 64 codons.
    A partir du fichier codons.txt, il faut construire un tableau à 2 dimensions de 64 lignes et 4 colonnes où chaque ligne comporte aux trois premières colonnes les trois bases nucléiques qui composent ce codon et le nom de celui-ci dans la quatrième colonne.
    Un code génétique est une suite de codons.
    Une fois le tableau créé, je dois écrire un programme qui compte le nombre d’apparition de chaque codon dans le code et renverra un vecteur avec le nombre d’apparition de chaque codon.
    Enfin, mon programme devra afficher le résultat sous la forme d’un camembert.

    Voila, je pense avoir bien résumé ... je vais essayer de vous joindre les deux fichiers.

  15. #12
    La_moo


  16. Publicité
  17. #13
    Dlzlogic

    Re : Langage R et Biologie Moléculaire

    Je pense que je ne peux pas lire ces fichiers, je ne suis pas inscrit.
    Le mieux, c'est de les afficher avec n'importe quel éditeur, "copier" les 10 ou 20 premières lignes et "coller" dans la fenêtre de messages de Futura.
    Même chose pour le second.
    S'il y a un aspect confidentiel, il reste la possibilité de MP.

  18. #14
    piwi

    Re : Langage R et Biologie Moléculaire

    Bonjour,

    Je ne comprends pas vraiment ce que vous souhaitez faire à partir de l'énoncer de votre problème. Pour les non biologistes/médecins, la notion de codon renvoie au code qui fait correspondre l'ADN contenu dans les gènes aux protéines qu'ils permettent de synthétiser. En gros, l'ADN est à comprendre comme un enchainement de 4 molécules appelées A, T, C, et G. L'ADN d'un gène peut donc s'écrire sous la forme d'une chaine de taille n constituée de ces 4 lettres. Un codon est simplement la succession de 3 lettres pris dans cette chaine (je simplifie le problème et passe certains détails)
    Ainsi si on a ATGGCCTAG, on peut isoler 3 codons ATG GCC TAG. Ces codons renvoient à une table, le code génétique, qui fait correspondre à chacun d'entre eux un acide aminé (les briques de construction des protéines).
    Sous réserve que la question ait été bien posée, ce dont je doute fortement, la question est de savoir combien de fois on retrouve un même codon dans le code génétique. La réponse est 1 fois... Pas la peine d'écrire un algo pour cela.
    Je pense que la question est plutôt: considérant une chaine d'ADN contenue dans le fichier sequence.txt, combien de fois retrouve-t-on chacun des codons contenus dans le fichier codon.txt à l'intérieur.

    C'est le genre de problème qui se résout très facilement en C et j'imagine encore plus facilement en Perl. En gros l'idée que je propose est d'aller charger la chaine à partir du fichier sequence, puis de la scanner avec chacune des entrées codon du fichier codon (en principe, ils devraient être mis sur une colonne si la personne qui l'a crée n'est pas totalement perverse). Tu dois construire/initialiser une nouvelle chaine, une boucle avec un compteur qui scanne et qui remplie la chaine et c'est bon. En sortie, tu peux renvoyer tes codons pêchés dans le fichier codon avec les valeurs correspondantes de la chaine que tu as crée.
    Reste à savoir comment faire cela avec R

    piwi
    Je sers la science et c'est ma joie.... Il parait.

  19. #15
    La_moo

    Re : Langage R et Biologie Moléculaire

    Tu as tout compris, mais je suis bloquée avec ce foutu R !

  20. #16
    defender19

    Re : Langage R et Biologie Moléculaire

    Je confonds peut être R et Scilab, mais de mémoire pour mettre le fichier en mémoire dans un tableau, tu utilises un readtable ou un data frame en spécifiant les séparateurs (";" ou autre).

    Il doit y avoir ensuite une fonction pour compter une entité dans un tableau; je connais plus le nom de la fonction.

    en gros :

    * mettre ton fichier dans un tableau
    * compter le nombre de fois que chaque codon est présent dans le code génétique
    * stocker ses résultats sous la forme de clef valeur : codon UAG=> 4 (fois)
    * retourner le vecteur

    C'est bien ça?

  21. #17
    La_moo

    Re : Langage R et Biologie Moléculaire

    Alors le fichier codons :
    U U U Phe
    U U C Phe
    U U A Leu
    U U G Leu
    C U U Leu
    C U C Leu
    C U A Leu
    C U G Leu
    A U U Ile
    A U C Ile
    A U A Ile
    A U G Met
    G U U Val
    G U C Val
    G U A Val
    G U G Val
    U C U Ser
    U C C Ser
    U C A Ser
    U C G Ser
    C C U Pro
    C C C Pro
    C C A Pro
    C C G Pro
    A C U Thr
    A C C Thr
    A C A Thr
    A C G Thr
    G C U Ala
    G C C Ala
    G C A Ala
    G C G Ala
    U A U Tyr
    U A C Tyr
    U A A Stop
    U A G Stop
    C A U His
    C A C His
    C A A Gln
    C A G Gln
    A A U Asn
    A A C Asn
    A A A Lys
    A A G Lys
    G A U Asp
    G A C Asp
    G A A Glu
    G A G Glu
    U G U Cys
    U G C Cys
    U G A Stop
    U G G Trp
    C G U Arg
    C G C Arg
    C G A Arg
    C G G Arg
    A G U Ser
    A G C Ser
    A G A Arg
    A G G Arg
    G G U Gly
    G G C Gly
    G G A Gly
    G G G Gly



    Et sequence :

    A C C U G U C A A A
    C A A A U C U G G U
    C A A C C U G U G U
    C C A A U U C A G G
    U C U G A A C C U C
    A A A C C G U G U A
    C A G U A G C A U C
    A C A U G G U G A A
    C C U U G U C A C A
    U G C A C A U C A A
    U A A C G G U A C U
    A G G U C U A A U G

  22. #18
    La_moo

    Re : Langage R et Biologie Moléculaire

    Dans une premier temps j'obtiens ça : ( raccourci bien sur)
    > read.table("codons.txt")
    V1 V2 V3 V4
    1 U U U Phe
    2 U U C Phe
    3 U U A Leu
    4 U U G Leu
    5 C U U Leu
    6 C U C Leu
    7 C U A Leu
    8 C U G Leu
    9 A U U Ile
    ...
    Dans un second temps je pensai écrire ça, mais pas toutes les bases sont comprises...

    > codons<-scan("codons.txt",what="list")
    Read 256 items
    > table(codons)
    codons
    A Ala Arg Asn Asp C Cys G Gln Glu Gly His Ile Leu Lys Met
    48 4 6 2 2 48 2 48 2 2 4 2 3 6 2 1
    Phe Pro Ser Stop Thr Trp Tyr U Val
    2 4 6 3 4 1 2 48 4

  23. Publicité
  24. #19
    luckylucky

    Re : Langage R et Biologie Moléculaire

    complètement par hasard, je viens de tomber sur ça : http://www.developpez.net/forums/d11...r-licence-sts/

Discussions similaires

  1. [Exercice] biologie moléculaire et génétique moléculaire
    Par killboul dans le forum Biologie
    Réponses: 2
    Dernier message: 08/11/2011, 14h40
  2. Biologie moleculaire
    Par Angelina_joli dans le forum Biologie
    Réponses: 4
    Dernier message: 27/04/2011, 10h57
  3. [Exercice] Biologie moléculaire
    Par khadeer dans le forum Biologie
    Réponses: 6
    Dernier message: 01/02/2009, 21h32
  4. Réponses: 12
    Dernier message: 24/07/2007, 23h49
  5. biologie moléculaire
    Par snowteam dans le forum Biologie
    Réponses: 2
    Dernier message: 22/08/2005, 10h59