Répondre à la discussion
Page 1 sur 2 1 DernièreDernière
Affichage des résultats 1 à 30 sur 42

Probabilités et ADN



  1. #1
    philagui74

    Question Probabilités et ADN


    ------

    Bonjour,
    Je bute en probabilités sur un exercice qui me parait relativement complexe:
    Quelle est la probabilité de trouver une séquence donnée constituée de n bases dans un ADN génomique constitué de N bases (avec n < N) ?
    Je rappelle rapidement que l'ADN est constitué d'un enchainement linéaire de 4 bases notées A(Adénine), C(Cytosine), G(Guanine) et T(Thymine).
    Au début, j'avais fait le raisonnement suivant:
    il s'agit de ranger N-n bases dans N-n "tiroirs", en rangeant la séquence de n bases à tous les endroits possibles de la séquence de N bases.
    Par exemple, si l'on recherche la probabilité que la séquence AT apparaisse dans une séquence de 4 bases, on aurait:
    ATxx: 4*4 cas favorables
    xATx: 4*4 cas favorables
    xxAT: 4*4 cas favorables
    soit 3*4*4 cas favorables
    x étant n'importe quelle base

    Ce qui donne la formule suivante:

    (nombre de cas favorables sur nombre de cas possibles).

    Le problème est que (je m'en suis rendu compte après), ce raisonnement est faux. Car, si l'on reprend l'exemple précédent, on compte deux fois la séquence ATAT.

    La formule précédente est donc aussi fausse (car par exemple si l'on prend n=2 et N=2000, on obtient un nombre > 1, qui n'est évidemment pas une probabilité).

    Si quelqu'un a une ou des idées...
    Merci d'avance.

    -----

  2. Publicité
  3. #2
    Cyp

    Re : Probabilités et ADN

    Pourquoi est-ce que quand il s'agit de proba ça intéresse tout de suite moins de monde lol ?

  4. #3
    philagui74

    Re : Probabilités et ADN

    Petit up si jamais...

  5. #4
    GuYem

    Re : Probabilités et ADN

    Salut.

    j'ai l'impression que la proba que tu cherches est "simplement"

    4^N &#233;tant le nombre de cas possibles. 4^(N-n) le nombre de cas favorables quand la chaine donn&#233;e est plac&#233;e &#224; une certaine position donn&#233;e dans la chaine et N-n+1 &#233;tant le nombre de ces positions possibles.
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  6. #5
    GuYem

    Re : Probabilités et ADN

    H&#233;h&#233; j'avais m&#234;me pas fini de lire ton premier message.

    je ne vois pas en quoi c'est grave qu'on compte deux fois le "AT" de "ATAT".
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  7. A voir en vidéo sur Futura
  8. #6
    GuYem

    Re : Probabilités et ADN

    Apr&#232;s reflexion tu as raison, cette formule n'est pas bonne, elle d&#233;passe 1 des fois.

    mais je crois qu'on n'est pas loin du tout, il y a toujours des petits trucs pas graves qui font foirer comme &#231;a ...
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  9. Publicité
  10. #7
    philagui74

    Re : Probabilités et ADN

    Bonjour,
    Merci Guyem de ton aide, mais j'ai l'impression que j'en suis quand meme assez loin. Pour plusieurs raisons:
    tout d'abord, en effet ce n'est pas grave de compter ATAT, le problème est qu'en utilisant cette formule on le compte 2 fois:
    ATxx: 4^2: ATAT une fois
    xATx: 4^2
    xxAT: 4^2: ATAT deux fois, d'où: 4^2 - 1

    Un autre problème est qu'apparemment cela dépend de la complexité des n bases. Exemple:
    je cherche la probabilité d'obtenir une séquence de 2 bases parmi 3.
    Si ma séquence est AT, j'ai:
    ATA
    ATC
    ATG
    ATT
    AAT
    CAT
    GAT
    TAT
    soit 8 cas favorables
    P= 8/ 4^3 = 8/64

    Maintenant si ma séquence est AA, j'ai:
    AAA
    AAC
    AAG
    AAT
    AAA (déjà compté, donc -1)
    CAA
    GAA
    TAA
    soit non plus 8 mais 7 cas favorables
    d'où P=7/4^3 = 7/64

    Les probabilités sont donc différentes suivant la complexité de la séquence.
    Et va caractériser la complexité d'une séquence d'ADN en maths...
    Merci encore pour ton aide.
    Si vous avez d'autres idées...

  11. #8
    martini_bird

    Re : Probabilités et ADN

    Salut,

    la probabilit&#233; cherch&#233;e est peut-&#234;tre



    avec la longueur de la s&#233;quence cherch&#233;e et la partie enti&#232;re (la somme est finie).

    C'&#233;tait l'id&#233;e du soir... Je vais me coucher.

    Bonne nuit.

  12. #9
    GuYem

    Re : Probabilités et ADN

    Tu te couches trop tard martini !

    Le L que tu introduis n'apparait pas dans la proba que tu donnes. De plus la longueur de la s&#233;quence cherch&#233;e m'a l'air d'&#234;tre n non ?
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  13. #10
    martini_bird

    Re : Probabilités et ADN

    Salut,

    en fait dans la formule est la longueur totale du brin.

    C'est la m&#234;me formule, mais j'ai &#244;t&#233; les probabilit&#233;s de trouver deux fois la s&#233;quence cherch&#233;e, trois fois, etc.

    Cordialement.

  14. #11
    philagui74

    Re : Probabilités et ADN

    Bonjour,
    Merci pour vos réponses.
    Malheureusement selon moi la formule n'est toujours pas bonne.
    Si on prend 2 bases parmi 4, il y a les cas suivants:
    ATxx: 4^2
    xATx: 4^2
    xxAT: 4^2 - 1

    Soit nombre de cas favorables: 2*4^2 + 4^2 - 1

    Or, si j'ai bien compris ta formule, dans le cas où n=2 et N=4, la somme que tu donnes est égale à 1:
    [2-1/1] + [2-1/2] + ... = 1 + 0 +0 ... = 1

    Donc on aurait nombre de cas possibles:
    (N-1)4^(N-n)
    Soit 3 * 4^2 et non pas 2*4^2 + 4^2 - 1

    Merci pour votre aide.

    Si il y a d'autres idées...

    Cordialement.

  15. #12
    martini_bird

    Re : Probabilités et ADN

    Salut,

    Citation Envoyé par philagui74
    Malheureusement selon moi la formule n'est toujours pas bonne.
    Ne t'inqui&#232;te pas, j'avais de s&#233;rieux doutes moi aussi... mais en th&#233;orie, c'est Guyem le pro en probas.

    Si &#231;a n'avance pas, je regarderai la chose de plus pr&#232;s.

    Cordialement.

    PS: ce post ne sert &#224; rien, je sais...

  16. Publicité
  17. #13
    supafly-eclipse

    Re : Probabilités et ADN

    Efreien? Efreienne?...

  18. #14
    GuYem

    Re : Probabilités et ADN

    Citation Envoyé par martini_bird
    Salut,

    Ne t'inquiète pas, j'avais de sérieux doutes moi aussi... mais en théorie, c'est Guyem le pro en probas.

    Si ça n'avance pas, je regarderai la chose de plus près.

    Cordialement.

    PS: ce post ne sert à rien, je sais...
    C'en est trop pour moi

    Je trouve pas la réponse flagellez-moi !
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  19. #15
    GuYem

    Re : Probabilités et ADN

    Bon alors après un peu de reflexion voilà une idée :

    Trouver au moins une fois la chaine de longueur n dans la grande chaine de longueur N c'est soit la trouver une fois, soit la trouver deux fois, soit la trouver trois fois etc jusqu'ua nombre maximum de fois où on peut la trouver qui est évidemment .

    De plus le nombre de cas favorables pour la trouver exactement une fois est comme précedemment . Celle pour la trouver deux fois est etc...

    La probabilité cherchée serait donc :

    A vous de montrer que c'est faux
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  20. #16
    philagui74

    Re : Probabilités et ADN

    Bonsoir,
    Désolé lol
    Le raisonnement me semble très intelligent et à mon avis on doit s'en approcher. Mais avec un cas simple, si j'ai bien compris ta formule, voici ce que ça donne:
    si je prends 2 bases parmi 4, j'ai les cas suivants:
    ATxx: 4^2
    xATx: 4^2
    xxAT: 4^2 -1 (car ATAT a déjà été compté)

    Soit nombre de cas favorables = 2*4^2 + 4^2 - 1 = 47

    Avec ta formule:


    Ceci dit, comme déjà dit précédemment, ce qui me fait peur, c'est que la probabilité dépend de la séquence en elle-même. Si je reprend ce que j'ai écrit plus haut, pour 2 bases parmi 3, on a pas le même résultat si on prend la séquence AT que si l'on prend la séquence AA.
    Donc si je raisonne bien ça veut dire que dans la formule, il doit y avoir un paramètre qui caractérise la complexité de la séquence ou la séquence en elle-même...
    Cordialement.

  21. #17
    Nemat

    Re : Probabilités et ADN

    Citation Envoyé par GuYem
    Bon alors après un peu de reflexion voilà une idée :

    Trouver au moins une fois la chaine de longueur n dans la grande chaine de longueur N c'est soit la trouver une fois, soit la trouver deux fois, soit la trouver trois fois etc jusqu'ua nombre maximum de fois où on peut la trouver qui est évidemment .
    Le "évidemment" est de trop. Dans une chaine de longueur 8 il est possible de loger 3 fois la séquence ATAT : ATATATAT. Par conséquent la manière de compter le nombre de chaines où on trouve 2 fois la séquence ATAT est bien supérieure à celle où te conduit ton raisonnement : par exemple il faut aussi compter comme cas favorable CATATATG

    Autre façon de dire la même chose : les chaînes commençant à la position N+1 ne sont pas indépendantes des chaînes de celles débutant en position N : tout raisonnement considérant ces "locus" comme remplis de façon indépendante est erroné

    Bon, il faut que j'aille travailler, je reprends le problème ce soir. Une piste a priori : compter le nombre de cas défavorables

  22. #18
    philagui74

    Re : Probabilités et ADN

    Bonjour,
    En effet j'ai aussi penser à compter le nombre de cas défavorables en faisant un arbre. Mais cela devient vite complexe, et j'ai abandonné.
    Mais peut-être y a t-il une autre solution pour dénombrer les cas défavorables...
    En tous les cas, merci à tous.

  23. Publicité
  24. #19
    GuYem

    Re : Probabilités et ADN

    Citation Envoyé par Nemat
    Le "évidemment" est de trop. Dans une chaine de longueur 8 il est possible de loger 3 fois la séquence ATAT : ATATATAT. Par conséquent la manière de compter le nombre de chaines où on trouve 2 fois la séquence ATAT est bien supérieure à celle où te conduit ton raisonnement : par exemple il faut aussi compter comme cas favorable CATATATG

    Autre façon de dire la même chose : les chaînes commençant à la position N+1 ne sont pas indépendantes des chaînes de celles débutant en position N : tout raisonnement considérant ces "locus" comme remplis de façon indépendante est erroné

    Bon, il faut que j'aille travailler, je reprends le problème ce soir. Une piste a priori : compter le nombre de cas défavorables

    Tu as complètement raison. Mon "évidemment" est valide si on ne considère que des apparitions de la chaine en question qui ne se rentrent pas dedans !

    Il semble en effet judicieux de compter le nombre de cas défavorable, à vous l'honneur messieurs.
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  25. #20
    GuYem

    Re : Probabilités et ADN

    Bon apr&#232;s un peu plus d'approfondissement (merci Kol&#233;h&#232 il semble que le probl&#232;me ne soit pas simple du tout.

    En effet la r&#233;ponse d&#233;pent non seulement de N et n comme on pouvait s'y attendre mais aussi de la "nature" de la chaine de longueur n que l'on cherche. Tu as bien vu &#231;a Philagui. Pour s'en convaincre il suffit de ne travailler qu'avec deux symboles A et B et N=3. La proba de voir apparaitre AA est alors 3/8 et celle de voir AB est 4/8.

    Tout &#231;a pour dire que si formule ferm&#233;e il existe alors elle fait apparaitre des trucs louches tenant compte de la nature de la chaine cherch&#233;e.

    Cependant dans le cas o&#249; n=1 ou N on trouve facilement la probabilit&#233; et avec un raisonnement faux on trouve la proba suivante :


    Il n'est pas dur de voir que cette proba est un minoration de la vraie proba et si N est assez grand elle doit donner un ordre de grandeur assez pr&#233;cis de la proba cherch&#233;e.
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  26. #21
    Nemat

    Re : Probabilités et ADN

    Citation Envoyé par GuYem
    Salut.

    j'ai l'impression que la proba que tu cherches est "simplement"

    4^N étant le nombre de cas possibles. 4^(N-n) le nombre de cas favorables quand la chaine donnée est placée à une certaine position donnée dans la chaine et N-n+1 étant le nombre de ces positions possibles.
    Je suis d'accord avec cette formule. A condition de compter dans CHAQUE chaîne de longueur L le nombre total d'exemplaires DISTINCTS de la chaîne recherchée (ce qui est d'ailleurs l'énoncé) : il faut surtout ne pas chercher à compter le nombre de chaînes ayant AU MOINS un exemplaire de cette liste

    J'ai recherché une démonstration faisant appel au dénombrement
    * je considère d'abord toutes les chaînes de longueur N : il y en a
    * chacune de ces chaînes contient L-L+1 sous-chaînes de longueur l
    * le fil directeur de la démonstration, c'est de montrer que toutes les combinaisons de longueur l sont équiprobables... Comme il existe chaînes différentes on arrive à la formule ci-dessus

  27. #22
    un_efrein

    Re : Probabilités et ADN

    Je voudrai pas vous mettre la pression, mais toute une promo attend vos réponses avant midi.

    Allez bon courage et rendez vous sur un autre forum pour les prochains TAI

  28. #23
    GuYem

    Re : Probabilités et ADN

    Citation Envoyé par un_efrein
    Je voudrai pas vous mettre la pression, mais toute une promo attend vos réponses avant midi.

    Allez bon courage et rendez vous sur un autre forum pour les prochains TAI

    Elle peut attendre, on s'en f**t de la promo.

    (enfin disons, je m'en f**s et je crois que pas mal de personne sur ce forum aprtagent cet avis, et excusez mes mauvais mots mais quand je vois des posts comme ça, j'enrage )
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  29. #24
    GuYem

    Re : Probabilités et ADN

    Citation Envoyé par Nemat
    Je suis d'accord avec cette formule. A condition de compter dans CHAQUE chaîne de longueur L le nombre total d'exemplaires DISTINCTS de la chaîne recherchée (ce qui est d'ailleurs l'énoncé) : il faut surtout ne pas chercher à compter le nombre de chaînes ayant AU MOINS un exemplaire de cette liste

    La question de Philagui est : "Quelle est la probabilité de trouver une séquence donnée constituée de n bases dans un ADN génomique constitué de N bases (avec n < N) ?"


    Il faut se mettre d'accord sur ce qu'on cherche messieurs.

    la question de Philagui est dure, la tienne l'est moins.
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  30. Publicité
  31. #25
    philagui74

    Re : Probabilités et ADN

    Bonjour,
    Ce sujet a été posé à la promo de l'EFREI dans le cadre d'un travail en groupes du cours de probabilités.

    Comme je ne trouvais pas la réponse à cette question malgré avoir pas mal cherché, je me suis décidé à poser la question sur ce forum. Evidemment, grâce à google, d'autres membres de la promo ont retrouvé le message, ce qui a conduit au message de un_efreien.

    Comme vous pouvez le voir, certains d'entre nous cherchent un raisonnement mathématique leur permettant d'arriver à la réponse d'un problème mathématique, d'autres cherchent une réponse toute faite qu'ils pourront parachuter dans leur rapport sans l'avoir comprise.

    Je suis vraiment désolé du message de un_efreien et m'en excuse, même si je n'en suis pas responsable.

    Cordialement.

    un_efreien> si tu veux me répondre, utilises mon adresse mail si tu l'as ou le forum de la promo, mais merci de ne pas polluer un topic qui concerne un problème mathématique et non la réponse toute faite à un exercice.

  32. #26
    GuYem

    Re : Probabilités et ADN

    Tu pourrais redonner l'&#233;nonc&#233; exact de l'exercice Philagui stp ?

    Il me semble que la question n'est pas celle que j'ai abord&#233;e car elle est me parait trop complexe.
    Bravo jolie Ln, tu as trouvé : l'armée de l'air c'est là où on peut te tenir par la main.

  33. #27
    philagui74

    Re : Probabilités et ADN

    Bonjour
    Guyem> L'énoncé exact est le suivant:
    Tout d'abord il y a un petit extrait nous expliquant rapidement la structure d'un ADN:
    Les ADN des êtres vivants sont constitués de plusieurs milliards de bases. L'ADN qui contient le code génétique, qualifié de génomique, est constitué d'un enroulement en hélice de deux ADN simples brins. Les séquences des deux ADN simple brins sont complémentaires, c'est à dire que pour une base A d'une séquence correspond une base T de l'autre et pour une base C d'une séquence correspond une base G de l'autre.
    Question: Quelle est la probabilité de trouver une séquence donnée constituée de n bases dans un ADN génomique constitué de N bases (n<N) ?

  34. #28
    matthias

    Re : Probabilités et ADN

    Ce qui rappelle, pour simplifier le problème, qu'il faut prendre en compte les deux brins

  35. #29
    Vinc

    Re : Probabilités et ADN

    Salut!
    Bon moi je suis biologiste et pas matheux mais ce style d'exo (en plus simple je pense) est souvent proposé aux étudiants en bio moléculaire, génétique and Co.... Et la plupart du temps, on oublie le 2ème brin alors Matthias fait bien de le rapeller : l'ADN n'est pas l'ARN....

    A+
    Vinc
    Primum non nocere.

  36. #30
    philagui74

    Re : Probabilités et ADN

    Nemat> Si j'ai bien compris ton message, selon toi la formule donnée au début est bonne ?
    En tous les cas, cette formule ne peut pas être bonne, car si l'on fait l'essai avec n=2 et N=2000, on obtient un nombre supérieur à 1, qui est tout sauf une probabilité...

    matthias, Vinc> lorsque j'avais posé le problème sur le forum, je pensais qu'étant donné que les deux brins étaient complémentaires, trouver la séquence dans un brin revenait à la trouver dans les deux, mais vous avez raison il faut prendre en compte les deux brins, ce qui complique encore plus le problème

Page 1 sur 2 1 DernièreDernière

Discussions similaires

  1. [Biologie Moléculaire] l'hybridation ADN/ADN "les différent méthodes???"
    Par Hamza2lh dans le forum Biologie
    Réponses: 3
    Dernier message: 07/11/2007, 09h18
  2. Probabilités
    Par hydroinfo dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 29/03/2007, 01h12
  3. Probabilités
    Par Alpha15 dans le forum Mathématiques du collège et du lycée
    Réponses: 6
    Dernier message: 21/12/2006, 10h18
  4. Probabilités
    Par Marsida86 dans le forum Mathématiques du supérieur
    Réponses: 9
    Dernier message: 17/02/2006, 14h29
  5. probabilités
    Par svp dans le forum Mathématiques du supérieur
    Réponses: 4
    Dernier message: 16/02/2006, 13h52