Probabilités et ADN - Page 2
Répondre à la discussion
Page 2 sur 2 PremièrePremière 2
Affichage des résultats 31 à 42 sur 42

Probabilités et ADN



  1. #31
    invitec7204958

    Re : Probabilités et ADN


    ------

    En attendant la définition précise du problème voici quelques pistes de réflexion, dans le cas simple où L=6 et l=3. Recherchons tous les cas où on trouve une chaîne de 3 bases différentes : CAG par exemple
    * CAGCAG : une chaîne contenant 2 fois la chaîne recherchée
    * xyzCAG où xyz représentent tous les triplets de 3 bases SAUF CAG : il y en a 4x4x4 - 1 = 63, et quel que soient les xyz la chaîne CAG n'est présente qu'une fois
    * le cas symétrique CAGxyz : 63 également
    * les cas xCAGyz et xyCAGz : cette fois les x y et z prennent chacun les 4 cas possibles : 64 cas, et toujours une chaîne CAG dans chaciun de ces cas.
    Donc en tout 254 chaînes contenant 1 fois la sous-chaîne et 1 chaîne la contenant 2 fois. Cela donne bien 256 fois la chaîne attendue.

    Sur des chaînes comme XXY le calcul est identique, par contre là où c'est beaucoup plus compliqué c'est pour des sous-chaînes comme ACA (9 chaînes contenant deux fois la séquence et 238 ne la contenant qu'un fois, soit 247 chaînes répondant à la question mais ... 256 exemplaires) ou AAA

    PS Pour établir la bijection dont je parle dans mon précédent post, il s'agit quand même de réfléchir un peu : comment associer par exemple, à chacune des 255 chaînes contenant 1 ou 2 ACG, une chaîne contenant ACA, alors que celles ci ne sont que 247 ?

    -----

  2. #32
    inviteb389912d

    Re : Probabilités et ADN

    Bonsoir,
    Le sujet complet est ici, scanné. Le problème qui nous occupe est sur la page 2.

    Nemat> Tout à fait d'accord, le problème est là: comment dénombrer et donc soustraire les cas que l'on compte plusieurs fois...
    Juste une petite chose, il me semble que dans l'exemple de CAG, il y a non pas 256 cas favorables, mais 255. En effet, si l'on regarde toutes les possibilités:
    CAGxxx : 64 cas favorables: CAGCAG est compté une fois
    xCAGxx: 64 cas favorables
    xxCAGx: 64 cas favorables
    xxxCAG: 64 - 1 cas favorables, car CAGCAG a déjà été compté.

    Cordialement.

  3. #33
    invitec7204958

    Re : Probabilités et ADN

    Philagui > Tout tourne autour de la manière dont on comprend l'énoncé. La formule que j'ai donné plus haut (dans mon avant dernier post) correspond au cas où on compte le nombre d'occurrences de la sous-chaîne, autrement ça correspond au dénombrement des cas favorables

    Pour n=2 et L=2000. Il y a chaînes possibles et 1999 doublons sur chacune d'elles. Le nombre d'occurences de la séquence AB représente 1/16 de ce nombre, de même que le nombre de séquences AA (motif les 16 configurations AA, AC, AG, AT, CA... TT sont en nombres égaux)

    Si on veut passer du dénombrement des séquences au dénombrement des "chaînes de longueur L ayant au moins une séquence" le problème se complique car il n'y a pas symétrie des distributions des séquences AB at AA
    Il existe une chaine de longueur 2000 contenant 1999 fois la séquence AA (celle ne comportant que des A) alors que ce nombre ne peut dépasser 1000 pour AB

  4. #34
    invitec7204958

    Re : Probabilités et ADN

    Citation Envoyé par philagui74
    Bonsoir,
    Le sujet complet est ici, scanné. Le problème qui nous occupe est sur la page 2.

    Nemat> Tout à fait d'accord, le problème est là: comment dénombrer et donc soustraire les cas que l'on compte plusieurs fois...
    Juste une petite chose, il me semble que dans l'exemple de CAG, il y a non pas 256 cas favorables, mais 255. En effet, si l'on regarde toutes les possibilités:
    CAGxxx : 64 cas favorables: CAGCAG est compté une fois
    xCAGxx: 64 cas favorables
    xxCAGx: 64 cas favorables
    xxxCAG: 64 - 1 cas favorables, car CAGCAG a déjà été compté.

    Cordialement.
    On dit la même chose : 254 chaines comprenant 1 fois CAG et 1 chaîne contenant deux fois CAG, cela fait les 255 cas favorables.
    Pour CAC 238 chaînes contenant 1 fois CAG et 9 chaînes la contenant deux fois, soit 247 cas favorables
    Bonne chance !

  5. #35
    inviteb389912d

    Re : Probabilités et ADN

    Citation Envoyé par Nemat
    Pour n=2 et L=2000. Il y a chaînes possibles et 1999 doublons sur chacune d'elles. Le nombre d'occurences de la séquence AB représente 1/16 de ce nombre, de même que le nombre de séquences AA (motif les 16 configurations AA, AC, AG, AT, CA... TT sont en nombres égaux)
    Désolé, mais je n'ai pas tout compris sur cette partie. Pourquoi y a t-il 1999 doublons sur chaque chaine possible ?

    Sinon, en effet, pour les 255 cas favorables et 247 cas favorables dans l'autre cas, on dit la même chose, c'est juste que dans un des posts il y avait:
    Citation Envoyé par Nemat
    Donc en tout 254 chaînes contenant 1 fois la sous-chaîne et 1 chaîne la contenant 2 fois. Cela donne bien 256 fois la chaîne attendue.
    Ici selon moi ce n'est pas 256 mais bien 255.

    Citation Envoyé par Nemat
    Bonne chance !
    Merci je vais en avoir besoin

  6. #36
    invitec7204958

    Re : Probabilités et ADN

    Citation Envoyé par philagui74
    Le sujet complet est ici, scanné. Le problème qui nous occupe est sur la page 2.
    Vu le contexte il me parait à présent évident que la piste du dénombrement est à consommer avec modération. On est ici en plein dans le domaine où il faut passer aux probas. Un problème où la probabilité p est faible, où N tend vers l'infini et où Np reste fini, ça renvoie aux problèmes des files d'attente et à la loi de Poisson (reste à formaliser le problème de départ pour y arriver)

  7. #37
    inviteb389912d

    Re : Probabilités et ADN

    Je precise que dans le cours, on a en effet bien vu la loi de Poisson, par contre les files d'attente en probabilites, jamais entendu parler...
    Par contre je ne vois pas en quoi le probleme est relié à la loi de Poisson ??

  8. #38
    invitec7204958

    Re : Probabilités et ADN

    Je n'ai pas réussi à corriger ce message hier, je le reprends

    1) En général, lorsqu'on fait N tirages dans une loi de probabilité, et que N tend vers l'infini, la moyenne va suivre une loi de Gauss (c'est la "loi des grands nombres"). Il y a cependant des exceptions, c'est le tirage de Bernouilli, quand l'événement élémentaire a une probabilité faible (p petit), où le nombre de tirages N est grand, et Np reste fini. Dans ce cas la loi limite est une suite de Poisson. C'est à cette loi qu'il faut essayer de se raccrocher pour résoudre le dénombrement recherché

    2) Si j'ai cité les problèmes de files d'attente, c'est parce que c'est un problème classique où on utilise la propriété ci-dessus

  9. #39
    invitec7204958

    Re : Probabilités et ADN

    Bonsoir,

    Je ne sais pas si la présentation ci-dessous convient aux biologistes, mais voici la façon dont je comprends le problème évoqué par Philagui74.
    L'objectif est d'utiliser des chaînes de nucléotides, de longueur l (l'ADN-sonde), à partir desquels on espère construire des "pièges" permettant de sélectionner de façon discriminante la chaîne d'ADN d'une molécule particulière (ADN-cible), de longueur L, d'entre d'autres chaînes de même longueur.

    La difficulté du problème, c'est que la première étape - calculer la probabilité que l'ADN-sonde se fixe "par hasard" sur une molécule d'ADN-cible d'une autre espèce que celle désirée - conduit à des calculs inextricables si on se limite aux outils classiques du "dénombrement" : inutile de détailler, Philagui74 en a précédemment parlé. Pour moi, la meilleure solution, c'est de se remémorer la totalité du problème posé.
    Compte tenu des données de l'énoncé (la chaîne d'ADN cible comprend 2 milliards de bases), il est évident d'une part que le nombre de positions où la séquence-sonde peut potentiellement se greffer sera énorme - ce qui incite à rechercher du côté des lois des grands nombres, et d'autre part que l devra prendre des valeurs de beaucoup supérieures à 2 ou 3.
    La probabilité de rencontrer dans une position précise la chaîne-cible, , sera très faible, et ceci incite à chercher à introduire dans l'analyse un processus de Bernouilli. Par la pensée on associe donc à l'ADN-cible un certain nombre N de morceaux de longueur l ; chaque morceau aura une probabilité de de coïncider avec la valeur sonde, et on calcule la probabilité qu'aucun des N morceaux ne contient cette séquence

    Le choix de p est relativement simple : il faut seulement préciser si les 2 brins d'ADN interviennent dans le test, et confirmer que les brins sont "orientés". Mais c'est plus difficile de choisir N. Si on découpe l'ADN en N = L / l chaînes, on ne comptera pas les cas où la séquence de l'ADN-sonde se retrouve à cheval sur 2 de ces morceaux. Si on définit les chaînes de façon glissante (soit N = L - l + 1) l'hypothèse d'indépendance des tirages n'est pas vérifiée. La seule conclusion possible à ce stade, c'est que ces deux cas sont les bornes entre lesquelles la valeur cherchée va se placer.

    Seule un détour par l'énoncé permet de lever l'ambigüité. En fait, le but de tout ce calcul, c'est, dans le vocabulaire de la théorie des tests, estimer en fonction de l la valeur de l'erreur "de deuxième espèce" : i.e. le risque de pièger l'ADN d'une autre espèce que celle visée. Ceci plaide pour retenir plutôt la deuxième solution (N = L - l + 1) qui correspond mieux à l'utilisation du nombre trouvé

    Quelles conclusions tirer de tout cela ? Essentiellement qu'il y a une grande différence entre les exercices construits pour illustrer un cours, et ceux rencontrés dans les sciences utilisant des maths appliquées. Dans le premier cas les sous-questions ont des réponses claires, et celles-ci s'enchaînent de façon logique ; alors qu'ici il faut accepter des solutions imparfaites à chaque sous-problème, ou plus précisément vérifier si les approximations sont admissibles au regard de l'objectif ultime

    PS J'ai une autre interrogation, adressée aux biologistes. Implicitement le calcul repose sur le fait qu'on suppose l'ADN des différentes espèces (celle qu'on veut isoler et celles susceptibles d'être présentes) assimilable au résultat d'un tirage aléatoire. Or je pensais au contraire qu'il y avait des fortes corrélations - et donc de longues séquences identiques - entre l'ADN des différentes espèces. Si c'est le cas la modélisation me paraît bien fragile...

    Bonsoir à tous

  10. #40
    inviteb389912d

    Re : Probabilités et ADN

    Bonsoir,
    Je dois avouer que votre raisonnement est assez... déstabilisant. Si je l'ai bien compris dans les grandes lignes, vous dites cela:
    -il n'y a aucun moyen de proposer une solution "parfaite" (prenant en compte tous les cas possibles)
    -donc on se dirige vers la solution "la moins mauvaise", celle qui a le plus de chances de donner des résultats dans le cas général.

    Ensuite, toujours si j'ai bien compris, vous utilisez une loi de Bernouilli car vous considérez les deux issues suivantes:
    l'ADN sonde s'associe à l'ADN cible: succès
    l'ADN sonde ne s'associe pas à l'ADN cible: échec

    Il faut donc déterminer p (la probabilité d'avoir un succès) et N: le nombre de "tirages", d'essais à effectuer.

    Vous dites ensuite que pour obtenir N, il faut considérer l'ADN cible comme une suite de morceaux de longueur l, et qu'il y a deux possibilités de "découper" l'ADN cible:
    -le découper en N=L/l "morceaux"
    -le découper en N= L - l + 1 "morceaux"
    Je n'ai pas tout compris en ce qui concerne ces deux découpages (mais il faut avouer qu'il est tard )

    Ensuite, pour la détermination de p, en effet je suis d'accord il me parait faisable de le déterminer en cherchant un peu...

    Dites moi si j'ai reformulé correctement votre raisonnement (ce qui voudrait dire que je l'ai à peu près compris, j'espère).

    En ce qui concerne votre question, si je me souviens bien de mes cours de biologie de Terminale, en effet vous avez raison il y a de longues séquences identiques entre l'ADN d'espèces proches (par exemple, toujours si mes souvenirs sont bons, il n'y a que 1% de différence entre l'ADN de l'homme et celui du chimpanzé). Aux biologistes de confirmer.

    Cordialement, et en vous remerciant...

  11. #41
    invitec7204958

    Re : Probabilités et ADN

    Bonjour,

    En ce qui concerne le raisonnement que je propose, c'est tout à fait cela.

    Pour ce qui concerne le côté "déstabilisant" de la méthode, cela tient à la façon de "classer" le problème : ou on le considère comme un problème de "mathématiques pures", ou comme un problème de "mathématiques appliquées". Vu la formulation c'est dans la 2ème catégorie que j'ai choisi de le classer

    Cordialement

  12. #42
    invitea0443c8c

    Re : Probabilités et ADN

    Salut!
    Citation Envoyé par Nemat
    PS J'ai une autre interrogation, adressée aux biologistes. Implicitement le calcul repose sur le fait qu'on suppose l'ADN des différentes espèces (celle qu'on veut isoler et celles susceptibles d'être présentes) assimilable au résultat d'un tirage aléatoire. Or je pensais au contraire qu'il y avait des fortes corrélations - et donc de longues séquences identiques - entre l'ADN des différentes espèces. Si c'est le cas la modélisation me paraît bien fragile...
    Oui c'est la cas.....au moins si on compare des génomes eucaryotes supérieurs. On a de grandes régions répétées entre différentes espèces mais ça dépend des organimes. Rien que pour la taille du génome on peut avoir de grosses différences :
    -génome E.coli = 4,7 Mpb
    -homme=3000 Mpb
    -amibe=670000 Mpb

    A+
    Vinc

Page 2 sur 2 PremièrePremière 2

Discussions similaires

  1. [Biologie Moléculaire] l'hybridation ADN/ADN "les différent méthodes???"
    Par invite709f3b9a dans le forum Biologie
    Réponses: 3
    Dernier message: 07/11/2007, 10h18
  2. Probabilités
    Par invite01227e94 dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 29/03/2007, 02h12
  3. Probabilités
    Par invite03fd15d3 dans le forum Mathématiques du collège et du lycée
    Réponses: 6
    Dernier message: 21/12/2006, 11h18
  4. Probabilités
    Par invitecec15c73 dans le forum Mathématiques du supérieur
    Réponses: 9
    Dernier message: 17/02/2006, 15h29
  5. probabilités
    Par invite5898d809 dans le forum Mathématiques du supérieur
    Réponses: 4
    Dernier message: 16/02/2006, 14h52