Calcul de probabilité
Répondre à la discussion
Affichage des résultats 1 à 6 sur 6

Calcul de probabilité



  1. #1
    invite3cad25d9

    Exclamation Calcul de probabilité


    ------

    Bonjour.

    Mes cours de probabilités remontent à longtemps et j'aurais besoin de faire le calcul de la probabilité suivante à propos des nucléotides (ADN) :

    J'ai 4 bases différentes : A, T, G et C

    Deux appariements sont possibles : A avec T, et C avec G

    En prenant un nucléotide particulier, la probabilité qu'il soit apparié avec un nucléotide quelconque est donc de 1/4

    Je m'intéresse à la probabilité que 6 nucléotides consécutifs soient appariés, cela me donne donc

    (1/4)⁶

    Je m'intéresse maintenant à cette probabilité sur une séquence de 755 bases.

    Donc selon moi, la probabilité que 6 nucléotides consécutifs soient appariés sur une séquence longue de 755 bases est de

    (1/4)⁶ x (755 - 5)

    Là où je coince, c'est que je veux m'intéresser non pas à cette dernière probabilité, mais à la probabilité (ou la chance) que 6 nucléotides consécutifs ont d'avoir un site de fixation (donc d'être tous appariés) sur une liste de 30 000 séquences, chacune ayant une longueur de 755 bases.

    Dois-je diviser ma dernière probabilité par 30 000 ? Pourquoi ?

    Merci beaucoup, j'aurais besoin de ce résultat dans la journée.

    M.L.

    -----

  2. #2
    invite3cad25d9

    Re : Calcul de probabilité

    En fait ma question est plus précisément la suivante :

    Combien ai-je de sites de fixations possibles pour un ensemble de 6 bases successives, le tout sur un ensemble de 30 000 séquences aléatoires, chacune d'elle étant constituée de 755 bases.

    Donc j'ai 6 bases successives (ex : ATTACG) et j'aimerais connaître le nombre de sites de fixation (ici ce serait donc le site TAATGC) présents parmi ces 30 000 séquences.

    Je ne cherche donc pas la probabilité d'avoir au moins un site. Je me suis mal exprimé dans mon premier post désolé. Je m'en suis rendu compte après.

  3. #3
    invite501e8040

    Re : Calcul de probabilité

    bonjour,
    je suppose que la séquence de 755 bases est formée aléatoirement avec une probabilité de 25% pour chaque base. (bien que selon wikipédia ce n’est pas le cas chez l’homme où il y a plus de A et T que de C et G).
    Bien entendu on ne peut calculer exactement le nombre de sites de fixation vu qu’on travaille avec des probabilités, par contre on pourrait calculer le nombre moyen de sites de fixation pour une séquence. Cette moyenne (ou espérance mathématique ) se calcule avec une somme pondérée : 1×p1 + 2×p2 + … + i×pi + … (où pi = proba d’avoir exactement i site(s) de fixation). Pour ensuite connaître le nombre moyen de fixations sur l’ensemble des 30000 séquences, il suffit de multiplier la moyenne pour une séquence par 30000.

    Le problème se situe au niveau du calcul de la probabilité d’avoir i sites de fixations pour une séquence.
    Effectivement, si on prend une séquence de 6 bases la proba d’avoir 1 site de fixation est bien de (1/4)⁶ . Par contre pour une séquence plus longue c’est plus compliqué et dépasse mes connaissances mathématiques.
    Avec une séquence de 755 bases, les probabilités ne sont plus indépendantes et on ne peut donc pas faire simplement (1/4)⁶ x (755 - 5). On peut s’en convaincre facilement avec par exemple ACCCCC, si on a 1 site de fixation (xxxxxTGGGGGxxxxxx) dans la séquence alors les 5 suites de 6 bases suivantes ne pourront pas être des sites de fixations car commençant par G au lieu de T (GGGGGx, GGGGxx, GGGxxx, GGxxxx, Gxxxxx).
    La probabilité dépend également des 6 bases choisies et a priori les probabilités pour la séquence ACCCCC n’est pas la même que pour la séquence CCCCCC. Avec cette dernière avoir 1 site de fixation ne condamne pas les 5 suites suivantes, par contre il n’y a toujours pas indépendance car pour une suite de 6 bases dans les 755 où il n’y a pas fixation les x suites de 6 bases ne pourront être des sites de fixation, le x dépendant du nombre des derniers G consécutifs de la premières suite.

  4. #4
    gg0
    Animateur Mathématiques

    Re : Calcul de probabilité

    Bonjour.

    Le résultat (1/4)⁶ x (755 - 5) est manifestement incorrect, car le même procédé avec 7555 bases donne une probabilité de 1,8, ce qui est beaucoup

    Le calcul de la probabilité qu'il y ait au moins une fois appariement de 6 nucléotides au long des 755 bases est compliqué, mais peut sans doute se faire (ce n'est pas ma tasse de thé). S'il s'agit de n'avoir qu'une seule fois cet appariement, c'est déjà bien plus compliqué.
    Une fois la probabilité p calculée pour une chaîne, il suffit d'appliquer la loi binomiale B(30000,p) pour passer au cas suivant. je n'ai pas bien compris s'il s'agit d'avoir au moins un appariement (probabilité 1-(1-p)30000) ou bien d'avoir 30000 appariement (probabilité p30000). La première est presque sûrement égale à 1, la deuxième à 0.

    Cordialement.

    NB : les probas se multiplient rarement par des constantes (sous peine de dépasser 1), donc se divisent rarement par des constantes.

  5. A voir en vidéo sur Futura
  6. #5
    inviteea028771

    Re : Calcul de probabilité

    Il me semble qu'avec l'ADN, le sens n'a pas d'importance, la séquence GCATTACGCATTACG aurait donc 4 sites ATTACG, deux en lisant de droite à gauche et deux en lisant de gauche à droite

    Maintenant, vu la probabilité très faible qu'un nucléotide soit le début du site (0.024 %), je pense qu'on peut considérer que les sites sont indépendants et utiliser sans trop d'erreurs une loi de Poisson de paramètre lambda = 750*0.00024 = 0.183

    J'en déduis donc qu'il y a environ 0.18 site par séquence de 755 nucléotides aléatoires si on la lit dans un seul sens (donc une séquence sur 5 seulement contient ce site).

    Une simulation par Monte carlo semble confirmer cet ordre de grandeur

  7. #6
    gg0
    Animateur Mathématiques

    Re : Calcul de probabilité

    Pour ma part,

    en utilisant une loi géométrique de paramètre (1/4)6, je trouve une probabilité p=0,16734 pour "au moins une fois" : L'idée est que ça arrive au moins une fois si :
    Soit ça marche en position 1
    Soit ça ne marche pas en position 1 et ça marche en position 2
    Soit ça ne marche pas en position 1 et 2 et ça marche en position 3
    Soit ça ne marche pas en position 1, 2 et 3 et ça marche en position 4
    ...

    Avec cette valeur, 1-(1-p)30000 = 1 (à 10-15 près) et p30000= 7,2.10-23293.

    Cordialement.

Discussions similaires

  1. calcul de probabilité
    Par invite29484d60 dans le forum Mathématiques du collège et du lycée
    Réponses: 6
    Dernier message: 02/03/2012, 15h22
  2. calcul de probabilité
    Par invite3d10fc67 dans le forum Mathématiques du collège et du lycée
    Réponses: 2
    Dernier message: 03/01/2012, 20h17
  3. Calcul de probabilité
    Par inviteca25f1ba dans le forum Mathématiques du supérieur
    Réponses: 3
    Dernier message: 06/07/2010, 23h05
  4. Calcul de probabilité
    Par invitec0738d84 dans le forum Mathématiques du collège et du lycée
    Réponses: 18
    Dernier message: 31/08/2009, 11h32
  5. Calcul de probabilité
    Par invitedcd45209 dans le forum Mathématiques du supérieur
    Réponses: 4
    Dernier message: 18/03/2006, 11h10