biostat calcule d'une p-value
Répondre à la discussion
Affichage des résultats 1 à 15 sur 15

biostat calcule d'une p-value



  1. #1
    invite4ff9937a

    biostat calcule d'une p-value


    ------

    Bonjour,
    Je suis biologiste et j’aimerai votre aide pour le calcule d’une p-Value.
    Je vous expose le problème.

    J’ai une liste de gènes (x) qui sont différemment exprimés entre deux populations de cellules A et B.
    Une autre liste de gènes (Y) eux aussi différemment exprimés entre deux populations de cellules C et D.
    Un certaine nombre de gènes (Z) sont commun entre ces deux listes et j’aimerai calculer un p-value qui me précise si cela est du au hasard ou non.

    Dans les faits : X représente 363 gènes
    Y représente 3125 gènes
    Et le nombre commun de gènes Z représente 85 gènes.

    Mes questions sont : Quels est le test statistique permettant de calculer une telle p-Value ?
    Comment fait-on ce test (demonstration)?
    Enfin est-ce le même test si nous avons 3 listes de gènes avec un certain recoupement ? Si non quel autre test doit-on utiliser?

    Si vous avez besoin de plus de données n’hésitez pas a me le préciser je vous les donnerai rapidement.
    Merci d’avance chers amis mathématicien pour votre aide
    Cordialement

    -----

  2. #2
    invite179e6258

    Re : biostat calcule d'une p-value

    il manque plein de choses pour qu'on puisse te répondre.

    et au moins :

    - comment ces gènes ont-ils été choisis?

    - que vient faire l'expression différentielle entre les pops de cellules dans cette affaire?

  3. #3
    invite4ff9937a

    Re : biostat calcule d'une p-value

    Nous avons fait un "transcriptome" sur différentes populations de cellules. Cette technique permet de détecter l'ensemble des gènes exprimés et leur niveau d'expression par une population de cellule à un instant "t" et dans une condition particulière. Toute la question étant de déterminer quels sont les gènes qui sont différemment exprimés entre les différentes populations étudiées?

    Donc en comparant les résultats obtenues avec les différentes populations on est capable de sortir une liste de gènes différemment expriméss entre deux populations. Par exemple
    1)le gène AAA est exprimé par la population 1 et pas la 2
    2) le géne BBB est 3 fois plus exprimé par la population A comparé à la B.
    3)Certains gènes sont exprimés dans les deux populations MAIS à un niveau équivalent et d'autre pas exprimé du tout.

    Les gènes des fameuses listes dont je parle correspondent aux condition 1 et 2 cité précédemment. Ce sont des gènes dont les niveaux d'expressions sont significativement différent entre deux populations. Les gènes répondant aux critères 3 ne nous intéresse pas.
    Voilà comment les gènes sont "choisis" ou en tout cas déterminés.

    Maintenant savoir si entre deux listes de gènes il y'en a en commun et si cela est significatif permet de conclure que différentes populations de cellules partagent des voies biologiques communes (dans mon cas je cherche a démontrer que c'est la voie biologique appelé "NOTCH" qui est commune)

    J’espère avoir était plus clair.

    Peux tu me dire ce qu'il manque pour pouvoir calculer ce que je demande?

  4. #4
    invite179e6258

    Re : biostat calcule d'une p-value

    mais quelle est l'hypothèse que tu veux tester?

  5. A voir en vidéo sur Futura
  6. #5
    invite4ff9937a

    Re : biostat calcule d'une p-value

    je voudrais pouvoir calculer une p-value qui m'indique que le fait de retrouver 85 gènes qui appartiennent tous à la même voie biologique (ici NOTCH) entre les deux listes de gènes X et Y n'est pas du au hasard. cf mon 1er post.

    Soit avec une erreur à 5% ou 1% sa c'est pas très grave c'est juste un chiffre qui change dans la formule si je crois.

    Le truc c'est quel test utiliser et comment ? C'est tout l'ar du statisticien de trouver le bon test à la question posé et je ne suis malheureusement pas statisticien...

  7. #6
    invite179e6258

    Re : biostat calcule d'une p-value

    tu as testé tous les gènes de cet organisme? et si oui, combien y en a-t-il?

  8. #7
    invite4ff9937a

    Re : biostat calcule d'une p-value

    Oui c'est chez l'humain, donc il y'a 20 000 gènes.

  9. #8
    invite179e6258

    Re : biostat calcule d'une p-value

    tu peux faire une chose qui est une approximation:
    1) tu supposes que les gènes qui sont classés comme s'exprimant différemment selon le type de cellule le sont sans erreur (tu négliges le fait que ce classement résulte d'un test statistique)
    2) tu supposes que sur l'ensemble du génome c'est le hasard qui fait qu'un gène est classé dans l'une des catégories qui t'intéresse. Ce sera ton hypothèse nulle.
    2) tu as 3125/20000 gènes classés A (on va dire) et 363/20000 classés B. Si les classements A et B étaient indépendants, tu devrais avoir une proportion de 3125/20000 * 363/20000 gènes classés à la fois A et B. Tu fais le calcul ça donne environ 57 gènes (à refaire avec la vraie valeur à la place de 20000). La question est si 85 est significativement différent de 57. On le voit avec le test du Chi2.

    mais on a négligé le fait que quand tu dis que 3125 gènes s'expriment significativement de façon différente entre les deux types de cellules, il y a une partie de ces gènes qui ont été classés ainsi par erreur (erreurs de type 1). As-tu fais la correction de Bonferroni?

  10. #9
    invite4ff9937a

    Re : biostat calcule d'une p-value

    les choses sérieuses commence

    En tout cas merci de t'intéresser à mon problème.

    Pourquoi dis-tu dans ton petit 1 que ce classement résulte d'un test statistique ?

    Pour le reste tu-es très clair (merci) cependant 1: Comment on fait le Chi2?

    2) Dans mon tableau excel j'ai une colonne pour chaque gène appelé Bonferroni, le bio-informaticien m'a dis de ne pas y faire attention (cependant il es plus bio que informaticien ou mathématicien) cependant quasiment tout les gènes ont le chiffre 1 sauf une dizaine de gènes. Sait-tu ce que sa veux dire? Dois-je les exclure?

    Je reviens sur ta phrase "tu supposes que les gènes qui sont classés comme s'exprimant différemment selon le type de cellule le sont sans erreur (tu négliges le fait que ce classement résulte d'un test statistique)" Il faut que tu sachesz que pour chaque gène sélectionné une p-value a été calculé. N'apparaissent dans les listes de gènes différenciant QUE les gènes dont la p-value est égale ou inférieur à 0.05. Ce qui veux dire si je comprend bien que le gène sélectionné à 5% de chance de l'avoir été par erreur. D'où ta phrase ?

    Peut-être qu'avec cette info tu pourras mieux appréhender la parti ou tu parle d'erreur de type 1

  11. #10
    invite179e6258

    Re : biostat calcule d'une p-value

    quand on fait un test statistique au seuil de 5%, il y a une probabilité égale à 5% pour que l'on conclue qu'il y a une différence significative alors qu'en réalité il n'y en a pas. C'est ce qu'on appelle le risque de première espèce. Si tu testes 20000 gènes, tu t'attends par le simple fait du hasard à trouver 1000 tests significatifs (même s'il n'y a de différence d'expression pour aucun gène). Pour l'expérience où tu en trouves 363 , tu es en-dessous des 5% et c'est pourquoi je pensais que tu avais fait une correction de Bonferroni.

  12. #11
    invite4ff9937a

    Re : biostat calcule d'une p-value

    Ok merci pour les explications.

    Donc sachant tout cela est ce que le calcule que tu m'as indiqué précédement et toujours valable?

    Je viens de regarder comment faire le test du Chi2 et evidemment je n'ai rien compris...

  13. #12
    invite2313209787891133
    Invité

    Re : biostat calcule d'une p-value

    Bonjour descmarc

    Comme toi j'avais des difficultés avec les stats, jusqu'à ce que je trouve ce court très bien réalisé : http://www.info.univ-angers.fr/~gh/t...tatophobes.pdf

    Si tu prend le temps de le lire tu ne devrais plus avoir de difficultés à comprendre.

  14. #13
    invite4ff9937a

    Re : biostat calcule d'une p-value

    Merci Dudulle j'ai commencé à lire c'est vrai que c'est très bien fait.

    Concernant mon problème personne (mise à part toothpick-charlie) n'a un test statistique à me proposer qui répondrait au problème?

    merci

  15. #14
    gg0
    Animateur Mathématiques

    Re : biostat calcule d'une p-value

    Bonjour.

    Je viens de regarder assez rapidement ce que tu veux faire. Je ne vois pas de test simple adapté pour l'instant, car il manque une donnée fondamentale : quel est le modèle sous-jacent. Par exemple, entre 2 listes "courantes", si on a un nombre de gènes communs qui suit une loi de Poisson de moyenne 7 (exemple purement fictif pour illustrer mon propos), alors un intervalle de confiance à 95% sur le nombre de gènes communs est [0;12], donc comme 85 est en dehors de l'intervalle, le test est significatif au risque 5%, les gènes communs ne sont pas là "par hasard".

    Mais il faut bien se rendre compte que la question de la modélisation préalable n'est pas fondamentalement une question statistique. C'est essentiellement une question biologique.

    Cordialement.

  16. #15
    invite179e6258

    Re : biostat calcule d'une p-value

    en principe sous l'hypothèse nulle les "P-values" (probas au dépassement) suivent la loi uniforme sur [0,1] et donc le nombre de gènes pour lesquels le test est positif suit la loi binomiale de paramètres 20000 et 0.05. Cela c'est si les 20000 hypothèses nulles (pas de différence d'expression) sont vraies. Le problème c'est que si on étudie ce problème c'est que vraisemblablement certains gènes doivent présenter une différence d'expression, et donc on ne sait pas la loi du nombre de tests positifs. C'est pourquoi je proposais de faire abstraction de cette question, de supposer que les gènes classés positifs sont tirés au hasard parmi les 20000 et de tester l'indépendance des deux classements. Mais c'est un pis-aller.

Discussions similaires

  1. calcule d'une limite
    Par invite2119d7f1 dans le forum Mathématiques du supérieur
    Réponses: 5
    Dernier message: 08/12/2011, 19h23
  2. calcule d'une surface
    Par inviteea75116c dans le forum Mathématiques du collège et du lycée
    Réponses: 15
    Dernier message: 19/05/2011, 10h08
  3. Calcule d'une masse
    Par invite99269d86 dans le forum Chimie
    Réponses: 3
    Dernier message: 17/10/2009, 13h54
  4. Calcule d'une masse.
    Par invite621a8f3c dans le forum Chimie
    Réponses: 6
    Dernier message: 30/11/2008, 22h43
  5. Calcule d'une gravité
    Par invite9d979fbf dans le forum Physique
    Réponses: 7
    Dernier message: 09/07/2008, 17h03