Répondre à la discussion
Affichage des résultats 1 à 7 sur 7

Analyse statistique de données des puces ADN




  1. #1
    Mybio

    Analyse statistique de données des puces ADN

    Bonjour


    Les maths et stats ne sont malheureusement pas parmi les matières que je préfère Je vais quand même devoir analyser des données issues des puces ADN. Mais je me retrouve un peu désarmé face à cette tache où je suis un peu " trop nul" en maths pour effectuer et interpréter une analyse statistique des microarrays !

    Je m'adresse donc à vous, les connaisseurs, pour m'aider un peu sur comment on effectuer cette analyse des données d'expressions et quel type déjà d'analyse qui seraient les plus pertinentes ?!
    Est-ce que on doit le faire dans Excel ou un programme spécial (développé pour cet effet) ?

    Je vous en serais très reconnaissant.
    Merci et bonne journée à tous

    -----


  2. Publicité
  3. #2
    babou1278

    Re : Analyse statistic de données des puces ADN

    Bonjour
    si tu veux qu'on t'aide il faudrait avoir plus de details: quelles sont tes données exactement ? Combien d'echantillons d'ADN, qui viennent de combien de tissus? qu'est ce que tu veux voir? quel est le but de tes tests statistiques?
    A quel niveau d'etudes est-tu? as-tu deja utilise des logiciels de stat?

  4. #3
    Mybio

    Re : Analyse statistic de données des puces ADN

    Citation Envoyé par babou1278 Voir le message
    Bonjour
    si tu veux qu'on t'aide il faudrait avoir plus de details: quelles sont tes données exactement ? Combien d'echantillons d'ADN, qui viennent de combien de tissus? qu'est ce que tu veux voir? quel est le but de tes tests statistiques?
    A quel niveau d'etudes est-tu? as-tu deja utilise des logiciels de stat?
    Bonjour,

    Merci pour ta réponse.
    En fait, on est en train de faire une études d'expressions de gènes comparative (comparer des valeurs d'expression de 500 gènes entre plusieurs conditions et à plusieurs temps). Le but c'est de voir les profiles d'expressions des gènes dans plusieurs conditions (2 conditions d'abord puis 4 après). Les données sont des valeurs numériques (chiffres!) issues de l'hybridation sur les lames des puce ADN et scanné par un laser.
    On cherche à voir la signifiance des changements d'expression entre le témoin et le traitement et au cours de différentes temps de traitement. L'analyse statistique permet alors d'évaluer si les inductions d'expressions des gènes (les changements) sont réelles et significatifs ou pas.

    Si je résume autrement, ça donne à peu près le schéma suivant:

    - J'ai des valeurs (numériques) d'expressions d'environ 500 gènes,
    - dans 2 conditions de traitements (contrôle et traitement);
    - Pendant une cinétique de 4 temps de 5h, 24h, 48h, 72h

    J'aimerais savoir si les valeurs obtenues dans le traitement sont significatives par rapport au témoin et au cours de la cinétique appliquée.

    Exemple:

    -Le Gène X - à une valeur de 12345 - dans la condition controle - pour la cinétique de 5h.
    -Le Gène X - à une valeur de 6789 - dans la condition traitement - pour la cinétique de 5h.
    -Le Gène X1- à une valeur de 2345 - dans la condition controle - pour la cinétique de 24h.
    -Le Gène X1- à une valeur de 3456 - dans la condition traitement - pour la cinétique de 24h.

    Ainsi de suite pour les 500 gènes et dans toutes 2 conditions et les 4 temps.

    Maintenant, comment savoir si les valeurs (les valeurs d'expressions obtenue suite aux les traitements dans les différents points de la cinétique) sont significatives ou pas ? Autrement dit, est-ce que le variances sont significatives, réelles ou pas ?

    Voilà, j'espère que ça serait un peu plus claire.
    En vous remerciant par avance et vous souhaitant une très bonne journée.


  5. #4
    DrD2

    Re : Analyse statistic de données des puces ADN

    Cher(e) Mybio

    Citation Envoyé par Mybio Voir le message

    (...) on est en train de faire une études d'expressions de gènes comparative (comparer des valeurs d'expression de 500 gènes entre plusieurs conditions et à plusieurs temps).

    (...)Les données sont des valeurs numériques (chiffres!) issues de l'hybridation sur les lames des puce ADN et scanné par un laser.

    (...)

    -Le Gène X - à une valeur de 12345 - dans la condition controle - pour la cinétique de 5h.
    -Le Gène X - à une valeur de 6789 - dans la condition traitement - pour la cinétique de 5h.
    -Le Gène X1- à une valeur de 2345 - dans la condition controle - pour la cinétique de 24h.
    -Le Gène X1- à une valeur de 3456 - dans la condition traitement - pour la cinétique de 24h.

    (...)

    Maintenant, comment savoir si les valeurs (les valeurs d'expressions obtenue suite aux les traitements dans les différents points de la cinétique) sont significatives ou pas ?

    Autrement dit, est-ce que le variances sont significatives, réelles ou pas ?
    1) qui est "on" ? Je veux dire par là (tu n'as pas répondu sur ton niveau d'études) qu'il serait très surprenant qu'on t'ait offert des puces à ADN pour Noël. Tu es évidemment au sein d'une équipe de recherche (en stage ?) et donc ton (tes) superviseur(s) savent évidemment comment on analyse ce type de données. Leur as tu posé la question ?

    2) pour faire des statistiques il faut des répétitions. Je ne parle pas du fait que tu aies analysé 500 gènes mais le fait que pour chaque gène (et chaque durée de traitement) il faut plusieurs valeurs. Sinon, cela revient à poser la question "cette vache est elle significativement plus lourde que cette autre vache ?"

    Si tu tapes "microarray statistical analysis" dans ton navigateur préféré, tu vas constater qu'il y a effectivement des méthodes spécialisées (que je ne maîtrise pas hélas) pour analyser ce type de données très particulières. Tu devrais d'ailleurs t'en être aperçu puisque tu as, je suppose, consulté quelques articles scientifiques en faisant la biblio pour ton sujet (de stage ?)

    Cordialement,

    DrD2

  6. #5
    Mybio

    Re : Analyse statistic de données des puces ADN

    Citation Envoyé par DrD2 Voir le message
    Cher(e) Mybio



    1) qui est "on" ? Je veux dire par là (tu n'as pas répondu sur ton niveau d'études) qu'il serait très surprenant qu'on t'ait offert des puces à ADN pour Noël. Tu es évidemment au sein d'une équipe de recherche (en stage ?) et donc ton (tes) superviseur(s) savent évidemment comment on analyse ce type de données. Leur as tu posé la question ?

    2) pour faire des statistiques il faut des répétitions. Je ne parle pas du fait que tu aies analysé 500 gènes mais le fait que pour chaque gène (et chaque durée de traitement) il faut plusieurs valeurs. Sinon, cela revient à poser la question "cette vache est elle significativement plus lourde que cette autre vache ?"

    Si tu tapes "microarray statistical analysis" dans ton navigateur préféré, tu vas constater qu'il y a effectivement des méthodes spécialisées (que je ne maîtrise pas hélas) pour analyser ce type de données très particulières. Tu devrais d'ailleurs t'en être aperçu puisque tu as, je suppose, consulté quelques articles scientifiques en faisant la biblio pour ton sujet (de stage ?)

    Cordialement,

    DrD2
    Merci pour ta réponse. Je mérite, à ton avis, d'être réprimandé pour ma question ?
    Je suis en effet en stage de fin d'étude dans une équipe de recherche, et j'aimerais apprendre comment analyser statistiquement les données en posant des questions à droite et à gauche pour avoir des informations les plus largement possibles pour mieux comprendre. Je participe à l'étude que j'ai décrite plus haut et j'aimerais bien maîtriser et comprendre ce qui se fait dans cette technique.
    Je pose évidement des questions aux gens qui m'encadrent mais ce n'est pas toujours évident ni facile de comprendre des choses qu'on a jamais faite. Il faut lire, poser des question, s'informer ....etc.
    Je ne vois donc pas en quoi c'est "dérangeant" de poser une question pareille quelque soit le niveau de mon stage ?

    J'ai bien cherché sur internet sur l'analyse statistique et j'ai lu quelque articles là-dessus, mais je n'ai pas trop ni bien compris les méthodes utilisées! Je peux alors poser des question, non ? Merci à internet qui nous a donné la possibilité de poser des questions, d'échanger et d'apprendre plus vite qu'il a quelque années.

    Bon, pour revenir au sujet, comparer deux vaches entre elles est plus significatif si l'une est bien plus lourde que l'autre mais pour ma question, , en effet, tu as raison, il y a 3 répétitions pour chaque traitement.
    (C'est dommage qu'on puisse pas modifier son post pour rajouter des éléments manquants et avoir une meilleure vue d'ensemble).

    Voilà, je crois que j'ai tout dit. Tu peux toujours me reprocher si tu veux, je le prendrai de bon cœur.

    Merci de m'avoir répondu
    Bonne journée

  7. A voir en vidéo sur Futura
  8. #6
    DrD2

    Re : Analyse statistic de données des puces ADN

    Citation Envoyé par Mybio Voir le message
    Merci pour ta réponse. Je mérite, à ton avis, d'être réprimandé pour ma question ?
    Bien sûr que non ! Je suis simplement très étonné (ayant déjà encadré moult stagiaires) que tu sois obligé d'appeller au secours sur le web alors que tu es entouré de chercheurs spécialisés dans le domaine en question. C'est ça que je ne comprends pas.

    Citation Envoyé par Mybio Voir le message
    Je suis en effet en stage de fin d'étude dans une équipe de recherche, (...)
    Je pose évidement des questions aux gens qui m'encadrent mais ce n'est pas toujours évident ni facile de comprendre des choses qu'on a jamais faite. Il faut lire, poser des question, s'informer ....etc.
    Ce qui veut dire en clair que tu n'as rien compris à leurs explications ? Si oui il serait alors souhaitable que tu en dise plus sur ce qu'on t'a dit de faire et ce que tu n'as pas compris là dedans (et que, pour une raison qui m'échappe, tu préfères demander sur le web plutôt que retourner voir tes encadrants spécialistes du sujet pour leur demander des éclaircissements)

    Citation Envoyé par Mybio Voir le message
    Je ne vois donc pas en quoi c'est "dérangeant" de poser une question pareille quelque soit le niveau de mon stage ?
    Ca ne me dérange pas, ça m'étonne. Quant au niveau du stage je n'ai toujours pas compris de quel niveau il s'agit. Pourrais tu révéler ta formation sans trahir de secret important ? Es tu en fin de L3 ? De M1 ? De M2 Recherche ? Autre chose ?

    Citation Envoyé par Mybio Voir le message
    J'ai bien cherché sur internet sur l'analyse statistique et j'ai lu quelque articles là-dessus, mais je n'ai pas trop ni bien compris les méthodes utilisées! Je peux alors poser des question, non ? Merci à internet qui nous a donné la possibilité de poser des questions, d'échanger et d'apprendre plus vite qu'il a quelque années.
    Tu as bien entendu le droit de poser des questions , mais même les spécialistes des puces à ADN (ce que je ne suis pas) ne pourront t'aider efficacement que si la question est suffisamment précise. Par exemple "pour analyser mes résultats on m'a conseillé le test de Smith et Wesson or je ne comprends pas le fait que bla bla bla" a plus de chances de t'apporter une réponse ciblée et efficace que "Comment analyser des données de puce à ADN ?", qui risque simplement de t'apporter la réponse "Tu devrais utiliser le test de Smith et Sesson" .

    Citation Envoyé par Mybio Voir le message
    Bon, pour revenir au sujet, comparer deux vaches entre elles est plus significatif si l'une est bien plus lourde que l'autre mais pour ma question, , en effet, tu as raison, il y a 3 répétitions pour chaque traitement.
    (...)
    Ben non, justement, comparer deux vaches n'a aucun sens, car deux vaches sont forcément différentes l'une de l'autre, et on ne peut rien affirmer quant à la "significativité" d'un écart entre deux individus.

    Mais nous venons de faire un grand pas en avant; tu as des répétitions, ce qui indique (bonne nouvelle) que tes résultats sont analysables. Si tu étais dans le cas simple où tu t'intéresse au niveau d'expression d'un gène et que les niveaux d'expression étaient considérés comme gaussiens, ce serait facile, tu ferais une bonne vieille anova a deux facteurs croisés (le facteur traitement et le facteur durée). Le hic est que je parie ma chemise que les niveaux d'expression n'ont rien de Gaussien et manque de bol les tests paramétriques du style Wilcoxon sont aveugles avec des effectifs N=3.

    J'en reviens donc à ce que je disais: il te faut un spécialiste de ce type d'immense jeux de données, et -- je me répète encore -- tu en as plusieurs sous la main en ce moment donc le plus efficace est de les solliciter, après tout, tu bosses pour eux gratuitement depuis des semaines, ils doivent t'aider à analyser tes données !

    Désolé de ne pas pouvoir t'aider davantage, et bon courage.

    Cordialement,

    DrD2

  9. #7
    BioStatJuju

    Puces ADN Nylon Marquage Radioactif

    Bonjour,

    Je viens chercher de l'aide...

    Pour faire bref, je suis actuellement stagiaire dans une boite de stat, et j'ai comme sujet de recherche : "l'analyse Stat de macroarray" (globalement).

    J'ai l'habitude de travailler sous un environnement SAS, mais je me suis mise sur R car il semble que de nombreux package y aient été développés.

    Je travaille sur des données issues de puces ADN nylon (marquage radioactif). J'ai 7 puces dont 4 "controle" et 3 marquées positivement à la maladie d'Epstein Barr (EBV). Et je cherche quels sont les genes différentiellement exprimés entre ces deux conditions.

    Donc sur mes puces, j'ai trois composantes :
    ¤ un certain nombre de gène
    ¤ des "blanc" qui mesure le bruit de fond
    ¤ des gènes issus de la tomate (Spikes)

    Comment puis-je traiter mes données ?
    J'ai commencé sous SAS à comparer différentes méthodes de normalisation, en comparant les boxplot, mais aucune ne semble donner de bons résultats. Biensur avant j'ai tenter de faire une correction des données par le bruit de fond en enlevant soit la moyenne soit la médiane suivant la normalité du Bf.

    Je n'ai trouvé aucune méthodologie correspondant à des puces comme celles-ci. Pourriez vous me conseiller ?

  10. Publicité

Sur le même thème :

Discussions similaires

  1. [statistique] Analyse de survie
    Par petitkikistar dans le forum Biologie
    Réponses: 9
    Dernier message: 25/12/2007, 20h19
  2. [Zoologie] Analyse de données sur des phoques :)
    Par Koranten dans le forum Biologie
    Réponses: 9
    Dernier message: 02/12/2007, 14h09
  3. Analyse statistique des resultats d'un QCM
    Par willythekick dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 27/11/2007, 16h45
  4. [Génétique] Analyse ADN
    Par Ravaner dans le forum Biologie
    Réponses: 3
    Dernier message: 01/11/2007, 18h51
  5. Quelle analyse statistique choisir ?
    Par lofo7 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 14/08/2007, 17h02