Bonjour à tous,
Je décide de poster un message sur ce forum car je suis confronté à un problème qui pourrait être facilement résolvable, par toute personne ayant une connaissance réfléchie en statistique.
J'effectue actuellement un stage de bioinformatique en Angleterre et je suis amené a traiter une problématique qui nécessite une réelle étude statistique de qualité. Je travail sur le cancer du sein et l'étude statistique à effectuer se situe en amont d'un travail de plus grande ampleur, voilà pourquoi je sollicite votre aide car vous comprendrez bien que je ne peu aucunement me permettre d'effectuer de " l'a peu près ". On m'a donc fourni des données de biopuces sous un format Excel, ce fichier comporte des valeurs concernant différents paramètres biologiques et cela pour un millier de patientes environ. Les paramètres étudiés sont; la survie ("survival" valeurs calculées mathématiquement), la survie en nombre de mois, la taille de la tumeur, sa localisation, le caractère ménopause et bien d'autres...Il m'a semblé nécessaire de vous en énoncer quelques uns afin que vous preniez conscience que ceux-ci n'exprime pas le même genre de valeur.
Maintenant que vous devez avoir une idée du genre de fichier que je dois traiter il m'ai possible de vous exposer ma problématique. On m'a demandé de réaliser une étude des différents paramètres mesurés afin de savoir lesquelles seraient les plus susceptibles de prédire avec précision le paramètre "survival". Ayant eu un cursus a dominante biologique je n'est fait que peu de statistique, je ne sais donc pas qu'elle serait la meilleure stratégie a adopter afin de répondre de la façon la plus pertinente possible a ce genre d'étude.
Méthodes
Selon moi, et d'après ce que je retire de l'ensemble des recherche personnelles que j'ai effectué, différentes stratégies peuvent être appliquées: 1) Etude de statistique descriptive puis 2) effectuer des ACP ou/et (?) des HCL. J'ai aussi entendu parler de règles d'association mais je ne sais pas si je me dirige vers les bons outils statistiques.
matériels:
Je travail essentiellement sous Excel 2007 avec une macro intitulé "Xstat", ainsi qu'a l'aide du logiciel "Statistica" mais il m'ai possible d'essayer de me familiariser a "R" ou autres (selon conseil), si il vous semble que cela soit nécessaire.
En espérant que l'un d'entre vous sera intéressé par le problème auquel j'essaie de faire face, je vous souhaite une très bonne fin de journée.
-----