Bonjour,
J'ai longtemps hésité pour savoir si je devait poster cette discussion sur le forum de biologie ou de mathématique.
Alors voilà, je suis stagiaire et je travaille actuellement sur la prise en charge précoce de l'Accident Vasculaire Cérébral (AVC) avec une équipe de chercheur. On se partage le travaille et le mien est d'établir le contexte et les implications de cette prise en charge (bibliographie, détection des biais, différence entre théorie et pratique, ect....). N'ayant qu'une formation réduite au strict necessaire en statistique, le choix de la modélisation a été laissé à un de mes collègues spécialisé en biostatistique. Seulement voilà, il y certaines informations que j'aimerais extraire notre base de donnée mais notre biostatisticien n'a pas vraiment de temps à accorder au petit stagiaire que je suis. Je me retrouve donc à tenter d'obtenir les chiffres par moi-même, mais avec mon niveau de base, j'avoue que je me retrouve franchement dépassé.
Voici ma situation: en cas d'AVC, plus le patient reçoit le traitement contre l'AVC tôt, plus son handicap à long terme est réduit, donc on devrait pouvoir constater une variation de ce handicap à long terme en fonction du délai avant traitement. Pour étudier cela, j'essaye d'obtenir une variation du score NIHSS (un score de gravité du handicap allant, en croissant, de 0 à 42) trois mois après l'AVC par minutes de retard sur le traitement. Pour cela, je dispose, dans ma base, pour chaque patient, du score NIHSS à trois mois et du délai entre l'apparition des symptômes et la prise du traitement.
À priori, il n'y a donc aucun problème, je ne devrais même pas avoir besoin de R: il suffirait que divise, pour chaque patient, le score NIHSS à trois mois par le délai jusqu'au traitement puis que je moyenne le résultat de tous les patients pour obtenir une estimation potable.
Seulement voilà, il y a deux autres variables qui influent sur le score NIHSS à trois mois (en fait, il y en a quatre, mais je sais déjà comment je vais gérer les deux autres ) :
- l'âge du patient, car les patients agés récupèrent moins bien après un AVC.
- le score NIHSS initial du patient, car, bien évidemment, la gravité de l'AVC lui-même influe sur le handicap à long terme.
Ces deux variables sont disponible dans la base de données mais j'ignore comment procéder pour obtenir un score NIHSS à trois mois "corrigé" qui soit indépendant de ces deux variables. Je sais que l'on peut l'estimer avec une régression multivariée mais mon niveau en statistique est un peu trop léger pour la créer (ce n'est pas faute d'avoir essayé).
Si quelqu'un a des pistes à me proposer (ex: cours en ligne sur ce genre question, erreurs à éviter, corrigés d'exercices semblables...), je suis preneur.
En vous remerciant par avance,
-----