Statistiques : lien entre variable binaire et variable continue
Bonjour,
Je voudrais connaître la méthode statistique utilisée pour démontrer l’existence (ou absence) de lien entre une variable binaire (pays qui ont oui ou non un monarque par exemple) et une variable continue (par exemple le PIB qui peut prendre une valeur de 4 million à 600 million).
Je suis désespérée car cela fait un bout de temps que je cherche et toujours pas de réponse je dois rendre ce travail dans deux jours ! Merci de m’aider…
Pounette (étudiante en science politique)
Re : a l aide probleme de stat/math pour rapport urgent
Bonjour,
Je dis ça comme ça au débotté, mais la première idée qui me vient est de considérer ta variable binaire comme une variable continue, qui "comme par hasard" ne prend que les valeurs 0 et 1.
Évidemment il faut être très prudent dans l'interprétation des (éventuelles) corrélations.
-- françois
Les optimistes croient que ce monde est le meilleur possible. Les pessimistes savent que c'est vrai.
18/08/2006 - 10h37
kinette
Date d'inscription
janvier 2003
Localisation
(Neuch')-> Flore-en-sac!
Messages
15 705
Re : A l'aide problème de stat/math pour rapport urgent
Bonjour,
La meilleure solution à ton problème est une régression logistique.
Il ne faut surtout pas la considérer comme une variable continue car les régressions linéaires sont basées sur la loi normale qui ne s'applique pas pour des données binaires.
La régression logistique n'est pas un truc hyper compliqué, et si tu n'as pas un nombre de données énormes, ça doit même pouvoir se faire en ligne.
K.
Nomina si nescis, perit et cognito rerum.
18/08/2006 - 12h30
fderwelt
Date d'inscription
février 2006
Âge
52
Messages
2 041
Re : A l'aide problème de stat/math pour rapport urgent
Envoyé par kinette
La meilleure solution à ton problème est une régression logistique.
Il ne faut surtout pas la considérer comme une variable continue car les régressions linéaires sont basées sur la loi normale qui ne s'applique pas pour des données binaires.
Rebonjour,
C'est effectivement une bien meilleure idée, je n'y avais pas pensé spontanément. Et en plus c'est exactement adapté au problème.
-- françois
Les optimistes croient que ce monde est le meilleur possible. Les pessimistes savent que c'est vrai.
18/08/2006 - 12h53
kinette
Date d'inscription
janvier 2003
Localisation
(Neuch')-> Flore-en-sac!
Messages
15 705
Re : A l'aide problème de stat/math pour rapport urgent
Bonjour,
Pour effectuer ce test stat, perso je conseillerai R, qui est un logiciel libre, et pour une quantité de données raisonnables, on peut même utiliser Rweb qui permet de faire des tests en ligne: http://bayes.math.montana.edu/Rweb/Rweb.general.html
La fonction à utiliser pour une régression logistique est glm, en précisant dans la fontion data=binomial (je peux guider pour l'utilisation de la fonction, c'est pas compliqué et on trouve aussi des exemples sur le net).
K.
Nomina si nescis, perit et cognito rerum.
18/08/2006 - 14h07
pounette1
Date d'inscription
août 2006
Âge
35
Messages
8
Re : A l'aide problème de stat/math pour rapport urgent
Hello kinette!
Je viens de voir ton message: merci encore! Je vais tout de suite essayer sur le site Rweb pour voir comment cela se passe!
a tt de suite
Re : A l'aide problème de stat/math pour rapport urgent
Merci bcp fderwelt pour avoir répondu à ma question! J'essaye en ce moment même la regression logistique: croisons les doigts!
18/08/2006 - 14h24
pounette1
Date d'inscription
août 2006
Âge
35
Messages
8
Re : A l'aide problème de stat/math pour rapport urgent
ReSalut Kinette!
J'ai suivi le lien que tu m'as envoyé et suis arrivée au site mais je ne vois absolument pas quoi faire? Faut-il seulement préciser la fonction glm et binomial? (pas de réponse du site?) Je n'ai vraiment jamais utilisé un tel outil... si tu veux nous pouvons discuter plus rapidement par msn quand tu auras un moment de libre. Une fois que j'aurai capté le truc cela ira mieux...
Encore mille merci (vraiment!)
18/08/2006 - 14h34
kinette
Date d'inscription
janvier 2003
Localisation
(Neuch')-> Flore-en-sac!
Messages
15 705
Re : A l'aide problème de stat/math pour rapport urgent
Bonjour,
Pour utiliser des données dans R il faut qu'elles soient sous un format relativement simple.
Si tu n'as pas énormément de données, le plus simple pour toi sera de la taper directement dans R.
La syntaxe de la fonction glm est simple.
Je te copie ci-après un exemple, et le résultat:
Les deux premières lignes correspondent à l'entrée des données.
La troisième est la formule pour faire la régression, dont le résultat est stoqué dans "result", et ensuite appelé par "result" et "summary(aov(result))" (cette seconde formule demandant le résultat d'une ANOVA contrôlant l'effet de la variable continue).
Le résultat donné par RWeb:
Code:
Call:
glm(formula = variablebinaire ~ variablecontinue, family = binomial)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.0518 -1.0417 0.5098 0.8531 1.3194
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.1263 1.4065 2.223 0.0262 *
variablecontinue -1.1514 0.5722 -2.012 0.0442 *
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 39.429 on 29 degrees of freedom
Residual deviance: 34.548 on 28 degrees of freedom
AIC: 38.548
Number of Fisher Scoring iterations: 4
Rweb:> summary( aov(result))
Df Sum Sq Mean Sq F value Pr(>F)
variablecontinue 1 1.0557 1.0557 5.0008 0.03348 *
Residuals 28 5.9110 0.2111
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
Rweb:>
Ce qui me semble essentiel pour toi à retenir est le résultat de l'ANOVA sur ta régression:
summary( aov(result))
Df Sum Sq Mean Sq F value Pr(>F)
variablecontinue 1 1.0557 1.0557 5.0008 0.03348 *
Qui montre que la variable continue a un effet significatif sur la variable binaire (je me suis arrangée pour que ce soit le cas, et ça se voit d'ailleurs à l'oeil dans les données que j'ai entrées), puisque la valeur P est inférieure ) au seuil 0.05.
Bon courage,
K.
Nomina si nescis, perit et cognito rerum.
18/08/2006 - 15h38
pounette1
Date d'inscription
août 2006
Âge
35
Messages
8
Re : A l'aide problème de stat/math pour rapport urgent
coucou Kinette!
Me voilà de retour avec des résultats ce coup-ci.
Je te recopie les résultats que j'ai obtenu en considérant ma variable binomiale et le PIB: En fait, il n'y a pas de relation entre les deux et c'est ce que je veux démontrer.
Quelle est la valeur dans la liste ci-dessous qui m'indique cette absence de lien, s'il-te-plait? Je ne comprends pas la signification de chaque "Df Sum" "Sq Mean" "Sq F value" et " Pr(>F)".
Aussi, je ne sais pas ce qui justifie le choix du p= O.O5 qui va déterminer la significativité du lien ou pas? Peux-tu m'expliquer le théorie derrière le lien(ou absence de lien), c'est-à-dire, si tel élément a telle valeur d'après telle formule alors lien/pas lien? Je sais que je t'en demande bcp et je tiens a te dire que j'apprécie vraiment Kinette!
Mais, j'ai pour la première fois l'impression de tenir le bon bout avec ces stats et je te remercie pour ça!
------------------------------------------------------
Re : A l'aide problème de stat/math pour rapport urgent
Hello Pounette,
La valeur à considérer dans ton cas est le P(>F). Sans rentrer dans les détails, ton Anova est basée sur des calculs (qu'on peut refaire avec les valeurs qui sont données avant). Le test donne une valeur d'un paramètre appelé F, qu'on compare avec des valeurs théoriques, ce qui permet d'évaluer quelle est la probabilité de te tromper si tu affirmes que ta variable explicative (ici le PIB) a un effet sur la valeur de ta variable binomiale.
Si tu as 5 chances sur 100 de te tromper seulement, tu peux affirmer que ton hypothèse de départ (un effet de la variable explicative) semble raisonnable. C'est le fameux seuil de 0.05 qui est généralement utilisé pour dire qu'un test est significatif.
Dans ton cas, la probabilité est de 46%, donc il semble bien plus raisonnable de conclure qu'on n'a ici pas d'évidence d'une relation entre PIB et variable binomiale.
Petite remarque : il faut toujours rester prudent dans l'interprétation de résultats. On peut par exemple observer une splendide corrélation entre la valeur du PIB et le nombre de mariages en France... mais c'est lié à une évolution temporelle des deux choses, sans relation de cause à effet claire. Inversement, d'autres facteurs peuvent intervenir et masquer une relation bien réelle.
K.
Nomina si nescis, perit et cognito rerum.
18/08/2006 - 16h18
pounette1
Date d'inscription
août 2006
Âge
35
Messages
8
Il ne me reste qu'une chose à dire...
Chère kinette, il ne me reste en effet qu'une chose à te dire... c'est un énorme merci!
J'ai conscience du temps que tu as consacré à "mon cas" et je t'en suis très reconnaissante...
Je vais me mettre au travail et ces stats sont un apport important. Je vais potasser la théorie aussi afin de justifier l'utilisation de tt ceci!
Merci et merci encore et aucun problème pour renvoyer l'ascenseur une autre fois!
A bientôt
Pounette
18/08/2006 - 16h42
kinette
Date d'inscription
janvier 2003
Localisation
(Neuch')-> Flore-en-sac!
Messages
15 705
Re : Il ne me reste qu'une chose à dire...
Salut Pounette,
Ben de rien, ça me fait plaisir d'aider les autres, puis pour apprendre il a aussi fallu que d'autres personnes m'aident (et je demande encore de l'aide régulièrement à plus calésque moi).
Sinon, par curiosité, est-ce qu'on peut savoir sur quoi tu travailles?
K.urieuse
Nomina si nescis, perit et cognito rerum.
18/08/2006 - 20h45
pounette1
Date d'inscription
août 2006
Âge
35
Messages
8
Re : Il ne me reste qu'une chose à dire...
Re-et-resalut Kinette!
Je fais un mémoire de recherche sur l'accès aux médicaments dans les pays du Sud. Je démontre que certains facteurs (des lois par exemple) sont délétères pour les pays pauvres mais qu'ils peuvent quand même avoir recours à certaines dispositions (des arrangements juridiques) pour tenter de faire face. C'est à ce niveau que je démontre que quel que soit les caractéristiques économiques, voire sociales et culturelles, les pays qui optent pour ces dispositions s'en sortent. Je temine par tenter d'expliquer pourquoi certains pays choisissent d'opter pour les dispositifs alors que d'autres ne le font pas...
voili, voilou! Encore un gros merci!
Bonjour Kinette!
J'espère que ça va toujours bien! Je voulais te demander si je peux étudier le lien entre PIB et monarchie (ce dont on a discuté) en ne considérant rien que la population ayant les monarques (c'est a dire, que la variable binaire n'a pour valeur que 1)?
Quel serait la pertinence de l'analyse réalisée de cette manière? est ce que ça marche aussi au niveau du raisonnement?
Merci une fois encore
A bientot