Répondre à la discussion
Affichage des résultats 1 à 18 sur 18

Statistiques : lien entre variable binaire et variable continue



  1. #1
    pounette1

    Exclamation Statistiques : lien entre variable binaire et variable continue


    ------


    Bonjour,
    Je voudrais connaître la méthode statistique utilisée pour démontrer l’existence (ou absence) de lien entre une variable binaire (pays qui ont oui ou non un monarque par exemple) et une variable continue (par exemple le PIB qui peut prendre une valeur de 4 million à 600 million).
    Je suis désespérée car cela fait un bout de temps que je cherche et toujours pas de réponse je dois rendre ce travail dans deux jours ! Merci de m’aider…
    Pounette (étudiante en science politique)

    -----

  2. Publicité
  3. #2
    fderwelt

    Re : a l aide probleme de stat/math pour rapport urgent

    Bonjour,

    Je dis ça comme ça au débotté, mais la première idée qui me vient est de considérer ta variable binaire comme une variable continue, qui "comme par hasard" ne prend que les valeurs 0 et 1.

    Évidemment il faut être très prudent dans l'interprétation des (éventuelles) corrélations.

    -- françois
    Les optimistes croient que ce monde est le meilleur possible. Les pessimistes savent que c'est vrai.

  4. #3
    kinette

    Re : A l'aide problème de stat/math pour rapport urgent

    Bonjour,
    La meilleure solution à ton problème est une régression logistique.
    Il ne faut surtout pas la considérer comme une variable continue car les régressions linéaires sont basées sur la loi normale qui ne s'applique pas pour des données binaires.

    La régression logistique n'est pas un truc hyper compliqué, et si tu n'as pas un nombre de données énormes, ça doit même pouvoir se faire en ligne.

    K.
    Nomina si nescis, perit et cognito rerum.

  5. #4
    fderwelt

    Re : A l'aide problème de stat/math pour rapport urgent

    Citation Envoyé par kinette Voir le message
    La meilleure solution à ton problème est une régression logistique.
    Il ne faut surtout pas la considérer comme une variable continue car les régressions linéaires sont basées sur la loi normale qui ne s'applique pas pour des données binaires.
    Rebonjour,

    C'est effectivement une bien meilleure idée, je n'y avais pas pensé spontanément. Et en plus c'est exactement adapté au problème.

    -- françois
    Les optimistes croient que ce monde est le meilleur possible. Les pessimistes savent que c'est vrai.

  6. #5
    kinette

    Re : A l'aide problème de stat/math pour rapport urgent

    Bonjour,
    Pour effectuer ce test stat, perso je conseillerai R, qui est un logiciel libre, et pour une quantité de données raisonnables, on peut même utiliser Rweb qui permet de faire des tests en ligne: http://bayes.math.montana.edu/Rweb/Rweb.general.html
    La fonction à utiliser pour une régression logistique est glm, en précisant dans la fontion data=binomial (je peux guider pour l'utilisation de la fonction, c'est pas compliqué et on trouve aussi des exemples sur le net).

    K.
    Nomina si nescis, perit et cognito rerum.

  7. A voir en vidéo sur Futura
  8. #6
    pounette1

    Re : A l'aide problème de stat/math pour rapport urgent

    Hello kinette!
    Je viens de voir ton message: merci encore! Je vais tout de suite essayer sur le site Rweb pour voir comment cela se passe!
    a tt de suite

  9. Publicité
  10. #7
    pounette1

    Re : A l'aide problème de stat/math pour rapport urgent

    Merci bcp fderwelt pour avoir répondu à ma question! J'essaye en ce moment même la regression logistique: croisons les doigts!

  11. #8
    pounette1

    Re : A l'aide problème de stat/math pour rapport urgent

    ReSalut Kinette!
    J'ai suivi le lien que tu m'as envoyé et suis arrivée au site mais je ne vois absolument pas quoi faire? Faut-il seulement préciser la fonction glm et binomial? (pas de réponse du site?) Je n'ai vraiment jamais utilisé un tel outil... si tu veux nous pouvons discuter plus rapidement par msn quand tu auras un moment de libre. Une fois que j'aurai capté le truc cela ira mieux...
    Encore mille merci (vraiment!)

  12. #9
    kinette

    Re : A l'aide problème de stat/math pour rapport urgent

    Bonjour,
    Pour utiliser des données dans R il faut qu'elles soient sous un format relativement simple.
    Si tu n'as pas énormément de données, le plus simple pour toi sera de la taper directement dans R.
    La syntaxe de la fonction glm est simple.
    Je te copie ci-après un exemple, et le résultat:
    Code:
    c(1,1,1,1,1,1,1,0,1,1,1,1,1,1,1,0,0,0,1,1,1,1,1,0,0,0,0,0,0,0)->variablebinaire
    c(1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,3)->variablecontinue
    glm(variablebinaire~variablecontinue, family=binomial)->result
    summary(result)
    summary(aov(result))
    Les deux premières lignes correspondent à l'entrée des données.
    La troisième est la formule pour faire la régression, dont le résultat est stoqué dans "result", et ensuite appelé par "result" et "summary(aov(result))" (cette seconde formule demandant le résultat d'une ANOVA contrôlant l'effet de la variable continue).

    Le résultat donné par RWeb:
    Code:
    Call: 
    glm(formula = variablebinaire ~ variablecontinue, family = binomial) 
     
    Deviance Residuals:  
        Min       1Q   Median       3Q      Max   
    -2.0518  -1.0417   0.5098   0.8531   1.3194   
     
    Coefficients: 
                     Estimate Std. Error z value Pr(>|z|)   
    (Intercept)        3.1263     1.4065   2.223   0.0262 * 
    variablecontinue  -1.1514     0.5722  -2.012   0.0442 * 
    --- 
    Signif. codes:  0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1  
     
    (Dispersion parameter for binomial family taken to be 1) 
     
        Null deviance: 39.429  on 29  degrees of freedom 
    Residual deviance: 34.548  on 28  degrees of freedom 
    AIC: 38.548 
     
    Number of Fisher Scoring iterations: 4 
     
    Rweb:> summary( aov(result)) 
                     Df Sum Sq Mean Sq F value  Pr(>F)   
    variablecontinue  1 1.0557  1.0557  5.0008 0.03348 * 
    Residuals        28 5.9110  0.2111                   
    --- 
    Signif. codes:  0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1  
    Rweb:>
    Ce qui me semble essentiel pour toi à retenir est le résultat de l'ANOVA sur ta régression:
    summary( aov(result))
    Df Sum Sq Mean Sq F value Pr(>F)
    variablecontinue 1 1.0557 1.0557 5.0008 0.03348 *
    Qui montre que la variable continue a un effet significatif sur la variable binaire (je me suis arrangée pour que ce soit le cas, et ça se voit d'ailleurs à l'oeil dans les données que j'ai entrées), puisque la valeur P est inférieure ) au seuil 0.05.

    Bon courage,
    K.
    Nomina si nescis, perit et cognito rerum.

  13. #10
    pounette1

    Question Re : A l'aide problème de stat/math pour rapport urgent

    coucou Kinette!
    Me voilà de retour avec des résultats ce coup-ci.
    Je te recopie les résultats que j'ai obtenu en considérant ma variable binomiale et le PIB: En fait, il n'y a pas de relation entre les deux et c'est ce que je veux démontrer.
    Quelle est la valeur dans la liste ci-dessous qui m'indique cette absence de lien, s'il-te-plait? Je ne comprends pas la signification de chaque "Df Sum" "Sq Mean" "Sq F value" et " Pr(>F)".
    Aussi, je ne sais pas ce qui justifie le choix du p= O.O5 qui va déterminer la significativité du lien ou pas? Peux-tu m'expliquer le théorie derrière le lien(ou absence de lien), c'est-à-dire, si tel élément a telle valeur d'après telle formule alors lien/pas lien? Je sais que je t'en demande bcp et je tiens a te dire que j'apprécie vraiment Kinette!

    Mais, j'ai pour la première fois l'impression de tenir le bon bout avec ces stats et je te remercie pour ça!
    ------------------------------------------------------

    Rweb:> postscript(file= "/tmp/Rout.2112.%03d.ps", onefile=FALSE)
    Rweb:>
    Rweb:> c(1,1,1,1,1,1,1,,1,1,1,0,0,0,0 ,0,0,0)->variablebinaire
    Rweb:> c(212.8,604.0,679.7,691.2,257. 6,16.1,118.3,6.3,5.4,4.7,48.8, 763.2,96.3,112.3,52.3,3.2,1.0)->variablecontinue
    Rweb:> glm(variablebinaire~variableco ntinue, family=binomial)->result
    Rweb:> summary(result)

    Call:
    glm(formula = variablebinaire ~ variablecontinue, family = binomial)

    Deviance Residuals:
    Min 1Q Median 3Q Max
    -1.7234 -1.2278 0.7586 1.0832 1.1566

    Coefficients:
    Estimate Std. Error z value Pr(>|z|)
    (Intercept) 0.041863 0.625009 0.067 0.947
    variablecontinue 0.001555 0.002001 0.777 0.437

    (Dispersion parameter for binomial family taken to be 1)

    Null deviance: 23.035 on 16 degrees of freedom
    Residual deviance: 22.379 on 15 degrees of freedom
    AIC: 26.379

    Number of Fisher Scoring iterations: 4

    Rweb:> summary(aov(result))
    Df Sum Sq Mean Sq F value Pr(>F)
    variablecontinue 1 0.1521 0.1521 0.5753 0.4599
    Residuals 15 3.9656 0.2644
    Rweb:>

  14. #11
    kinette

    Re : A l'aide problème de stat/math pour rapport urgent

    Hello Pounette,
    La valeur à considérer dans ton cas est le P(>F). Sans rentrer dans les détails, ton Anova est basée sur des calculs (qu'on peut refaire avec les valeurs qui sont données avant). Le test donne une valeur d'un paramètre appelé F, qu'on compare avec des valeurs théoriques, ce qui permet d'évaluer quelle est la probabilité de te tromper si tu affirmes que ta variable explicative (ici le PIB) a un effet sur la valeur de ta variable binomiale.
    Si tu as 5 chances sur 100 de te tromper seulement, tu peux affirmer que ton hypothèse de départ (un effet de la variable explicative) semble raisonnable. C'est le fameux seuil de 0.05 qui est généralement utilisé pour dire qu'un test est significatif.
    Dans ton cas, la probabilité est de 46%, donc il semble bien plus raisonnable de conclure qu'on n'a ici pas d'évidence d'une relation entre PIB et variable binomiale.

    Petite remarque : il faut toujours rester prudent dans l'interprétation de résultats. On peut par exemple observer une splendide corrélation entre la valeur du PIB et le nombre de mariages en France... mais c'est lié à une évolution temporelle des deux choses, sans relation de cause à effet claire. Inversement, d'autres facteurs peuvent intervenir et masquer une relation bien réelle.

    K.
    Nomina si nescis, perit et cognito rerum.

  15. #12
    pounette1

    Il ne me reste qu'une chose à dire...

    Chère kinette, il ne me reste en effet qu'une chose à te dire... c'est un énorme merci!





    J'ai conscience du temps que tu as consacré à "mon cas" et je t'en suis très reconnaissante...
    Je vais me mettre au travail et ces stats sont un apport important. Je vais potasser la théorie aussi afin de justifier l'utilisation de tt ceci!
    Merci et merci encore et aucun problème pour renvoyer l'ascenseur une autre fois!
    A bientôt
    Pounette

  16. Publicité
  17. #13
    kinette

    Re : Il ne me reste qu'une chose à dire...

    Salut Pounette,
    Ben de rien, ça me fait plaisir d'aider les autres, puis pour apprendre il a aussi fallu que d'autres personnes m'aident (et je demande encore de l'aide régulièrement à plus calésque moi).
    Sinon, par curiosité, est-ce qu'on peut savoir sur quoi tu travailles?

    K.urieuse
    Nomina si nescis, perit et cognito rerum.

  18. #14
    pounette1

    Re : Il ne me reste qu'une chose à dire...

    Re-et-resalut Kinette!
    Je fais un mémoire de recherche sur l'accès aux médicaments dans les pays du Sud. Je démontre que certains facteurs (des lois par exemple) sont délétères pour les pays pauvres mais qu'ils peuvent quand même avoir recours à certaines dispositions (des arrangements juridiques) pour tenter de faire face. C'est à ce niveau que je démontre que quel que soit les caractéristiques économiques, voire sociales et culturelles, les pays qui optent pour ces dispositions s'en sortent. Je temine par tenter d'expliquer pourquoi certains pays choisissent d'opter pour les dispositifs alors que d'autres ne le font pas...
    voili, voilou! Encore un gros merci!

    et toi que fais tu pour être si forte en stats?

  19. #15
    pounette1

    Re : Il ne me reste qu'une chose à dire...

    Bonjour Kinette!
    J'espère que ça va toujours bien! Je voulais te demander si je peux étudier le lien entre PIB et monarchie (ce dont on a discuté) en ne considérant rien que la population ayant les monarques (c'est a dire, que la variable binaire n'a pour valeur que 1)?
    Quel serait la pertinence de l'analyse réalisée de cette manière? est ce que ça marche aussi au niveau du raisonnement?
    Merci une fois encore
    A bientot

  20. #16
    traersa

    Re : Statistiques : lien entre variable binaire et variable continue

    Bonjour, j'ai suivi cette discussion avec interet mais est il possible d'utiliser le meme principe si notre variable explicative qualitative n'est pas binaire? dans mon cas je dispose de 5 classes

  21. #17
    kinette

    Re : Statistiques : lien entre variable binaire et variable continue

    Citation Envoyé par traersa Voir le message
    Bonjour, j'ai suivi cette discussion avec interet mais est il possible d'utiliser le meme principe si notre variable explicative qualitative n'est pas binaire? dans mon cas je dispose de 5 classes
    Bonjour,
    Oui, c'est possible
    Regarde du côté des régressions multinomiales... (y a ptêtre aussi moyen avec un "modèle mixte").

    Cordialement,
    K
    Nomina si nescis, perit et cognito rerum.

  22. #18
    alibaba79

    Re : Statistiques : lien entre variable binaire et variable continue

    Citation Envoyé par kinette Voir le message
    Bonjour,
    Oui, c'est possible
    Regarde du côté des régressions multinomiales... (y a ptêtre aussi moyen avec un "modèle mixte").

    Cordialement,
    K
    Bonsoir,

    Votre aide me sera précieuse.
    En effet, je suis face un problème où la variable expliquée peut prendre différentes valeurs, et les variables explicatives peuvent avoir plusieurs modalités (1,2,3...)
    J'imagine en tous cas le modèle comme ca:
    LA VARIABLE EXPLIQUÉE (X) = LA VARIABLE A (réponse 1, réponse 2, réponse 3)+ LA VARIABLE B (réponse 1a, réponse 2a, réponse 3a, réponse 4a) + LA VARIABLE C (réponse 1b, réponse 2b, réponse 3b, réponse 4b)

    Je vous prie de me dire quel type de test je dois utiliser et vous remercie par avance.

  23. Publicité

Discussions similaires

  1. Statistiques a une variable, calcul des quartiles
    Par vinceb62 dans le forum Mathématiques du collège et du lycée
    Réponses: 1
    Dernier message: 24/03/2008, 15h07
  2. Statistiques-Variable discrète
    Par bilman dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 21/10/2007, 18h18
  3. Variable ou pas variable?
    Par rare dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 24/08/2007, 12h05
  4. L'utilisateur entre un réel dans une variable entière : que se passe-t-il ?
    Par LicenceXP dans le forum Logiciel - Software - Open Source
    Réponses: 1
    Dernier message: 08/10/2006, 12h04
  5. Transfo variable?
    Par Nickyo dans le forum Électronique
    Réponses: 3
    Dernier message: 25/04/2005, 21h03