Régression sur données non normales
Répondre à la discussion
Affichage des résultats 1 à 9 sur 9

Régression sur données non normales



  1. #1
    invite51c0cb61

    Régression sur données non normales


    ------

    Bonjour,
    Je dispose d'un jeu de données contenant l'amplitude moyenne du niveau d'eau d'un bassin par mois sur 5 ans. En créant un nuage de point, j'ai l'impression qu'au fil du temps, cette amplitude augmente. Je voudrais donc tester l'effet du temps sur cette amplitude. J'ai d'abord pensé à une régression linéaire mais ma variable amplitude n'est pas normale. Savez-vous quel test dois-je utiliser dans ce cas ?
    En vous remerciant, cordialement
    Irène

    -----

  2. #2
    gg0
    Animateur Mathématiques

    Re : Régression sur données non normales

    Bonsoir.

    mais ma variable amplitude n'est pas normale
    Et alors ? En quoi c'est un problème ?

    Si tu mesures tous les jours une valeur et qu'il y a alignement (coefficient de régression à 1 ou à -1) des points du nuage, crois-tu vraiment que la variable expliquée suit une loi Normale ?

    Il faut arrêter de penser Normalité à tout bout de champ; la Normalité est une circonstance très particulière et même rare.

    Cordialement.

  3. #3
    invite179e6258

    Re : Régression sur données non normales

    bonjour,

    deux points:

    1) on peut utiliser la régression par moindre carrés dès que les résidus sont non corrélés et de même variance finie (théorème de Gauss-Markov). Nul besoin de normalité pour avoir des estimateurs convergents. La normalité sert pour les inférences (les tests si tu veux).

    2) dans tous les cas, ce qui compte c'est la normalité des résidus, pas celle de la variable étudiée.

    bref, il faut ajuster un modèle linéaire et ensuite regarder si les hypothèses : indépendance des résidus et éventuellement normalité sont respectées.

  4. #4
    gg0
    Animateur Mathématiques

    Re : Régression sur données non normales

    On peut même se contenter d'une analyse de statistiques descriptives et faire un ajustement linéaire qui décrit ce qui s'est passé. Donc même pas de modèle avec des résidus gaussiens (*), juste une analyse factuelle.

    Cordialement.

    (*) quand on a peu de données, les tests ne prouvent rien, et quand on en a beaucoup, ils échouent facilement.

  5. A voir en vidéo sur Futura
  6. #5
    invite179e6258

    Re : Régression sur données non normales

    Bien sûr. Mais je pense quand-même que la propriété de convergence est utile. Intuitivement, ça signifie que si on augmente l'échantillonnage, on va améliorer nos estimations (on a des chances de le faire pour être plus précis). Avec des résidus corrélés, on peut construire des exemples où la régression ne converge pas.

  7. #6
    invite6ecbbd61

    Re : Régression sur données non normales

    Salut,

    Si tu veux faire un test d'hypothèse, et tester s'il y a bien une relation linéaire entre tes mois et l'amplitude du bassin, ben il faut faire un modèle linaire généralisé. Si ta variable suit une loi de Poisson, alors il faut simplement faire le GLM avec une erreur de Poisson.
    Tu utilise quel logiciel pour faire ces tests?

    Cordialement.

  8. #7
    invite51c0cb61

    Re : Régression sur données non normales

    Bonjour,
    J'utilise R. Je croyais que la loi de Poisson était "réservé" aux données discrètes, ce qui n'est pas mon cas .
    Cordialement et merci à tous pour vos réponses

  9. #8
    invite6ecbbd61

    Re : Régression sur données non normales

    Oui effectivement, normalement c'est pour les données discrètes. (Aussi parce que dans la nature ou ailleurs, les "comptages" ou n'importe quelle variable discrète ont quasiment tout le temps une distribution de Poisson).
    Je pense que tu as 2 choix:
    - Soit tu t'en fou et tu fais quand même le GLM en Poisson, en admettant que tes données sont discrètes. Ça ne change rien sur les sorties que te donnera le GLM.
    - Soit tu normalise ta variable pour faire un LM classique par la suite. (une technique au pif, tu log ta variable)

  10. #9
    invite4232c0d8

    Re : Régression sur données non normales

    Bonjour,
    Je vous écris ici car j'ai sensiblement le même problème. Merci d'avance aux personnes qui prendront le temps de me répondre.

    Je veux expliquer des % de recouvrement du sol par une espèce de plante ("agro"), en fonction de la composition biogéochimique du sol. Dans mes données brutes, les % de recouvrement sont donnés par "classes" : "classe" 0 si la plante est absente, "classe" 1 si elle recouvre 0 à 4% du sol, etc. jusqu'à 10 = 91 à 100% de recouvrement. Pour faire une régression j'ai mis la variable recouvrement en integer, et pour chaque classe j'ai réattribué la valeur centre (par ex. pour la classe 1, c'est devenu la moyenne de 0 et 4 c'est-à-dire 2).
    Ensuite sous R : mod1=lm(agro~solN+solC+solP+so lpH+solNO3+solNH4)
    Mais graphiquement sur le plot, les données ne sont pas normales et les résidus pas top non plus. Quand je mets "agro" au carré c'est encore pire.

    Pensez-vous que je devrais plutôt garder ma variable recouvrement avec ses "classes" (données discrètes donc) et faire un GLM ? Comment puis-je savoir si mes données suivent une loi de Poisson (ou autre loi) ?

    Merci beaucoup pour votre aide.

Discussions similaires

  1. Support vector regression vs least square regression
    Par invite893b8612 dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 14/04/2011, 15h04
  2. statistiques: tests de pourcentages sur populations non normales...est-ce possible ?
    Par inviteee2af3f4 dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 22/09/2009, 18h29
  3. Probabilité sur deux lois normales
    Par invite1908ffe4 dans le forum Mathématiques du supérieur
    Réponses: 8
    Dernier message: 03/11/2008, 10h21
  4. question sur la regression
    Par invite78f7edf2 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 08/06/2007, 14h42
  5. regression linéaire sur excel
    Par invite48fb20ee dans le forum Physique
    Réponses: 2
    Dernier message: 04/11/2006, 23h26