Répondre à la discussion
Affichage des résultats 1 à 11 sur 11

Regressions linéaires multiples

  1. #1
    greystick

    Regressions linéaires multiples

    Bonjour,

    Je suis en galère avec mes régressions linéaires multiples.
    J'ai des notions en stat et parmi ces notions, aucunes ne me donnent une solution

    Je cherche à modéliser une variation de cotation d'un action avec un panel d'actions.
    Je travaille avec Excel et XLstat.
    La variation de cotation, je l'obtiens avec la formule suivante :
    ((coursJ)-(coursJ-1))/(coursJ-1)
    J'ai donc mes variations de l'action à tester VS mes variations de toutes les actions du panel

    Je fais ensuite la regression linéaire multiple sur l'ensemble des variations.
    La formule est la suivante
    y = m1X1 + m2X2 + etc... +m(n)X(n) (b=0)
    y = le cours à modéliser
    m1 = la pondération de l'action 1
    X1 = la valeur de la variation de l'actions 1 du panel

    ça me fait un top modèle avec un r² de fou mais mais MAIS, le modèle me pondère négativement certaines actions du panel.
    Genre ça : y=m1X1 - m2X2 + etc...
    D'ou ma problèmatique : Comment faire pour un avoir un modèle sans pondération négative ?

    Celui qui m'aide pourra se dire qu'il m'a sauvé la vie

    En espérant que mon sujet passionne

    PS : je peux joindre un doc Excel avec le tout si ça peut aider

    -----


  2. Publicité
  3. #2
    isozv

    Re : Regressions linéaires multiples

    J'aimerais bien le fichier Excel pour voir cela.

    As-tu utilisé l'utilitaire d'Analyse. Et pourquoi cherches-tu à cacher la réalité? Si certaines pondérations sont négatives cela a un sens physique que tu ne dois pas cacher. A moins bien évidemment que cela soit une erreur.

    Par ailleurs il faut prendre garde aux hypothèses sous-jacente de la régression multi-linéaire. Tu ne peux pas l'utiliser comme cela...

    On va voir cela ensembles le problème m'intéresse d'autant plus qu'il est pratique.

  4. #3
    greystick

    Re : Regressions linéaires multiples

    Citation Envoyé par isozv Voir le message
    J'aimerais bien le fichier Excel pour voir cela.

    As-tu utilisé l'utilitaire d'Analyse. Et pourquoi cherches-tu à cacher la réalité? Si certaines pondérations sont négatives cela a un sens physique que tu ne dois pas cacher. A moins bien évidemment que cela soit une erreur.

    Par ailleurs il faut prendre garde aux hypothèses sous-jacente de la régression multi-linéaire. Tu ne peux pas l'utiliser comme cela...

    On va voir cela ensembles le problème m'intéresse d'autant plus qu'il est pratique.
    Pour résumer, l'outil que l'on utilise au final pour contrôler les variations futures de l'action par rapport aux panels ne gérent pas les pondération négatives d'actions.
    Donc, pour modéliser par la regression, je dois obligatoirement prendre des actions du panel pondérées positivement.
    Mes pondérations ont pour finalité un r² le plus proche de 1.

    Mes recherches pour le moment en sont là :
    Mes actions du panel ont des colinéarités.
    Certaines sont fortement corrélées (Donc certaines actions du panel n'apportent rien statistiquement)
    Le modèle de regression à utiliser "serait" celui du FORWARD, BACKWARD ou STEPWISE.
    De part ce que j'ai compris, il regresse le modèle à partir des résidus restant de la première regression linéaire.

    Au final je cherche quoi ?
    Je cherche un indicateur (Test ou autre) me disant "Attention cette action va intervenir négativement dans la pondération de ton modèle" ou encore, au mieux et dans mes rèves "Cette action explique 10% du modèle ; et les 90% restant sont là, là et là et avec des pondérations positives"

    Le test de fisher (Action du panel versus action à modéliser) me donne pas grand chose de déterminant dans ce choix. (Ou je n'ai saisie le test)
    La corrélation non plus (Action du panel versus action à modéliser). Deux actions du panel très corrélées peuvent être pondérées positivement comme elle peuvent être pondérées négativement et l'autre positivement.
    Je crois que c'est la colinéarité qui va permettre de "lutter" contre ce phénomène mais hèlas, je ne comprends pas grand chose

    L'outil SAS que j'utilise aussi arrive à faire certains trucs top et notamment en NE PONDERANT JAMAIS NEGATIVEMENT une action du panel (Mais je ne comprends rien en SAS et SAS ne marche pas souvent "erreur dans les procédures" selon le LOG) mais je n'arrive pas à faire la même chose sous Excel.

    Voila tu sais tout.
    Je te remercie par avance pour ton aide

    PS : Je te joins le tableau avec les variations des actions = (Valeur Action (j-1) - Valeur Action (j))/Valeur Action (j)
    C'est en écart relatif.
    Les deux dernières colonnes sont la corrélation et le test de ficher.
    La première le libellé
    La ligne du haut correspond aux dates.
    Fichiers attachés Fichiers attachés

  5. #4
    isozv

    Re : Regressions linéaires multiples

    Ok problématique intéressante.

    J'y réfléchis et si je trouve la solution qui me semble la meilleure je vous en fais part.

    Quelquestion questions cependant:

    1. Sur quels outils informatiques doit-on se limiter?: Excel, SPSS, SAS, R, Minitab, @Risk, CrystalBall...?

    2. Je lu les contraintes mais est-ce qu'il y a des hypothèses théoriques simplifactrices dont vous faites implicitement usage dans votre étude (par exemple le choix de linéarité d'où vient-il?).

    3. Enfin, est-ce un exercice pour l'école ou un cas pratique dans l'entreprise dans laquelle vous travaillez ou dans laquelle vous faites un stage (afin de savoir si un prof devrait vous aider ou un senior)

    Merci pour ces réponses

  6. #5
    greystick

    Re : Regressions linéaires multiples

    Citation Envoyé par isozv Voir le message
    Ok problématique intéressante.

    J'y réfléchis et si je trouve la solution qui me semble la meilleure je vous en fais part.

    Quelquestion questions cependant:

    1. Sur quels outils informatiques doit-on se limiter?: Excel, SPSS, SAS, R, Minitab, @Risk, CrystalBall...?

    2. Je lu les contraintes mais est-ce qu'il y a des hypothèses théoriques simplifactrices dont vous faites implicitement usage dans votre étude (par exemple le choix de linéarité d'où vient-il?).

    3. Enfin, est-ce un exercice pour l'école ou un cas pratique dans l'entreprise dans laquelle vous travaillez ou dans laquelle vous faites un stage (afin de savoir si un prof devrait vous aider ou un senior)

    Merci pour ces réponses
    1) Sur Excel avec XL stat.
    Tous les autres outils gratuits acceptant facilant les docs Excel sont possibles. (Genre TANAGRA)

    2) Je ne vois pas ce que cela signifie.
    La linéarité ? Pour la colinérité ? Oui je fais une matrice de corrélation entre toutes les actions avec les variations de façon à enlever les actions qui n'apportent rien statistiquement au modèle.
    Je peux vous passer une version "nettoyée" si vous voulez.

    3) C'est dans le cadre du travail.
    Cependant je pense que ça peut intéresser d'autres personnes. (Personne n'a posé cette question sur le net)

    Je trouve que ce n'est pas logique de pondérer négativement dans un modele de regression linéaire dans le cadre des actions. Même si cela à un sens statistique, je repproche à la regression linéaire multiple "standard" d'avoir comme seul et unique objectif de chercher le r² le plus important. (Même avec des critères de confiance et tolérance fixent).
    En conclusion, même si sous SAS ça marche parfaitement (Via des options certainement ?), je ne crois pas que ma problématique a de solution. On demande à regression linéaire de faire quelque chose pour laquelle elle n'est pas prévue.
    Malgrès avoir tourné les modèles possibles de regression, aucun ne prévoit de pondération "logique" pour mon cas.

    Le genre de résultat que j'ai, c'est ça :
    y = 208X1 - 102X2 + 0.1X3 (Exemple qui n'existent pas en vrai) (Somme des pondération = 106.1 %)
    J'aurais un r² de 0.9465165. (C'est parfait c'est haut)

    Pourquoi ne peut on pas avoir ce genre de modèle ? :
    y = 72X1 + 35X2 + 3.1X3 (Somme des pondérations 106.1%)
    Avec un r² plus faible, genre 0.91654654

    Océan de désolation pour moi tout cela.
    C'est en train de me bouffer ce problème
    Merci pour votre aide par avance.

  7. #6
    isozv

    Re : Regressions linéaires multiples

    Attention à ne pas se faire bouffer à la va vite par un problème. Quand je fais du conseil en entreprise on passe parfois 2 à 3 mois avant de trouver la bonne solution après de multiples essais et recherches en tout genre.

    C'est donc un processus long si l'on souhait un résultat valide et qui a du sens et non un résultat modifié pour forcer à ce qu'il dise ce qu'on veut de lui.

    Votre problématique est aussi nouvelle pour moi car on ne m'avait jamais demandé un truc pareille à ce jour mais cela n'empêche pas qu'elle m'intéresse beaucoup et va donc nécessiter du temps à la réflexion (surtout que je m'occupe de pas mal d'autres choses en journée...).

    Je vous tiens au courant des mes avancées mais n'attendez pas un résultat dans la semaine à venir. Mon temps minimum de réponses est aux alentours des 2 semaines donc...

  8. #7
    greystick

    Re : Regressions linéaires multiples

    Je reposte pour les données pour une personne souhaitant les avoir.

    Je suis toujours en cours de résolution du problème. (Et toujours pas de solution )

    SAS élimine les pondérations négative en interdisant un t négatif (ça doit être une option dans les regressions)
    SAS fait également, avec le forward, une regression standard mais cherchant une pondération frolant les 100% (Why not ?)

    Bon voila, sinon RAS de mon côté cependant je plussoie l'avis du dessus : "en éliminant les pondérations négatives, on cache la vérité"
    Et que, aussi, la regression linéaire cherche le r² le plus élevé (C'est le but du truc finalement )
    Fichiers attachés Fichiers attachés

  9. #8
    isozv

    Re : Regressions linéaires multiples

    Hello.

    De mon côté j'ai rien trouvé non plus. J'ai utilisé la recherche opérationnelle qui trouve bien évidemment tous les coefficients positifs mais qui n'ont dès lors aucun sens physique exploitable.

    A mon avis y'a pas d'autres solutions que de créer un modèle mathématique à partir de zéro. Mais je doute que tu trouves quelqu'un qui passera plusieurs mois à développer un outil qui renvoie un résultat qui n'a pas de correspondance physique et dont les solutions (d'après ce que j'ai pu faire) renvoie des coefficients qui sont dans l'ensemble des complexes (imaginaires).

    En tout cas dis-moi si de ton côté tu trouverais quand même quelque chose je serai très très très fortement intéressé (et interpellé).

  10. #9
    Toufou

    Re : Regressions linéaires multiples

    Bonjour,
    Je ne comprends pas pourquoi un coefficient de régression négatif serait forcément illogique. Au numérateur d’un coefficient de régression, il y a bien une covariance, or il n’est pas forcément illogique que des actions aient des rentabilités évoluant en sens contraire. Par exemple, le cours d’une action d’une entreprise bénéficiant d’une nouvelle technologie révolutionnaire va croître alors que le cours de l’action d’une entreprise utilisant une technologie concurrente dépassée va avoir tendance à chuter.
    Comme je comprends la question, le problème revient un peu à trouver un index ad-hoc (plus spécifique qu’un indice de marché) permettant d’étudier la sensibilité d’une action aux fluctuations du panel et non à la constitution d’un portefeuille réel où des pondérations négatives ne pourraient être prise en compte. Me trompe-je ?

  11. #10
    greystick

    Re : Regressions linéaires multiples

    Citation Envoyé par Toufou Voir le message
    Bonjour,
    Je ne comprends pas pourquoi un coefficient de régression négatif serait forcément illogique. Au numérateur d’un coefficient de régression, il y a bien une covariance, or il n’est pas forcément illogique que des actions aient des rentabilités évoluant en sens contraire. Par exemple, le cours d’une action d’une entreprise bénéficiant d’une nouvelle technologie révolutionnaire va croître alors que le cours de l’action d’une entreprise utilisant une technologie concurrente dépassée va avoir tendance à chuter.
    Comme je comprends la question, le problème revient un peu à trouver un index ad-hoc (plus spécifique qu’un indice de marché) permettant d’étudier la sensibilité d’une action aux fluctuations du panel et non à la constitution d’un portefeuille réel où des pondérations négatives ne pourraient être prise en compte. Me trompe-je ?
    Oui en gros c'est ça.
    je suis désolé je ne peux pas trop détaillé le pourquoi du comment de ce que l'on fait.

    Les pondérations négatives sont interdites car l'outil que nous utilisons ne l'autorise pas.
    Effectivement, j'ai revu mon jugement, ce n'est pas illogique statistiquement de pondérer par la négative.
    Mais je n'ai pas le choix; je suis désolé.

    Nous avons fini de décrypter SAS et SAS ne trouve pas de pondérations négatives car... ils les éliminent.
    Il FORWARD et ensuite, si le modèle présente des pondérations négatives, il les supprime et regresse à nouveau (et ainsi de suite).
    Soit il trouve rien soit il trouve un modèle.
    Quand il trouve rien généralement, il nous donne un indice, seul, avec un r² pas terrible (Fatalement)
    En forward existe t'il une option qui permette de ne pas sélectionner les indices avec un t<0 ?
    Je ne pense pas donc je ne ferai pas de miracle

    Par contre tu m'as parlé d'autres modèles de regression linéaire ?

  12. #11
    greystick

    Re : Regressions linéaires multiples

    Citation Envoyé par isozv Voir le message
    Hello.

    De mon côté j'ai rien trouvé non plus. J'ai utilisé la recherche opérationnelle qui trouve bien évidemment tous les coefficients positifs mais qui n'ont dès lors aucun sens physique exploitable.

    A mon avis y'a pas d'autres solutions que de créer un modèle mathématique à partir de zéro. Mais je doute que tu trouves quelqu'un qui passera plusieurs mois à développer un outil qui renvoie un résultat qui n'a pas de correspondance physique et dont les solutions (d'après ce que j'ai pu faire) renvoie des coefficients qui sont dans l'ensemble des complexes (imaginaires).

    En tout cas dis-moi si de ton côté tu trouverais quand même quelque chose je serai très très très fortement intéressé (et interpellé).
    On modélise avec mon stagiaire mais il n'y a pas de miracle.
    Il nous faut un modèle en FORWARD qui bannisse l'entrée d'un indice si ce dernier présente un t<0.

    Il est dessus, un peu comme moi, mais ce n'est pas concluant pour le moment.
    De toutes façons, nous avons le temps dorénavant, mon n+1 a compris que les statistiques ne font pas de miracle.

Discussions similaires

  1. Peritels multiples
    Par Lacoc dans le forum Électronique
    Réponses: 0
    Dernier message: 07/11/2007, 13h20
  2. multiples invités
    Par l'avatar dans le forum Science ludique : la science en s'amusant
    Réponses: 7
    Dernier message: 24/09/2007, 21h31
  3. incertitude sur regressions quadratiques
    Par mach3 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 23/06/2005, 15h31