Je veux estimer par les MCO un modèle linéaire multiples. Mais il arrive que aucune de mes variables du modèle ne suit une loi normale. Dans ce cas les résultats de mon estimation seront il interprétables ? Si non que faut il faire ?
-----
Je veux estimer par les MCO un modèle linéaire multiples. Mais il arrive que aucune de mes variables du modèle ne suit une loi normale. Dans ce cas les résultats de mon estimation seront il interprétables ? Si non que faut il faire ?
À tout hasard j'ai déplacé ici cette demande qui était en Débats scientifiques.
Rien ne sert de penser, il faut réfléchir avant - Pierre Dac
bjr, je ne suis pas sur de comprendre.
je suppose que ton modèle linéaire est du type
mais les variables "exogènes" ne sont pas sensées être aléatoires ou suivre quoi que ce soit.
si
donc
et
il existe des liens spécifiques pour ce type d'approche.
voir "modèle de regression linéaire".
Bonjour,
C'est un sujet important et récursif.
D'abord, il me semble nécessaire de bien préciser ce qu'est un modèle de régression linéaire. C'est un modèle de régression qui peut être résolu avec un système de N équations à N inconnues où les inconnues sont les paramètres de la fonction représentant le modèle.
Là, il y a deux explications possibles, soit les variables ne sont pas indépendantes, soit il y a une faute quelque part.aucune de mes variables du modèle ne suit une loi normale.
En effet, le TCL dit que si on a des variables aléatoires de même loi, alors les écarts à la moyenne suivent la loi normale. Il ne s'agit pas d'une option, ou d'une possibilité, mais d'un théorème. Autrement dit, si on constate que ce n'est pas vrai, c'est qu'il y a une faute.
Supposons que j'ai 3 variables x,y,z, alors la formule pourrait s'écrire R = A + Bx + Cy + Dz, mais aussi R = A . x^B . y^C . z^D
Ce sont deux formes qui peuvent être le résultat de régression linéaire, l'une comme l'autre (en l'occurrence, c'est exactement la même formule, à un changement de variable près).
Je crois qu'un exemple de vos données permettrait d'être plus précis dans les réponses.
De façon précise voici mon modèle
Y= a+b*x1+c*x2+d*x3+e*x4+f*x5+g*x 6
Y= demande de monnaie
Xi= respectivement
OBLIG : les obligations émises par les communes
IP : Investissements privés
IPP : Investissements publics
M1 : Demande de monnaie des agents économiques
TRSOR : Bon de trésor
CHOM : Taux de chômage
Ce sont des données en coupe instantané.
Toutes les variables sont quantitative
N=400
La méthode de calcul est classique.
On écrit que la somme des carrés des écarts est minimum.
Cette somme sera minimum pour les valeurs qui annulent les dérivées partielles.
On arrive à un système linéaire de 7 équations à 7 inconnues (de a à g).
Cependant, il n'est pas sûr que ce soit la fonction la plus précise.
Si vous envoyez vos données, c'est à dire les 400 blocs, j'ai les outils pour calculer cela.
Pour mémoire, la méthode des moindres carrés n'est pas une théorie, mais une méthode pour trouver les paramètres les plus probables.
bonsoir
une troisième explication : c'est que tu ne connaissent pas ...
En effet, tu ne connais pas le TCL (théorème central limite) car ce théorème n'énonce pas ça du tout.
@banas :
Oui, c'est ce que j'avais compris, il s'agit de régression linéaire multiple.
Il y a flores de liens sur le net.
Il serait bon que tu justifies ces formules.bjr, je ne suis pas sur de comprendre.
je suppose que ton modèle linéaire est du type
mais les variables "exogènes" ne sont pas sensées être aléatoires ou suivre quoi que ce soit.
si
donc
et
il existe des liens spécifiques pour ce type d'approche.
voir "modèle de regression linéaire".
On peut supposer que E(...) veut dire "espérance".
En mathématiques, on parle plutôt de "moyenne arithmétique".
La somme des écarts est forcément nulle, tu vas me dire "l'espérance c'est pareil". Mathématiquement, c'est une affirmation gratuite, as-tu des arguments ?
Tu confonds "régression linéaire" et "fonction linéaire", et l'occurrence, étant donné la nouvelle appellation, pour le cas présent, ce serait plutôt une fonction affine, puisque dans formule de Basnas, il y a un terme constant.
J'ai bien compris qu'il y a un certain illogisme dans ces nouvelles appellations, mais les mathématiques restent elles-mêmes.
NON. En mathématique (ouvrir un livre de proba quelconque) l'espérance est définie pour une variable aléatoire.
La moyenne arithmétique est définie pour une liste finie de nombre.
La somme des écarts à quoi ? L'espérance de quoi ?La somme des écarts est forcément nulle, tu vas me dire "l'espérance c'est pareil".
Ce que fait anssett ici c'est de rappeler la définition usuel d'un modèle linéaire, où le résidu est choisit d'espérance nulle.
Il ne s'agit d'ailleurs pas d'un modèle affine puisqu'il n'y a pas de coefficient constant.
Sinon pour revenir à la question initiale : oui tu peux faire du moindres carrés même si ton modèle n'est pas Gaussien.
La différence c'est sur les autres interprétations de l'estimateur des MCO. Il reste légitime en lui même et très
probabablement convergeant (à moins que ton erreur résiduelle est une loi vraiment mal fichue).
Bonjour Basnas,
Il me parait important de préciser les termes.Je veux estimer par les MCO un modèle linéaire multiples. Mais il arrive que aucune de mes variables du modèle ne suit une loi normale. Dans ce cas les résultats de mon estimation seront il interprétables ? Si non que faut il faire ?
La méthode des moindres carrés (MCO) est dans le cas général la seule méthode utilisée pour calculer une régression linéaire. La raison en est la suivante, c'est la méthode de calcul qui donne le résultat le plus "probable". La méthode des moindres carrés a été mise au point par Gauss et elle est utilisée dans des quantités de contextes, c'est à dire, à chaque fois qu'on a des mesures en sur-nombre.
Cela est justifié, entre autre, par la théorie des erreurs. Soit un certain nombre de mesures d'une même chose, la valeur la plus probable et donc celle que l'on va adopter est la moyenne arithmétique. Bernoulli a démontré que la répartition des écarts à la moyenne suit la loi normale. C'est la fameuse fonction de Laplace représentée par la courbe de Gauss.
Bien-sur, les différentes variables ne suivent pas la loi normale, par contre, la répartition des écarts à la moyenne est celle de la loi normale.
Vous avez choisi une fonction linéaire (ne devrait-on pas dire affine au vu de votre fonction ?), c'est effectivement la plus simple, mais y a-t-il une raison précise pour ce choix ?De façon précise voici mon modèle
Y= a+b*x1+c*x2+d*x3+e*x4+f*x5+g*x 6
Une fois les calculs faits, on aura une idée très précise de la validité des résultats.
Ce n'est pas exact : la méthode des moindres carrés donne une fonction (dans un espace vectoriel de fonctions paramétré) dont le graphe est le proche possible de la série de données suivant la norme "euclidienne".
En général, il n'y a pas de probabilité sur l'espace des fonctions, donc il n'y a pas de résultat probable, encore moins "le plus probable".
Si la distance euclidienne a été mis au point par Gauss...
Oui, si les mesures sont faites suivant la loi normale (hypothèse étudiée par Gauss).
Mais ce n'est pas toujours le cas (par exemple, si les arrondis sont dominants sur la précision des mesures).
sans aucune hypothèse ???
Bernoulli a prouvé la première version du TCL, mais ce que tu racontes est tellement flou que je ne sais pas si c'est de cela dont tu parles...
c'est absurde ! Si les variables suivent une loi L (de moyenne/espérance m), alors les écarts à la moyenne suivent également la loi L.
Tu veux parler de la variable moyenne ???