salut,
voila la question est dans le titre :d
-----
salut,
voila la question est dans le titre :d
tu parles du calcul de la norme?
si c'est le cas, c'est un moyen de calculer le cumul de l'écart entre la distribution théorique et l'observée...
j'ai lu un peu sur la régression et aparemment l'histogramme de l'erreur doit avoir la forme d'une cloche !!, je ne sais pas pourquoi une telle condition ..
Bonjour,
la réponse à ta question est beaucoup plus complexe qu'il n'y parait et dépend beaucoup du sens que tu donnes à ta "regression".
Pour faire simple (et éviter autant que possible de dire des choses fausses ou trop approximatives car mes cours sont lointains), on peut opposer deux situations extrêmes.
Dans la première, on a n observations dans un espace de p+1 dimensions ( n > p+1). Dans cette situation, la régression est l'équation de l'hyperplan passant par l'origine telle que la variance empirique de la projection des n points sur un hyperplan passant par l'origine soit maximale (et la somme des carrés des distances des points à leur projection soit minimale). Si on désigne par y et x1 à xp les p+1 dimensions on peut exprimer y sous la forme y= Somme (ai*xi)+résidu pour chacun des n points.
Dans cette formulation, aucune spécification des propriétés statistiques des "résidus" n'a d'importance.
A l'opposé, on dispose d'une relation théorique reliant, sous une forme linéaire, une variable Y à p variables explicatives (les X) et de n observations de ces p+1 variables. Pour de nombreuses (et variées) raisons, la relation est observée à un aléa près.
A ce moment, pour déterminer si les observations empiriques permettent de valider ou non le modèle théorique, on a besoin de connaître le modèle qui génère cet aléa (ce qui permet de savoir quelle méthode de régression est adaptée, la méthode des moindres carrés ordinaires correspond au calcul effectué dans la première situation mais il en existe d'autres, méthode des moindres carrés généralisés, utilisation de variables instrumentales) et de faire l'hypothèse que les résidus suivent une loi normale afin d'effectuer des tests simples permettant de quantifier la probabilité que le modèle soit vrai avec les observations recueillies.
@+
ça c'est la réponse :d, merci...Bonjour,
la réponse à ta question est beaucoup plus complexe qu'il n'y parait et dépend beaucoup du sens que tu donnes à ta "regression".
Pour faire simple (et éviter autant que possible de dire des choses fausses ou trop approximatives car mes cours sont lointains), on peut opposer deux situations extrêmes.
Dans la première, on a n observations dans un espace de p+1 dimensions ( n > p+1). Dans cette situation, la régression est l'équation de l'hyperplan passant par l'origine telle que la variance empirique de la projection des n points sur un hyperplan passant par l'origine soit maximale (et la somme des carrés des distances des points à leur projection soit minimale). Si on désigne par y et x1 à xp les p+1 dimensions on peut exprimer y sous la forme y= Somme (ai*xi)+résidu pour chacun des n points.
Dans cette formulation, aucune spécification des propriétés statistiques des "résidus" n'a d'importance.
A l'opposé, on dispose d'une relation théorique reliant, sous une forme linéaire, une variable Y à p variables explicatives (les X) et de n observations de ces p+1 variables. Pour de nombreuses (et variées) raisons, la relation est observée à un aléa près.
A ce moment, pour déterminer si les observations empiriques permettent de valider ou non le modèle théorique, on a besoin de connaître le modèle qui génère cet aléa (ce qui permet de savoir quelle méthode de régression est adaptée, la méthode des moindres carrés ordinaires correspond au calcul effectué dans la première situation mais il en existe d'autres, méthode des moindres carrés généralisés, utilisation de variables instrumentales) et de faire l'hypothèse que les résidus suivent une loi normale afin d'effectuer des tests simples permettant de quantifier la probabilité que le modèle soit vrai avec les observations recueillies.
@+
j'ai surtous lu quelque chose qui m'a enchanté ,
donc si je travail avec les mondres carrés ordinaires, pas besoin de se casser la tête pour les résudus, merci encor;Dans cette formulation, aucune spécification des propriétés statistiques des "résidus" n'a d'importance.
cordialement.
Bonjour,
ça, c'est un peu rapide.donc si je travail avec les mondres carrés ordinaires, pas besoin de se casser la tête pour les résudus
Tout dépend des conclusions que tu veux tirer des résultats de ta régression, c'est à dire de la raison qui t'amène à calculer les paramètres de cette régression.
En particulier, tu ne peux pas en déduire que le coefficient d'une "variable explicative" est significativement différent de zéro (ou de toute autre valeur d'ailleurs).
@+
moi j'en ai besoin que pour faire de la prédiction, donc pas besoin de faire une analyse pour dire des conclusions du genre "cette variable depend de celle ci ..".
mon but est de construire un modèle pour faire de la prédiction sur la base de certaines données dont je dispose.
cordialement.
ah oui, très important, mon modèle servira à interpréter l'historique de navigation des utilisateurs pour déterminer leur degré d'intérêt, donc j'attends pas des résultats du tonner, si mon modèle me permet une erreur de 20% sur 50% des utilisateurs c'est que je suis excellent, si tu voies ce que je veux dire.
tous ça pour dire que mes résultats vont dépendre plus du comportement des utilisateurs que de la régression elle même.
cordialement.
Re,
sur un modèle prédictif, je crois que cela fonctionne. Tu obtiens la meilleure relation linéaire entre tes variables descriptives et la variable à prédire. Ceci ne dépend pas de la distribution des résidus empiriques.
Par contre, si tant est que cela ait un sens et que tu trouves une transposition possible dans ton cas, l'autocorrélation temporelle des résidus et la stationnarité influencent la qualité de la prédiction et des transformations (régression sur les différences premières par exemple) peuvent conduire à une meilleure prédiction.
@+
merci de m'avoir répondu et surtout de m'avoir réconforté dans mon choix pour la régression, même si je suis déjà bien avancé dans cette dernière, je n'ai jusqu'à présent jamais demander l'avis d'un expert. merci encor, et passe une bone journé Lyonnais92