Bonjour à tous,
Deux petites questions concernant les statistiques : si j'effectue une régression (peu importe laquelle) sur une variable de sortie expliquée par plusieurs variables d'entrée : Ma variable de sortie prend les valeurs 0 ou 1 (Bernoulli). Ma régression me donne où X_1,...X_p sont les variables explicatives.
J'ai un tableau où j'ai n observations, donc toutes les valeurs correspondantes des X_i et Y.
Comment je peux analyser la qualité de mon ajustement ? Je peux calculer les valeurs de correspondant aux sorties calculées avec et ma fonction de régression, mais cela me donne forcément des valeurs réelles comprises entre 0 et 1. Et ma variable de sortie vaut soit 0 soit 1. Et comme chacun sait, c'est pas parce qu'une probabilité de succès est égale à 0.9 qu'il est incohérent d'observer un échec.
Autre question : Comment je peux définir les résidus dans un cas pareil ?
Merci par avance.
-----