Je me demandais ce que voulais dire une covariance a tendance positive ou négative et aussi je voulais savoir quand on a le coefficient de corrélation(X,Y) qui vaut -1 a-t-on Y=ax+b ou Y=-ax+b ?
-----
20/02/2017, 21h11
#2
gg0
Animateur Mathématiques
Date d'inscription
avril 2012
Âge
75
Messages
30 981
Re : Covariance
Bonjour.
Parle simplement de covariance positive (le nuage de points "monte" en gros); et de covariance négative (le nuage de points "descend" en gros).
La droite de régression ayant comme équation Y=aX+b, la valeur du coefficient de corrélation ne changera rien.
Par contre, si tu apprends les formules sérieusement, tu verras un lien entre les signes de cov(X,Y), a et r. Mais cherche un peu, ça te fera apprendre ton cours.
Cordialement.
20/02/2017, 22h33
#3
invitec376177f
Date d'inscription
janvier 1970
Messages
87
Re : Covariance
Merci de ta réponse . La relation est a= cov(x,y)/sima x². Il reste un dernier point à éclaircir , comment calculer la variance quand on a des données réparties en classes ?
21/02/2017, 09h34
#4
gg0
Animateur Mathématiques
Date d'inscription
avril 2012
Âge
75
Messages
30 981
Re : Covariance
Si les classes sont de faible amplitude, on se contente d'approximer les valeurs par le centre de classe, donc on fait la variance de la série (centre de classe,effectif de la classe). Ce qui revient à estimer la variance pas la variance des moyennes de classes (estimées par le centre de classe). C'est bien sûr une valeur légèrement fausse, mais si on n'a pas les vraies valeurs, pas d'autre renseignement, c'est la méthode qui donne en moyenne la plus faible erreur.
Si les classes sont de grande amplitude (ou très peu nombreuses), on ne peut plus négliger la variance dans les classes, car :
Variance globale= variance des moyennes des classes + moyenne des variances de chaque classe.
Si les classes sont de même amplitude a, on rajoute a²/12 , si elles sont d'amplitudes différentes on rajoute la moyenne des a²/12 pour les amplitudes des différentes classes. Le a²/12 (correction de Yates) est une estimation moyenne des variances de classes.
Bien évidemment, on peut être bien à côté de la vraie valeur. Ce qui fait qu'avec les moyens actuels de traitement des données, on conserve les vraies valeurs, les classes ne servent plus qu'à la présentation des données.