Bonjour,
A quoi correspond une courbe de distribution ?
Quelqu'un pourrait il me donner un exemple ?
J'ai ça comme exemple :
Performance
0,5
-2,71
0,02
-0,76
-0,59
Moyenne -0.71.
La courbe sera centrée sur -0.71. Comment tracer cette courbe ?
-----
Bonjour,
A quoi correspond une courbe de distribution ?
Quelqu'un pourrait il me donner un exemple ?
J'ai ça comme exemple :
Performance
0,5
-2,71
0,02
-0,76
-0,59
Moyenne -0.71.
La courbe sera centrée sur -0.71. Comment tracer cette courbe ?
ou sera centrée sur l'écart type ?
Salut,
Tu as une variable aléatoire continue à valeurs dans un intervalle de l'ensemble des nombres réels. Toute variable aléatoire suffisamment régulière admet une fonction de distribution. La fonction de distribution de est une fonction de dans . Dans une première approche naïve et incorrecte, cette fonction donne pour une certaine valeur de la probabilité que prenne la valeur , i.e. . Pourquoi est-ce incorrect ? bah parce qu'on a une variable continue, la probabilité que prenne une certaine valeur de l'intervalle est infinitésimale puisque la somme des probabilité doit être égale à (l'évènement " prend une certaine valeur de l'intervalle " est un évènement certain, qui est somme des évènements " prends la valeur " pour qui sont disjoints) et il y a une infinité d'évènement "" (un pour chaque valeur de ). Donc en faite la fonction de distribution est véritablement définie par
où est un infiniment petit et donc aussi. Cela dit en pratique on ne travaille pas avec des infiniments petits (sauf dans une branche particulière des mathématiques où on en donne une définition rigoureuse). On préfère travailler avec des probabilité "normales" parce qu'on ne sait pas vraiment ce que c'est un infiniment petit. Le raisonnement consiste à dire que la probabilité de prendre une seule valeur est infiniment petite mais la probabilité de prendre une infinité de valeurs elle sera "normale". Ainsi, cela n'a pas de sens pour une variable aléatoire continue de se demander la probabilité qu'elle prenne une certaine valeur mais par contre cela aura un sens de se demander la probabilité que soit à valeurs dans un intervalle par exemple. Cette probabilité sera alors la somme continue des probabilité infinitésimales pour compris entre et , ce que l'on note
Oui mais bon concrètement Parce c'est bien gentil les probas théoriques mais moi je ne fais que des statistiques élémentaires ou du moins j'essaie de comprendre de façon élémentaire ce qu'est une fonction de distribution. Le statisticien dispose de données qui sont un ensemble de valeurs (indépendantes) de sa variable aléatoire. Le fait que la probabilité que la variable prenne une certaine valeur est infinitésimale va se traduire par le fait qu'on aura une suite de donnée numériques dans laquelle il sera très rare qu'une valeur se répète deux fois. De sorte que, faire des effectifs et des fréquence ne donne rien d'intéressant, puisque tous les effectifs ou presque seront égaux à et les fréquences seront égales entre elles à l'inverse du nombre de données. En clair, cela n'apporte aucune information pertinente pour l'analyse de données. Que fait le statisticien, bah il considère des classes, c'est à dire qu'il classe les différentes valeurs dans des intervalles (de même que le probabiliste s'intéresse à la probabilité que la variable prenne ses valeurs dans un certain intervalle). La largeur des classes est choisie de façon à ce que les effectifs dans chaque classe ne soient pas trop ridicules (comme les statisticiens s'attendent souvent à tomber sur une loi normale, ce qui se peut s'expliquer au niveau des probabilités, la largeur des classes est souvent choisie en conséquence selon une règle qui peut paraître obscure au néophyte). On trace alors un histogramme (mais bien entendu il faut une grande quantité de données, ce qui n'est pas ton cas). Plus le nombre de donnée est important plus on doit faire des classes moins larges et donc plus nombreuses pour ne pas quelles contiennent trop de données. Le contour supérieur de l'histogramme (la courbe en escalier sous-laquelle se trouve l'histogramme) ressemble de plus en plus à une courbe qui a en général la forme d'une cloche. C'est la courbe de la fonction de distribution. Ceci est la définition pratique de la fonction de distribution et de comment on l'obtient à partir de données. Dans un histogramme on se débrouille en général pour que l'aire d'un rectangle corresponde à la fréquence de la classe en question, de sorte que la probabilité que se trouve entre des valeurs et est la somme des fréquences des classes correspondante et donc l'aire sous la courbe de la fonction de distribution entre les abscisse et , soit encore une approximation de
par une méthode de rectangles. Il y a donc bien correspondance entre le point de vue probabiliste et le points de vue statistique.
Maintenant, comme tu as très peu de données, le mieux que tu puisse faire c'est supposer que tes données suivent la loi normale (sauf si tu as des indications contraires). Une loi normale est complétement définie pas deux paramètres, la moyenne et l'écart type. Il faut les calculer sur tes données
la fonction de distribution est alors donnée par
merci c'est très gentil à toi, je vais regarder puis je reviens vers toi