j'arrive pas à comprendre la notion de quartils.ya quelqu''un qui peut me donner un exemple éxplicatif
-----
j'arrive pas à comprendre la notion de quartils.ya quelqu''un qui peut me donner un exemple éxplicatif
C'est très simple.
Si tu as une série statistique ordonnée, les quartiles sont 3 nombres qui séparent la série en 4 parties égales.
Appellons les Q1, Q2, Q3.
Le nombre d'échantillons inférieurs à Q1 = nombre d'échantillons compris entre Q1 et Q2 = nombre d'échantillons compris entre Q2 et Q3 = nombre d'échantillons supérieurs à Q3
Pour une série 543 16 865 126 21 6 56 47
Tu l'ordonnes : 6 16 21 47 56 126 543 865
et tu prends par exemple: Q1 = 20, Q2 = 50, Q3 = 300
Bonjour,
A noter que la médiane est le second quartile.
J'ai regardé rapidement, mais ce site m'a l'air pas mal pour expliquer ça: http://www.statcan.ca/francais/edu/p...12/range_f.htm
K.
Nomina si nescis, perit et cognito rerum.
Il y a plusieurs versions, que ce soit pour la médiane, les quartiles ou n'importe quel quantile.
Par exemple pour une série de 2 échantillons: 4, 11
Certains imposent que la médiane soit (4+11)/2 (comme dans le lien)
D'autres prennent n'importe quelle valeur entre 4 et 11.
(avec un nombre impair d'échantillons, on prend toujours la valeur centrale).
C'est pareil pour les quartiles. Mais avec beaucoup d'échantillons bien distribués, ça ne fait pas une grande différence.
Bonjour,
Il y a une troisième façon d'obtenir les quantiles: par interpolation linéaire...
C'est pas trop mal expliqué ici: http://jellevy.yellis.net/Classes/1e...ique.htm#rep12
ou là:
http://www.iutbayonne.univ-pau.fr/~g...chapitre4.html
K.
Nomina si nescis, perit et cognito rerum.
slt, je voudrais savoir comment on fait dans les representations graphiques des variables continue a amplitudes inegales (l'istogramme) on doit avoir l'aire egale ou bien poportionnelle a l'effectif? merçi.
Bonjour,
toute biologiste que je suis, au niveau maths je suis une bille et je dois résoudre le problème suivant :
J'ai une moyenne et son écart-type pour 2 séries de données. Je dois pour obtenir ma valeur finale, retirer une moyenne de l'autre, mais je ne sais pas quoi faire pour pouvoir attribuer un écart-type correct a cette valeur finale. J'explique mon charabia par un exemple:
série A; moyenne = 4 avec ecart-typeA = 1
série B; moyenne = 12 avec écart-typeB = 2
valeur finale B-A = 8, mais ecart-type =
existe-t-il une formule pour calculer cet écart-type?
merci
Oui, il y en a une :
,
la covariance entre X et Y étant notée
L'idéal se produit quand les deux variables sont indépendantes, dans ce cas la covariance est nulle !
J'espère que ça te donne des indications utiles !
V.
merci pour cette réponse ultra expresse!
cela m'aide en effet, mais je ne suis pas sure que mes variables soient indépendantes, et dans le cas contraire, je ne sais pas (ou plus-j'ai du savoir cela il y a 15 ans environ..-) comment calculer la covariance
J'en profite pour développer; la formule serait-elle semblable si je devais additionner ou diviser les variables?
merci encore
Pour une combinaison linéaire,
Pour un quotient, ça commence à se compliquer, cela se passe bien si les deux variables ont des distributions particulières... Est-ce que tes variables sont par exemple gaussiennes ? Combien d'individus par échantillon ?
Pour la covariance, tout bon tableur ou logiciel de statistiques fera le calcul !
Bonsoir
Une autre expression de la covariance :
Edit : Je crois que j'ai mal compris la question Je laisse quand même mon message, au cas où ^^
c'est encore moi! Merci Vincent, après vérification, oui il semble que mes variables soient indépendantes, donc, pas de souci de calcul de covariance et j'ai mon résultat qui colle avec des valeurs qu'on m'avaient transmises auparavant (mais sans m'expliquer le calcul.... ah! ces statisticiens!!!!)
le cadre d'une étude que je mène sur la bourse de casablanca, j'ai été confronté au bp de la mesure du risque ( beta) d'action peu liquides comme c'est le cas de certains actifs dans les marchés émrgents et j'ai eu le plaisir de lire ceratins articles qui vont dans ce sens, ils disent que l'estimateur le plus pertinent est celui de Fowler et Rorke
Ma question est la suivante: comment on peu appliquer concrétemment cette formule sur les données empirique? SVP j'ai besoin des étapes car je n'ai pas su comment appliquer la formule; et peut on estimer le décalage le plus pertinent pour le cas Maroc?
Merci d'avance et que Dieu vous en rende Grâce.
Bonjour,
Nous sommes 8 joueurs de badminton à jouer une heure par semaine sur un terrain double et deux terrains simples. Sur le double, les équipes changent aléatoirement après chaque set (sachant qu'il y a au moins 3 set sur une heure), et sur les simples on change d'adversaire après une 20 minutes. Quelqu'un pourrait il m'aider à concevoir un tableau hebdomadaire complet d'une tournante afin que tout le monde joue contre ou avec tout le monde.
Merci pour votre réponse, moi je m'y perds!
Bonjour à tous,
Désolée de m'incruster dans la conversation mais je ne sais pas comment créer un nouveau message (je suis pas très douée..)
Voici mon pb:
Je me suis penchée sur l’analyse des durée de vie ces derniers temps car je dois estimer la durée de vie d’un individu et je n’arrive pas à tout comprendre. J’ai qqs interrogations.. Je vous présente mon cas de figure :
Je dispose de 41 827 individus sur 18 mois d’obs. Chaque mois un certain nb d’individu partent (ce ne sont pas des patients qui décèdent mais des clients qui partent, un peu plus gaie…) A la fin de la période, tous mes clients ne sont pas partis.
• 1ère question : suis-je dans un cas de données censurées ? je serai tenter de dire oui, car tous mes clients ne partent pas à la fin de la période, donc je n’ai pas d’information sur leur devenir… mais d’un autre côté j’ai l’impression que les données censurées correspondent au nb d’individu perdus de vue au cours du mois ? Pour ma part, les clients qui restent au cours de la période sont forcément encore actifs.
Mes données pour illustrer :
mois COUNT
200609 41827
200610 41666
200611 41566
200612 41470
200701 41352
200702 41225
200703 40791
200704 39511
200705 38003
200706 36892
200707 35347
200708 33960
200709 32750
200710 31641
200711 30825
200712 29871
200801 28863
200802 27957
• Comment estimer la courbe de survie ? J’ai pu calculer la courbe de survie de ces individus sur les 18 1ers mois (à la main ou à l’aide de la proc lifetest de SAS). Mais j’aimerai pouvoir l’estimer jusqu’à évaporation pour pouvoir estimer la durée de vie d’un client. Que faut il faire ? Est-ce que les méthodes de Kaplan-Meier, Cox ou les méthodes paramétriques permettent d’estimer la suite de la courbe de survie ou faut il poursuivre la courbe en posant l’hypothèse que le taux de perte reste stable par la suite ?
Je travaille sous SAS, je sais que les proc lifetest, phreg ou lifereg pourront m’aider..
• Dernière question : une fois que je dispose de la courbe de survie complète, comment estimer la durée de vie moyenne d’un individu ? Est-ce bien la somme de toutes les valeurs de la courbe de survie ? (jusqu’à évaporation).
Merci pour votre aide.
Emmanuelle
bonjour,
oui c'est bien des données censurées, puisque tu ne connais pas la "durée de vie" pour les clients restant en fin d'expérience.
je ne sais pas ce que tu appelles "évaporation", mais s'il reste des "survivants" en fin d'expérience Kaplan-Meier te donne une durée moyenne infinie, donc il vaut mieux faire du pérémétrique si tu veux estimer une durée moyenne.
ok pour la méthode paramétrique.. Mais comment la mettre en oeuvre? En fait la courbe de survie que j'obtiens part de 100% et à la fin de ma période d'observation il me reste encore 66% de mes individus. Ce que je voudrais c'est estimer la fin de ma courbe de survie jusqu'à ce que tous mes clients partent, pour pouvoir en déduire la durée de vie moyenne d'un client (qui est la somme des points de ma cb je pense?).
Sous SAS, c'est la proc lifereg qui est utilisée pour une estimation paramétrique mais comment récupérer la courbe de survie? Il me donne bien en sortie pour chaque client une estimation des durées de vie (predtime, estimée d'après une liste de variables explicatives) mais j'ai l'impression qui la calcule seulement sur les 18 mois d'observations..
Merci pour ton aide ambrosio!!!
il faut choisir un modèle paramétrique, puis l'ajuster aux données par maximum de vraisemblance. Pour le choix de la distribution, tu peux t'aider de l'histogramme des valeurs non censurées, ou tu peux choisir une famille de distributions suffisament versatile. Weibull n'est pas un mauvais candidat. Pour l'estimation, il faut écrire la vraisemblance en tenant compte de la censure. Le fait d'avoir 66% de censurés n'est pas redhibitoire, j'ai moi-même fait un ajustement avec 100% de censure! Ce qui est plus embêtant, c'est le type de censure, ici censure à droite. Je serais étonné que tu aies une bonne précision sur la durée de vie moyenne dans ce cas.
J'ai représenté le LS et LLS et je retiens effectivement la loi de Weibull (mon LS n'est pas une droite, mon LLS a la tête d'une fonction affine).
Pour la suite, je suis perdue, comment estimer la courbe de survie par max. de vraisemblance?? Il n'y a pas un moyen de le faire avec le proc lifereg et d'avoir en sortie la courbe estimée?
Bon je crois que je viens de comprendre!!
La proc lifereg me sort pour chaque individu la valeur du xbeta si var explicatives il y a. Si, par exemple le modèle est de la forme:
Intercept = 2.5
Var1 = -0.3
Var2 = 0.06
Ai je le droit de calculer durée de vie = 2.5 -0.3xbeta + 0.06xbeta????
Merci pour ton aide!
si tu as observés et censurés alors la vraisemblance est
où est la densité deWeibull et sa fonction de répartition. Il reste à trouver le maximum de en
pour lifereg je ne peux pas t'aider, ne connaissant pas bien SAS.
et qu'est-ce que LS et LLS ?
j'en ai oublié un bout c plus exp(2.5 -0.3xbeta + 0.06xbeta).
Le LS c'est -log(survie) et le LLS c'est le log(-log(survie)), ce doit être la terminologie SAS.
Plutôt que de me lancer dans des calculs à la main, je vais essayer d'interpréter les sorties de la proc lifereg de SAS. Comme elle me file les valeurs de l'intercept et les coeff des var explicatives, je pense que je peux retrouver la valeur de la durée de vie.
ce "lifereg" ça serait pas du modèle de Cox par hasard? (si j'ose dire)
dans ce cas, aucun espoir d'obtenir une durée de vie moyenne, le modèle de Cox est précisément un modèle semi-paramétrique avec une forme non spécifiée de la fonction de survie. Donc pas de moyenne exprimable à l'aide des coefficients ajustés.
Non, non c'est bien une estimation paramétrique, le modèle de Cox se modélise avec la proc phreg sous SAS
Me revoilà avec mes histoires de durée de vie..
J'ai bien avancer depuis la dernière fois et réussi à interpréter les sorties de la lifereg de SAS. Pour une distribution exp. SAS donne l'estimation du paramètre λ donc pour avoir l'éspérance de vie il suffir de faire exp(λ). Pb pour Weibull, SAS me donne bien λ et α mais quelle est la formule pour calculer l'éspérance de vie???
Merci pour ton retour!
tout est là: http://fr.wikipedia.org/wiki/Distribution_de_Weibull
?? ben je comprends pas tou, c'est la formule de l'éspérance qu'il me faut? (à droite), dans ce cas ce'st quoi ce gamma?
Bon je viens de comprendre que l'espérance que je cherche est égale à l'intégrale de la fonction de survie, soit, pour la loi de weibull :
Intégrale de 0 à l'inf. de exp(-(alpha*t)**beta).
Pb, comment calculer cette intégrale?
Bonjour tout le monde!!!
Voila, je rencontre un gros problème avec mes données statistiques: je souhaiterais réaliser une anova à deux facteurs croisés sur des données de poids de poisson mais lorsque je créé mon modèle et tout, seul l'un des facteurs influant sur mes poissons est pris en compte (l'autre n'est pas dutout considéré par R).
Pouvez vous m'aider je suis vraiment en galère!!!
Merci