Statistique pour mémoire, comparaison intra groupe.
Répondre à la discussion
Affichage des résultats 1 à 14 sur 14

Statistique pour mémoire, comparaison intra groupe.



  1. #1
    inviteb387eb22

    Statistique pour mémoire, comparaison intra groupe.


    ------

    Bonsoir,

    Depuis plusieurs jours, je passe mon temps à tenter de faire mes stats pour mon mémoire... en vain !
    J'ai avancé, certes, mais je bloque sur un tas de chose, en Sciences Humaines en manque vraiment de cours de stats, de plus je m'aperçois en fouillant sur le web que les notions qu'on utilise en Sciences Humaines n'ont pas la même définition dans les statistiques... du coup, c'est le flou total !

    Pour le moment, j'aimerais réussir à faire une comparaison les performances aux tests A et B et à l'intérieur de mon groupe de patients. C'est donc une comparaison de moyennes intra groupe, mais apriori... on peut pas comparer de moyennes intra groupe, il faut que je me dirige vers une analyse de variance? J'ai beau lire des définitions, je ne sais pas du tout à quoi ça correspond, j'ai jamais entendu parler d'homéoje sais plus quoi...
    Par la suite, je vais décomposer mon groupe en deux, mais je veux tout d'abord effectuer cette comparaison de moyenne à l'intérieur de mon groupe. Or sur internet, ca parle toujours de comparaison entre échantillons appariés ce qui ne correspond pas du tout à mon étude. Comment dois je procéder?
    Sachant que n = 54, je ne suis théoriquement pas obligé de m'assurer de la normalité avec shapiro, n'est-ce pas?

    Merci pour toute l'aide que vous pourrez m'apporter !

    -----

  2. #2
    gg0
    Animateur Mathématiques

    Re : Statistique pour mémoire, comparaison intra groupe.

    Bonjour.

    ta question est un peu floue, mais je me demande si que ce que tu veux faire est
    * de la statistique descriptive : Tu as une population de 54 patients et tu veux faire une comparaison des moyennes de ces 54 à deux tests. Alors tu as les vraies valeurs et il suffit de regarder;
    * de la statistique inférentielle, pour extrapoler à une population plus large à partir de ton échantillon, supposé représentatif : Alors un test apparié (*) conviendra, Wilcoxon ou même Student apparié puisque l'effectif est assez large. Tu sauras alors si la différence de moyenne constatée est significative ou pas.

    Cordialement.

    (*) apparié vient du fait que ce sont les mêmes individus qui répondent aux deux tests, donc les réponses au deuxième test ne sont pas indépendantes de celles du premier.

  3. #3
    inviteb387eb22

    Re : Statistique pour mémoire, comparaison intra groupe.

    Merci de ta réponse !

    Si je m'en tiens à ta définition ( bien plus compréhensible que ce que je vois sur internet...), je cherche donc à comparer deux moyennes d'un échantillon apparié (?). Ca me semble étrange de parler d'un échantillon apparié, si j'ai un seul échantillon, il est forcément apparié... Non?

    Le calcul des moyennes ne me posent pas de problèmes, j'obtiens :
    A = 11,59
    B = 10,76

    Mais comment savoir si cette différence est significative?
    Selon ce que je comprends, je dois faire un test de Wilcoxon ou Student comme tu me dis, mais ces tests sont rangés dans les tests non paramétriques dans R, or théoriquement (selon mes cours) avec n > 30 j'ai une population qui suit la loi normale. C'est pas logique pour moi...

  4. #4
    gg0
    Animateur Mathématiques

    Re : Statistique pour mémoire, comparaison intra groupe.

    Tu n'as pas un échantillon, mais 2 : Tu as bien 2 séries de données pour les mêmes personnes. l'échantillon est l'ensemble des réponses (ici les notes à un test) que tu vas traiter.

    Autre chose : le test de Student est bien un test paramétrique. N'importe comment, ici, ce qui compte c'est l'efficacité du test, et Student apparié est plus puissant que Wilcoxon apparié.

    "comment savoir si cette différence est significative? " Ben justement, en faisant le test.

    Cordialement.

  5. A voir en vidéo sur Futura
  6. #5
    inviteb387eb22

    Re : Statistique pour mémoire, comparaison intra groupe.

    D'accord ! Là, je comprend mieux la définition. Merci beaucoup pour tes précisions.

    Après réalisation du T de student, j'obtiens avec R :

    data: Dataset$Score.A and Dataset$Score.P
    t = -8.7565, df = 52, p-value = 1
    alternative hypothesis: true difference in means is greater than 0
    95 percent confidence interval:
    -0.9633401 Inf
    sample estimates:
    mean of the differences
    -0.8086792
    Sachant que mon hypothèse H0 était Score A > Score P.
    Donc p-value = 1 > 0.05, donc mon hypothèse est conservée
    Donc j'ai bien une moyenne Score A > moyenne score B.

    Question : est ce normale que mon p-value est égale à 1 ? Je pensais que la valeur devait être entre 0 et 1.
    Est-ce qu'on peut m'expliquer à quoi correspond mean of the différence?

  7. #6
    gg0
    Animateur Mathématiques

    Re : Statistique pour mémoire, comparaison intra groupe.

    Tu es sure que H0 était "Score A > Score P." ? En général un test de Student a comme hypothèse une égalité de moyennes.
    la valeur 1 pour la p-value est un arrondi. Elle ne permet pas de rejeter l'hypothèse H0, ce qui ne veut pas dire que H0 est vraie. Cependant avec une p-value de 1, on a une très forte corroboration de H0.
    Pour comprendre la suite, il faudrait avoir le mode d'emploi du logiciel, mais le test de Student apparié travaille avec les différences (ici note 1-note2) et "mean of the differences " est la moyenne de ces différences. Probablement.

    Cordialement.

    J'espère que tu t'y retrouve avec les explications différentes sur au moins 3 forums !
    Dernière modification par gg0 ; 10/04/2013 à 20h50.

  8. #7
    inviteb387eb22

    Re : Statistique pour mémoire, comparaison intra groupe.

    Si je me réfère à mes cours, j’ai posé H0 = Score A > Score P.
    Donc H0 = Score A – Score P > 0 ; j’ai donc sélectionne Différence > 0 sur R.
    Comme on ne rejette pas H0, je (logiquement) la conserve, ce qui veut dire si mon raisonnement est juste qu’on a bien une différence entre le score A > Score P. Une différence que je peux juger importante puisque mon p-value est à 1.

    Je te cite « un test de Student a comme hypothèse une égalité de moyennes » donc si j’essaie de comprendre ton raisonnement (possible que je me trompe, je cherche à comprendre), ca veut dire que pour toi H0 = Score A ≠ Score P
    H0 = Score A – Score P ≠ 0.
    Ce que je peux faire avec R en le sélectionnant « two-sided », mais si j’extrapole (et je me demande si j’ai le droit ?) en suivant ce raisonnement, si je trouve une différence entre A et P, je peux tout aussi bien en déduire que Score A > Score P ou c’est plus compliqué que ça ?
    J’avoue que procéder ainsi serait plus simple mais avec les stats c’est jamais aussi simple je crois (enfin tout dépend pour qui, je parle pour moi).

    Comme tu vois, je cherche vraiment à comprendre ce que je suis en train de faire.

    (merci beaucoup de prendre le temps de me répondre)

  9. #8
    inviteb387eb22

    Re : Statistique pour mémoire, comparaison intra groupe.

    Excusez moi, je me suis trompé dans mon raisonnement, si c'est une égalité alors H0 : Score A = Score P
    H0 = Score A – Score P = 0.
    Du coup, si ma différence est significative, pvalue > 0.05 : H0 conservée, ce qui veut dire que... Score A = Score P.
    Si H0 est rejeté, est-ce que je peux en déduire que Score A > Score P ?

  10. #9
    gg0
    Animateur Mathématiques

    Re : Statistique pour mémoire, comparaison intra groupe.

    Tu as fait le test à la main ? Avec quel modèle, vu que tu ne connais pas la différence ?
    Ou bien tu as sous-traité à un logiciel, qui se moque bien de ce que tu as posé et fait un test préparé. Dans ce cas, il faut que tu saches ce que veut du=ire l'option "Différence > 0 " que tu as sélectionné. Comme je ne vois pas comment cela pourrait être l'hypothèse H0 (faute d'être utilisable) c'est probablement l'hypothèse alternative. mais étudie le mode d'emploi de 'R'.

    Classiquement un test de Student prend H0="égalité des moyennes" contre H1 qui peut être soit "moyennes différentes", soit moyenne 1 > moyenne 2, soit moyenne2 > moyenne 1.

    Pour utiliser un logiciel de statistiques, il faut :
    * Connaître les stats qu'on utilise
    * connaître le fonctionnement du logiciel.
    Sinon, on obtient n'importe quoi. C'est d'ailleurs le cas de tout système informatique d'aide. Que d'erreurs d'élèves "c'est la calculatrice qui le dit" !!!

    Donc il te faut étudier et les tests d'hypothèse (généralités, tests de comparaison - Student-) et les spécifications de 'R' (aide en ligne ou textes de présentation et modes d'emploi).

    Bon travail.

    NB : Tu cherches à comprendre, mais c'est difficile de t'aider sans voir vraiment ce que tu fais ! je travaille ici sans filet.

  11. #10
    inviteb387eb22

    Re : Statistique pour mémoire, comparaison intra groupe.

    Non, je n'ai pas fais le test à la main. Avec autant de sujets, je risque de faire une erreur de calcul et je serais pas plus avancée.

    Dans mes cours ( où l'on utilisait R), on utilisait l'hypothèse H0. Donc pour moi, R prend l'hypothèse H0. Sauf que ces cours se limitaient à l’application de tests (très très bateau), résultats quand on travaille sur ses propres hypothèses c'est très compliqués. Je suis sur ce travail depuis plusieurs jours de manière acharnée et crois moi, je passe énormément de temps sur les tutoriels, les diapos mis en ligne sur internet, sauf que voila, ca ne correspond pas à ce que je vois dans mon étude et ces stats sont très statisticiens (ce n'est pas une insulte) mais pour un non-initié le jargon est difficile à connaitre. D'autant plus, qu'à nouveau, je le dis, j'ai l'impression qu'entre mes cours et internet on a pas le même jargon du coup ça m'embrouille encore plus. Notamment sur les critères pour utiliser les tests...

    Je vais recommencer à potasser R, mais je doute très sérieusement d'arriver à l'insight qui va me faire tout comprendre d'un coup.
    As tu un site en particulier à me conseiller?

    Pour répondre à ton NB, j'ai 17 variables dans mon expé et pas mal d'hypothèse à vérifier dans mon échantillon totale et aussi dans chacun de mes groupes divisés. Je pourrais expliquer en quelques lignes toute la complexité de mon expérience, je le ferais sans hésiter, sauf que voila, c'est pas simple, c'est long, complexe et pas franchement interessant. (D'autant plus que je t'assure ressentir un fossée entre les stats Sciences Humaines made in fac et tout ce que je vois sur internet). Je demande de l'aide (et je te remercie encore d'avoir la gentillesse de me répondre), mais je veux pas tout balancer mes travaux et appliquer des formules sans comprendre ce que je fais (bien que cela soit très très tentant). J'aimerais comprendre comment analyser correctement mes résultats et sans prendre autant de temps (le mien et encore plus celui des autres).

    Merci encore de tes réponses, même si j'avoue ne pas en comprendre entièrement le contenu (notamment pour cette histoire de H0, je me suis corrigé convenablement?)
    Pour ce soir, j’abandonne, j'espère parvenir à comprendre sans trop en demander (mais je le répète c'est pas simple pour moi....).
    Désolé pour le roman.

  12. #11
    gg0
    Animateur Mathématiques

    Re : Statistique pour mémoire, comparaison intra groupe.

    Rapidement :

    Il semble effectivement y avoir une certaine distance entre la façon d'utiliser les statistiques en sciences humaines et la façon dont elles se sont constituées. Parfois même (je le vois souvent dans des questions d'étudiants) il s'agit même d'un simple habillage pseudo-scientifique de convictions préalables (ça devient scientifique parce qu'on a fait des calculs). Il est vrai qu'on travaille souvent en sciences humaines avec des échantillons non représentatifs, faute de pouvoir faire mieux. Sans parler des habitudes de langage genre "variables dépendantes" pour "variables expliquées", alors que la dépendance est une notion statistique de base !
    Pour R je ne connais pas, mais pose la question sur le forum des statistiques, tu auras des réponses.
    Enfin, pour H0, le problème est que R ne fait pas ce que tu as dans la tête, mais ce pourquoi il est programmé. Comme tous les logiciels. Par exemple le logiciel de ton collègue a bien pris comme H0 : "pas de différence de moyenne" puisqu'il dit explicitement "alternative hypothesis: true difference in means is greater than 0 " c'est à dire "H1 est la vraie différence entre les moyennes est strictement positive".
    A savoir : H0 est toujours une hypothèse très précise du style telle valeur vaut tant, à partir de laquelle on peut construire un modèle explicite. "les valeurs du premier échantillon sont supérieures en moyenne à celles du second" est bien trop floue pour donner un modèle à utiliser.

    Cordialement.

    NB : Ma référence est généralement "probabilités, analyse de données et statistiques" de Saporta. Si tu peux l'emprunter dans une BU, fais-le, il est mathématisé sans trop, et est écrit par un vrai praticien des statistiques pour les praticiens des statistiques.

  13. #12
    inviteb387eb22

    Re : Statistique pour mémoire, comparaison intra groupe.

    C'est plus une marche, mais un véritable fossé....

    Ta référence n'est pas disponible à ma BU, est-ce que tu aurais d'autres livres ou des références sur internet?
    Merci d'avance.

  14. #13
    gg0
    Animateur Mathématiques

    Re : Statistique pour mémoire, comparaison intra groupe.

    Le mieux est d'explorer ta BU. Sur Internet, je ne connais rien de simple, et les documents qui m'ont intéressé sont plutôt mathématisés.

    Bonne chance !

  15. #14
    inviteb387eb22

    Re : Statistique pour mémoire, comparaison intra groupe.

    Bonsoir,

    J'ai avancée dans mes stats, et je me pose des questions lors de ma comparaison entre mon groupe A ( n =20) et mon groupe B (n = 34).
    J'ai décidé d'utiliser le T de Student, mais toutes mes variables ne suivent pas une loi normal, devrais-je opté pour le Mann-Whitney ?

    Par ailleurs mon tableau du T, me permet d'obtenir deux p, p et un p variances. Lequel dois-je interpréter? Apriori, d'après les résultats sur Statistica, je devrais prendre"p" mais je ne comprend pas trop à quoi correspond le "P Variances". C'est le P de la dispersion.. ?

Discussions similaires

  1. Aide statistique pour mémoire
    Par invitec1124ca1 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 22/03/2013, 19h14
  2. Test statistique de comparaison d'échantillons
    Par invite1a32c724 dans le forum Mathématiques du supérieur
    Réponses: 3
    Dernier message: 24/12/2012, 04h43
  3. statistique pour un mémoire
    Par inviteeda0fba7 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 19/04/2011, 10h34
  4. Statistique : Test de Comparaison de deux proportions
    Par invite3a28dcc6 dans le forum Mathématiques du supérieur
    Réponses: 5
    Dernier message: 23/01/2006, 20h50