[traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

invitead2d9553 · 13/06/2015, 00h04

Bonjour,

Je suis en train de rédiger mon rapport de stage de M1 et j'avoue que là je piétine un peu pour savoir ce que je dois utiliser pour donner un peu de poids à mes résultats. D'autant plus que mon sujet ne nécessite pas vraiment de stats, c'est plus observatif et mon maître de stage ne m'a pas du tout aiguillée la dessus et s'est contenté de regarder et de dire qu'on voyait bien ce qu'on voulait voir (avec des N aussi faibles que les miens j'ai un peu du mal à être convaincue...).

Donc mes données se présentent sous la forme d'une suite de valeurs (continues) obtenues à partir de mesures à différents endroits d'une racine (toujours la même, le potentiel redox). En moyenne j'ai une suite de 6 valeurs. Ceci me donne une courbe avec en abscisse la zone et en ordonnées la valeurs.
J'ai plusieurs répétitions pour chaque zone (c'est à dire, j'ai testé plusieurs racines), de 2 à 7, mais le nombre de répétitions varie selon la zone (les calculs n'étaient pas faisables avec la mesure par exemple). Et j'ai plusieurs modalités (une fois je n'en ai qu'une). Donc face à ça je me suis dit, petit échantillon, pas de normalité, SNP, suite, Kruskal Wallis ? Mais je ne sais pas si je suis sur la bonne voie. Et notamment dans le cas où je n'ai qu'une modalité (et toujours un très faible N) je ne peux pas utiliser Kruskal Wallis.

Merci pour votre aide !

Lauriane

**Loupsio** · 13/06/2015, 12h05

Bonjour à toi,
Déjà pour te rassurer je tiens a dire que tu es sur la bonne voie

En effet si tu n'as pas de normalité des résultats, tu ne peux pas faire d'ANOVA et tu dois te replier sur kruskal
Après la valeur de ta stat de test n'a pas d'importance en premier lieu, ce n'est pas elle qui détermine si tu as un effet en fonction du lieu
une stat de test ne montre pas si il y a un effet, mais si il y a un effet elle montre la puissance de cet effet

en l'occurrence pour savoir si tu as un effet tu t’intéresse à la p-value si celle ci est inférieure a ton risque d'erreur de première espèce (souvent on le prend par convention a 0.05) alors tu as un effet facteur

Ta pvalue sert a modéliser le hasard, en l’occurrence si elle est de 0.001 par exemple, cela signifie que le hasard à lui seul (en l'absence d'effet de ton facteur) pourrait donner ce genre de résultats 1 fois sur 1000 ce qui est plutôt bon, si ta pvalue est de 0.5 ca veut dire que dans un cas sur deux, le hasard (sans aucun effet du facteur) peut permettre d'avoir ces résultats (la en l’occurrence on peut douter du fait qu'il y ait bien un effet et on se dit que ce que l'on voir est du au hasard, si un groupe est plus grand que l'autre, ce n'est que le fruit du hasard dans ce cas). c'est pourquoi on regarde la pvalue

C'est mieux d'avoir des répétitions pour chaque, un groupe ou tu n'a qu'un seul "patient" c'est dangereux, mais bon si tu peux pas faire autrement...

après, si tu as une pvalue inférieur a 0.05 (ou autre risque que tu aurais choisis si tu veux d'un risque inférieur ou supérieur a 5%) tu sais que ton facteur a un effet, mais tu veux savoir ou se situe l'effet (je ne sais pas quel est ton facteur, mais on va imaginer que tu mesure des racines en fonction du lieu, si c'est Nord sud est ouest)
tu as un effet mais ca ne veut pas dire qu'elles sont toutes différentes, peut être que sud, est et ouest sont identiques et juste nord est différent, du coup tu veux trouver où se situe ton effet
pour ca il te faut faire un post test, qui est un test de comparaison de moyennes deux a deux et qui va tous les tester. dans ce cas il s'agit du post test de dunns (car comme tu n'est pas en ANOVA je crois que tu ne peux pas utiliser les post test de Bonfferoni, Dunnet ou Tukey)

invitead2d9553 · 13/06/2015, 22h34

Bonsoir,

Merci pour la réponse très rapide !
Donc pour la question de la p-value, le risque etc, je suis assez familière (ou je m'y remettrais) ce qui me pose le plus problème c'est de savoir, à la vue de mes données, qu'est-ce qu'il faut que j'utilise selon ce que je veux obtenir ^^.

Du coup ce n'est pas possible de comparer deux séries de deux moyennes à effectif faible entre elles ? Il m'en faut au moins 3 ? (ça règle le problème du post test deux à deux) ?

Deuxième question, disons que je fais le test
Attendez, je vais essayer de représenter mes données pour qu'on soit sûrs de parler de la même chose

ex stat.jpg

Ca se représente sous forme de tableau mais également de courbe (sachant que c'était si facile d'ajouter une image j'aurais dû le faire dès le début)

Sans titre 1.jpg
==> chaque courbe est une courbe moyenne

Et donc je voudrais avoir une idée GENERALE de la position relative de ces courbes. Alors que si je fais un test statistique j'ai l'impression qu'on va me dire, zone 1, pas de différence, zone 3 une différence etc. Et que ça va être n'importe quoi -- mais je crois que je suis bien obligée

Parceque c'est bien ça, le test de Kruskal Wallis va me sortir une p-value pour chaque position de la série ?

C'est assez brouillon, merci de prendre le temps de me répondre

Lauriane

**Loupsio** · 13/06/2015, 23h47

Je n'ai pas compris ta première question, :"Du coup ce n'est pas possible de comparer deux séries de deux moyennes à effectif faible entre elles ? Il m'en faut au moins 3 ? (ça règle le problème du post test deux à deux) ?"

comment ca des series de deux moyennes a effectif faibles?
si tu parles du post test, quand je parle de comparaison deux a deux, si je reprend l'exemple des comparaison en fonction des points cardinaux, si ton test te dit qu'il y a un effet, tu ne sais pas enocre ou,
le post test comparera Nord-Sud ainsi que Nord-Est et Nord-Oest, Sud-Est Sud-Ouest et Est-Ouest et il te dira si pour chacunes de ces comparaisons il y a des differences ou pas
par exemple il te dira que entre tes reusltat au nord et tes resultats au sud, il y a une difirence significative, mais toutes les autres comparaison ne montrent pas de difference

Dans ton exemple, que represente l'axe des ordonnées?

Parceque c'est bien ça, le test de Kruskal Wallis va me sortir une p-value pour chaque position de la série ?

Non le test de kruskal te dira juste si tu observe des difference de je-sais-pas-trop-quoi-qui-represente-ton-axe-des-ordonnes soit entre les differente zones de la racine (si c'est ca que tu lui demandes), mais il ne te dira pas "ou" se trouvent ces difference

soit des differences pour une une zone en particulier en fonction du traitement que tu applique (mais encore une fois, sans te dire lesquels sont different entre les 3 traitements
la reponse a la question "ou est cette difference" c'est le post test de Dunns qui te le dit)
Dunns te dira par exemple que "control" et "5" sont different mais que "5" et 10" son identiques" pour telle zone racinaire ou alors que "control" et 5 sont pas differents ni 5 et 10, mais que controle et 10 sont différents

A voir en vidéo sur Futura · Aujourd'hui

invitead2d9553 · 13/06/2015, 23h59

Les ordonnées, pardon, ce sont des valeurs de potentiel redox.
Et ce que je veux savoir c'est si selon mes modalités (concentration en sel du milieu) le potentiel redox change. Du coup je suis intéressée de savoir si les valeurs sur chaque zone sont différentes selon la modalité.

Par rapport à ma question que tu n'as pas compris: tu disais que Kruskal wallis me disait s'il y avait une différence mais pas entre quelles modalités (ce qui implique qu'il y en a plus de 2), je demandais donc s'il n'y avait pas un test direct qui permettait de gérer une comparaison deux à deux d'une série de données moyennse (une courbe constituée de plusieurs points) résultant d'un faible nombre de répétitions. Mais bref, ça ne doit pas exister.

Mais du coup ton test de Dunns, me donne exactement ce que je veux. Je ne connais pas ce test, il faut forcément le faire après avoir vérifié qu'il y avait effectivement des différences via Kruskal ?

Et j'ai aussi une autre question, pour mettre en forme mes données pour que R les traite, je prends bien une mesure par ligne avec en colonne, modalité et valeurs, mais comment représenter la position ? Est-ce que je fais autant de lignes à la suite que de zones et ensuite je fais la même chose pour l'individu suivant et ses x zones ?

Merci bien

**Loupsio** · 14/06/2015, 11h32

Par rapport à ma question que tu n'as pas compris: tu disais que Kruskal wallis me disait s'il y avait une différence mais pas entre quelles modalités (ce qui implique qu'il y en a plus de 2), je demandais donc s'il n'y avait pas un test direct qui permettait de gérer une comparaison deux à deux d'une série de données moyennse (une courbe constituée de plusieurs points) résultant d'un faible nombre de répétitions. Mais bref, ça ne doit pas exister.

Nan bah je dois toujours pas avoir compris ^^ c'est exactement ce que fait le test de Dunns non?
Le fait est que si tu veux comparer deux moyennes, ya le test de Student, cepenant quand tu compare des tas de choses entre elles, deja faire plein de test de student ca serait long (donc autant faire une ANOVA qui fait tout d'un coup) mais surout en multipliant les test tu multiplie le risue d'erreur, c'est pourquoi tu dois utiliser une ANOVA qui te renvoi une pvalue corrigée et pas la pvalue normale, cette pvalue corrigée prend en compte le nombre de comparaisons effectuées
Cependant dans ton cas tu peux pas utiliser d'ANOVA donc tu fais une version approchée (kruskal wallis) mais ensuite si tu veux savoir ou se situent exactement les differences (le truc que tu disais que c'est pas possible de faire apparament) c'est le test de Dunns, seulement le test de Dunns peut te donner des differences a certains endroits quant ton test de kruskal te dit qu'il n'y a aucune différences (meme probleme qu'entre student et ANOVA je crois, le coup de la pvalue corrigée pour prendre en compte le nombre de comparaison) ducoup tu ne peux pas faire de test de Dunns tant que tu n'as pas fait kruskal car tu dois le faire uniquement quand tu es sure qu'il y a quelque chose de different dans le lot

pour mettre en forme sous R je ferais un tableau a 4 colonnes, une première colonne qui contiendrai le nom des zones, une deuxieme colonne qui contiendrait les valeurs du control une troisieme colonne avec les valeur du test a 5mM et une derniere avec les valeurs du test a 10 mM
$\text{[math]}$

Edit: tiens!!! la balise TeX ne marche pas? mon code devrait marcher pourtant, a moins que ca n'acepte pas le LaTeX, si quelqu'un sait pourquoi...

**Loupsio** · 14/06/2015, 12h34

Ok donc j'ai trouvé pk ca marchait pas ^^
donc pour ton tableau un truc comme ca serait bon :
$\text{[math]}$

tu organise ca dans un fichier .csv
et tu l'appel avec fichier=read.table('nomDuFichi er.csv',header=TRUE)
et voila

**Loupsio** · 14/06/2015, 12h47

A mince j'a pas pensé aux réplicats, ducoup tu peux faire trois tableaux
$\text{[math]}$
tu fais ca pour tes trois concentrations
et après:
control=read.table('fichierCon trol.csv',header=TRUE)
cinq=read.table('fichier5mM.cs v',header=TRUE)
dix=read.table('fichier10mMCon trol.csv',header=TRUE)
et c'est réglé

invitead2d9553 · 14/06/2015, 13h36

Ah très bien ! Je n'avais pas fait ainsi. Merci bien. Mais je peux pas faire avec un fichier excel ?

Du coup je vais me renseigner sur comment faire fonctionner tout ça avec R (il y a à coup sûr cela sur le net) et je reviens vers toi

Merci pour les explications !

**Loupsio** · 14/06/2015, 14h06

.csv est un format lisible par excel, tu peux voir ton tableau comme n'importe quel fichier excel, mais c'est aussi interprétable par R,
Je ne sais pas comment tu avait fait ton tableau, mais si c marche aussi, tu peux y aller, ce ne sont que des propositions de présentation que je t'ai mis, mais peut etre que ta représentation est tout aussi pratique

pour le format csv, tu ouvres excel, tu fais ton tableau et quand tu enregistre tu ecris juste a la fin ".csv' au lieu de ".xls"

invitead2d9553 · 14/06/2015, 15h06

Bon... Je n'arrive à rien (à part à faire lire mes données par R !). En lisant des trucs sur Kurskal Wallis je me dis de plus en plus que ce n'est pas ce qu'il me faut. Parcequ'en fait je ne vois pas comment il va faire pour prendre en compte mes zones ! Mon zonage ne serait par ailleurs pas un deuxième facteur en plus de la concentration en sel ?

Dans tous les exemples sur lesquels j'essaye de m'appuyer, il n'y a pas cette histoire de zone, de rang ...
Et puis pourquoi je dois mettre ça dans 3 fichiers différents ?

Enfin bref, je ne comprends rien, ça fait longtemps que je n'ai pas utilisé R alors ça n'arrange rien.

Le fichier pour 1 facteur

Sans titre 1.jpg

Le résultat dans R

Sans titre 2.jpg

Merci

invitead2d9553 · 14/06/2015, 15h30

Bon, me doutant bien que c'est le format de mes données et l'utilisation de R qui me pose problème, j'ai fait un test en rentrant manuellement mes données pour 1 seule zone et en comparant cette zone entre les trois facteurs (control, 5mM, 10mM).
Et du coup ça me donne ça.

Nom : Sans titre 56.jpg
Affichages : 234
Taille : 31,1 Ko

Nom : Sans titre 56.jpg
Affichages : 234
Taille : 31,1 Ko

J'en déduis donc qu'il n'y a pas de différence entre mes échantillons au seuil de 5%. Par contre le fait que dans mes vecteurs il n'y ait pas le même nombre de répétitions (j'ai quand même mis des NA avant de m'en apercevoir ahha) change-t-il quelque chose ?

Si c'est la bonne méthode mais juste chiante (je dois faire ça pour mes 12 zones et je n'ai pas que cette expé à traiter de cette manière

), je crois que je vais faire ça, parceque je ne sais pas comment faire pour que R comprenne qu'est-ce qu'il doit comparer avec Kruskal.

Merci

**Loupsio** · 14/06/2015, 16h04

lol pour ton probleme sur R, essai ca:
fichier=read.table('nomDuFichi er.csv',header=TRUE,sep=';')

la piece jointe est en attente de validation, sinon

pour tester tes données avec kruskal sur R tu dois avoir quelque chose qui ressemble a ca non?:
kruskal.test(taille~zone) ou (kruskal.test(zonex~traitement ) si tu compart les traitement pour une même zone)
avec le vecteur taille qui contienne toutes tes tailles, par exemple 3replicat du control ainsi que 3 replicat de 5mM et 3 réplicat de 10mM
et le vecteur traitement qui soit quelque chose du genre : control,control,control,5,5,5, 10,10,10

pour ca ton tableau doit ressembler a ca :

$\text{[math]}$

et ton code R doit ressembler à cela
fichier=read.table('nomDuFichi er.csv',header=TRUE,sep=";")
zone1=fichier[,3:length(fichier[1,])][fichier$zone=='zone1']
traitement=fichier$traitement[fichier[,2:len(fichier[1,])]=='zone1']

je l'ai pas testé, mais ca devrait marcher, si ca marche pas c'est pour un detail a la noix que mon cerveau pouvait pas gerer en le simulant dans ma tete, sans directement l'essayer

ducoup si ca te renvoi une erreur, essaie de m'envoyer ton fichier (tableau au format csv) et je testerai pour voir ou se situe le probleme

invitead2d9553 · 14/06/2015, 16h20

Ah mince pour la pièce jointe.
C'est la première fois que je vois ce format pour le test de Kruskal, mais je comprends que ça dit (y~x) y par rapport à x. Et taille pour toi qu'est-ce que c'est ?

Bon je commence à comprendre, je vais essayer de faire ça !

Dans ton tableau en vertical tu mets 3 fois d'affilé contrôle, 5 et 10 c'est une erreur de compréhension de ta part non ? Car mes réplications pour la zone 1 sont à l'horizontale. (Enfin c'est pas facile quand on ne fait a pas le jeu de données sous les yeux ^^)

Merci

**Loupsio** · 14/06/2015, 16h28

Envoyé par Lauriane

Enfin c'est pas facile quand on ne fait a pas le jeu de données sous les yeux ^^

Oui je te le fais pas dire ^^
en l'occurence j'ai fait un mix des deux possibilité, (par erreur)
donc soit les replicats en lignes (d'ou le fait qu'il y ai trois lignes de chaques, mais il te faudrai autant de lignes que de réplicats), soit les replicats en differentes colonnes,
la le tableau que j'ai fait c'est comme si yavai 12 réplicats pour chaque
au final je te conseil de mettre les replicats en lignes (et donc une seule colonne de valeurs, pas 4)

et le code ressemblerais a ca:

fichier=read.table('nomDuFichi er.csv',header=TRUE,sep=";")
zone1=fichier[,3][fichier$zone=='zone1']
traitement=fichier$traitement[fichier[,2]=='zone1']

kruskal.test(zone~traitement )

C'est la première fois que je vois ce format pour le test de Kruskal, mais je comprends que ça dit (y~x) y par rapport à x. Et taille pour toi qu'est-ce que c'est ?

c'est pourtant le format le plus pratique je trouve, ^^ enfin plus pratique que de mettre une liste

il s'agit bien de y~x, c'est pourquoi je met zone~traitement puisque "x" c'est ce que tu fais varier, et "y" ce que tu regarde, ici tu fais varier le traitement, et tu regarde la taille (pour telle zone racinaire donc appelée "zone1" pour la premiere zone)

invitead2d9553 · 14/06/2015, 17h02

Ah j'ai compris c'est bon

Par contre je ne comprends pas totalement ta ligne traitement=fichier$traitement[fichier[,2]=='zone1']

Pourquoi est-ce que tu l'associes à la zone 1 ? Faut-il à chaque fois le redéfinir pour chaque zone à tester ?

On pourrait pas justement lui dire de faire zone1~traitement ? (vu qu'il y a une colonne traitement il connaît) ?

**Loupsio** · 14/06/2015, 17h13

Par contre je ne comprends pas totalement ta ligne traitement=fichier$traitement[fichier[,2]=='zone1']

Déja, est ce que tu l'a testé? est ce que ca marche?

en gros c'est parce que ici tu veux (dans ce cas) comparer s'il y a des différences entre les différents traitements pour une même zone
c'est surement possible de mettre toutes les zones d'un coup, mais je procede etape par etape comme je ne test pas le code que je te donne jusqu'a la et que je fais ca de tete, si je me lance dans des trucs trop compliqué du premier coup, ca va merder, il me faudrai les valeurs pour te faire un truc qui compare d'un coup toutes les zones et tout les traitements,

pour l'instant ca c'est pour les differents traitements dans une zone en particulier, tu peux faire la meme pour les autres zones en lancant une boucle

le plius rapide serait que dans ton tableau la premiere colonne ne soit pas remplie de "zone1" "zone2"... mais de "1", "2"... et comme ca tu met ca dans une boucle en mode

while (i<6){ #6 c'est pour si tu as 6 zones, mais remplace par le nombre de zones
traitement=fichier$traitement[fichier[,2]==i]
#pareil pour l'autre vecteur tu remplace le 'zone1' par un i
kruskal.test(comme tout a l'heure)
i=i+1
}

et avec ca il te lance autant de test que tu as de zone racinaires en une seule fois, mais apres tu dois pouvoir aussi faire un truc qui compare tout sans boucle, mais la faudrai que j'y reflechisse un peu pluss et il me faudrai tes valeurs

**Loupsio** · 14/06/2015, 17h21

AH et j'ai oublié, avant le while tu dois initialisé "i" quand meme avec :
i=1
while (i<6){ #6 c'est pour si tu as 6 zones, mais remplace par le nombre de zones
traitement=fichier$traitement[fichier[,2]==i]
#pareil pour l'autre vecteur tu remplace le 'zone1' par un i
kruskal.test(comme tout a l'heure)
i=i+1
}

invitead2d9553 · 14/06/2015, 17h24

Je vois, je pensais en fait que le test de Kruskal pouvait comparer tout directement c'est pour ça ^^ Faire pour chaque zone ça m'ira très bien ^^

Et donc, non ça ne marche pas !

z1=data[,3][data$zone=='1']
> traitement=data$traitement[data[,2]=='1']
> traitement
factor(0)
Levels: 10mM 5mM control
> kruskal.test(zone~traitement)
Error in eval(expr, envir, enclos) : objet 'zone' introuvable
> kruskal.test(z1~traitement)
Error in model.frame.default(formula = z1 ~ traitement) :
les longueurs des variables diffèrent (trouvé pour 'traitement')

J'ai donc vérifié si tous mes facteurs avaient le même nombre de répétition, vu que ça semble être le problème, mais oui.

**Loupsio** · 14/06/2015, 17h29

Je vois, je pensais en fait que le test de Kruskal pouvait comparer tout directement c'est pour ça ^^ Faire pour chaque zone ça m'ira très bien ^^

oui oui je pense qu'il peut, mais la ya un truc en deux dimensions et en rajouter une (les differentes zones) doit etre possible, mais raisonner en autant de dimensions est un peu trop pour moi là ^^

Et donc, non ça ne marche pas !

Ouai c'est parce que il a rien enregistré dans 'traitement' je crois,
tu peux m'envoyer ton tableau que je test ca de mon coté avec tes trucs? (MP la piece jointe ca ira peut etre plus vite, sinon faut attendre la validation)

**Loupsio** · 14/06/2015, 17h58

Ok premier truc,
tu te trimballe des NA partout, l'avantage de mettre en ligne tes replicats c'est de se debarasser des NA car tu as autant de lignes que de valeurs t'es pas censée avoir de lignes sans valeur, si t'as moin de replicat pour tel truc, ca te fais des lignes en moins, mais pas une ligne avec tout sauf la valeur
par exemple zone 1 controle, t'as que deux valeurs, tu n'as donc pas besoins de 7lignes, contente toi de deux lignes
zone 1 5mM tu n'as aucunes valeurs.... c'est louche qu'il y en ai aucunes car ducoup tu peux pas comparer tes differents traitement de 5mM au control.... mais bref si t'as pas de valeurs, pareil ces lignes tu les supprimes
une fois que tu n'as que des lignes utiles tu peux continuer

ensuite il y avait une erreur (surement moi qu'ai mal nommé la colonne ^^)
traitement=data$traitement[data[,2]=='1'] faut le remplacer par :
traitement=data$traitement[data[,1]=='1']

en grosau final on a un code qui marche qui doit ressembler a ça :
fichier=read.table('dataNaCl.c sv',header=TRUE,sep=";",dec=', ')
zone=fichier[,3][fichier$zone=='1']
traitement=fichier$traitement[fichier[,1]=='1']

kruskal.test(zone~traitement)

sionn si on ajoute la boucle ca te donne ca:

fichier=read.table('dataNaCl.c sv',header=TRUE,sep=";",dec=', ')
i=1
while (i<=12){
zone=fichier[,3][fichier$zone=='1']
traitement=fichier$traitement[fichier[,1]=='1']
print(i)
print(kruskal.test(zone~traite ment))
i=i+1
}

et il t'a normalement renvoyé 12 test de kruskal pour chacune de tes 12 zones en fonction des differents traitements

**Loupsio** · 14/06/2015, 18h13

Erratum, la boucle t'es censé avoir ca :

fichier=read.table('dataNaCl.c sv',header=TRUE,sep=";",dec=', ')
i=1
while (i<=12){
zone=fichier[,3][fichier$zone==i]
traitement=fichier$traitement[fichier[,1]==i]
print(i)
print(kruskal.test(zone~traite ment))
i=i+1
}

sinon ca te fasait 12 fois le meme test ^^
et je ne sais pas pourquoi, j'ai beau editer , a chaque fois la fenetre du forum me fou des espaces entre certains mots, donc fais attention avec le copier coller, il peut y avoir des espace la ou il doit pas y en avoir, par exemple entre le "c" et le "s" de "DataNaCl.csv" il m'en remet un a chaque fois

invitead2d9553 · 14/06/2015, 18h48

Oui j'avais remarqué pour les espaces !

Bon bah du coup ça marche super merci beaucoup

Et pourquoi il fallait changer traitement=data$traitement[data[,1]=='1'] ?

Parceque le datA[,1] fait référence à l'emplacement des zones et non du traitement ?

Mais est-ce que je peux utiliser le test quand il n'y a que deux modalités à comparer (control et 10mM) ? (j'avais lu quelque part qu'il en fallait au moins 3 pour Kruskal)

**Loupsio** · 14/06/2015, 18h59

Et pourquoi il fallait changer traitement=data$traitement[data[,1]=='1'] ?

Parceque le datA[,1] fait référence à l'emplacement des zones et non du traitement ?

car le fait que tu lui dise data$traitement, il sait qu'il va récuperer la colonne "traitement", mais il va en l'occurence les récuperer toutes, sauf que tu veux qu'il ne récupere cette colonne que pour les valeurs pour lesquelles on est dans la premiere zone de la racine
donc en gros avant ca disait : "recupere la colonne traitement pour toutes les valeurs ou la colonne traitement est egale a 1"
alors que ce qu'on veut lui dire c'est : "recupere la colonne traitement pour toutes les valeurs ou la colonne zone correspond a la premiere zone"

Mais est-ce que je peux utiliser le test quand il n'y a que deux modalités à comparer (control et 10mM) ? (j'avais lu quelque part qu'il en fallait au moins 3 pour Kruskal)

bah si par "modalité" tu entend bien "nombre de facteurs" alors oui si tu en as que deux ca revient a un test de Student,
mais si par "modalité" tu entend "réplicat" c'est différent, car j e crois que des fois tu as deux réplicats uniquement mais tu as tes trois modalitées partout non?

Edit : Ah non c'est vrai qu'il y en a un ou tu n'as pas de valeur pour 5mM,

Edit2: Au fait après ca oublie pas de faire les post test,

invitead2d9553 · 14/06/2015, 19h26

Très bien très bien...
Du coup j'aurais le droit de faire un test de student pour ce cas particulier où je n'ai que 2 modalités ? Parceque je n'ai aucune normalité ni homocédasticité...

Donc j'ai essayé de faire le test de Dunn's et ça a donné quelque chose, mais je ne suis pas sûre de l'avoir correctement posé.

> z3=data[,3][data$zone=='3']
> traitement=data$traitement[data[,1]=='3']
>
> dunn.test(z3,g=traitement, method="none", kw=TRUE, label=TRUE, wrap=FALSE, rmc=FALSE, alpha=0.05)
Kruskal-Wallis rank sum test

data: z3 and traitement
Kruskal-Wallis chi-squared = 7.8485, df = 2, p-value = 0.02 (#donc là ça me retrouve presque la même valeur#)

Comparison of z3 by traitement
(No adjustment)
Col Mean-|
Row Mean | 10mM 5mM
--------- +----------------------
5mM | -2.771609
| 0.0028
|
control | -1.644879 0.921132
| 0.0500 0.1785

C'est la cata ce tableau

mais en gros
pour 10mM et 5 mM
-2.771609
0.0028

pour 10mM et control
-1.644879
0.0500

pour 5mM et control
0.921132
0.1785

Nom : Sautre 1.jpg
Affichages : 272
Taille : 47,2 Ko

Nom : Sautre 1.jpg
Affichages : 272
Taille : 47,2 Ko

Les p-values sont les nombres... les plus petits ? Ceux qui sont "en dessous" ? Et du coup ceux avec des (-) représentent quoi ?

**Loupsio** · 14/06/2015, 19h42

pour le post test j'utilise la librairie pgirmess, tres simple d'utilisation et de comprehension
pour la lancer tu tape :
library(pgirmess)

ensuite
kruskalmc(zone~traitement)

ca te renvoi des vrais ou faux en fonction de si t'as un effet ou pas

invitead2d9553 · 14/06/2015, 19h49

Multiple comparison test after Kruskal-Wallis
p.value: 0.05
Comparisons
obs.dif critical.dif difference
10mM-5mM 6.500000 5.614380 TRUE
10mM-control 4.166667 6.064224 FALSE
5mM-control 2.333333 6.064224 FALSE
>

Super merci !

On ne connaît pas la p-value ? Parceque même si c'est légèrement supérieur, c'est quand même indicatif.

**Loupsio** · 14/06/2015, 20h03

oui alors par contre c'est pas super logique, t'as pas de difference entre 0 et 10 par contre t'as une difference entre 5 et 10?
t'es sur quelle zone? apres verifie avec ton graph si c'est coherent, par exemple si tu vois une réponse faible a 0, une reponse legerement superieure a 5 et encore superieur a 10 alors alors si ya une difference entre 5 et 10 il devrait aussi y en avoir une entre 0 et 10
mais si 0 et 5 sont tres proche et que 0 est plus proche de 10 que 5 n'est proche de 10 alors oui ca serait coherent,

c'est juste que la comme ca on s'attendrait a un effet dose-réponse et donc que si yai un effet different entre 5 et 10 on s'attend a ce qu'il y en ai un aussi entre 0 et 10, mais a comparer avec le graph....

bien souvent aussi ce que je fais c'est que je verifie avec l'ANOVA, dans ce cas elle est moins precise mais ca permet de vir si on a bien des resultats sensiblement equivalent (bien que la on puisse ptet voir des truc que l'ANOVA aurait pas vu ou que l'ANOVA nous aurait montré quelque chose la ou il n'y a rien car l'absence de normalité induis un biais, mais on est pas censé avec un truc non plus completement différent)

invitead2d9553 · 14/06/2015, 20h27

Oui j'ai bien vu le bug, c'est parceque 10mM est au dessus du controle et 5mM en dessous, la différence au controle est faible, mais entre elles, importantes. Mais du coup je pense quand même que je ne peux pas conclure, parceque ce n'est pas différent du contrôle quoi ...
Mais du coup justement ça aiderait d'avoir la p-value avec ton test parcequ'avec le test que j'avais fait il y avait quelque chose de presque différent entre control et 10mM.

La tête du graph c'est celle ci (et donc on s'attend à une plus grande différence entr controle et 5mM plutôt qu'en controle et 10mM...)

Nom : graph.jpg
Affichages : 243
Taille : 43,1 Ko

Nom : graph.jpg
Affichages : 243
Taille : 43,1 Ko

**Loupsio** · 14/06/2015, 20h31

c'est pas un bug ^^ et si en plus tu dis que c'est coherent avec le graph, c'est bien qu'il y a un effet a cet endroit,

pour la pvalue je crois que tu peux l'avoir avec un summary ou quelque chose comme ca, mais de toute facon ca change rien, si tu as choisis ton risque a 5% au debut tu peux pas dire "c'est 0.006 je prend quand meme" ou "0.049 c'est proche de 0.05 je vais rejetter parce que ca m'arrange"

[traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

[traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Re : [traitement stats de données perso]Faible N, Stats non param, Kruskal Wallis ?

Discussions similaires

Histogramme, stats et représentations de données

Quel langage pour bases de données, stats et user interface

Kruskal-wallis

[Biochimie] [stats] Puissance Wilcoxon pour données appariées

Test de kruskal-Wallis