Bonjour à tous,
J'aurais une petite question de statistiques sur R... Malheureusement mes cours remontent à loin et je ne les ai plus sur moi...
Je suis en train d'essayer d'expliquer la surface foliaire totale de plantes (cacahuètes) à l'aide de différents paramètres (génotype, traitement, mais aussi : position dans la serre et interaction entre tous ces paramètres)
Le problème c'est que je ne sais pas quel modèle choisir !
J'ai fait cela pour commencer :
Modèle le plus généraliste (tous les paramètres et toutes les interractions)
modele=lm (TLA ~ Genotype*Block*Treatment*posit ionH2*positionV2*positionH1*po sitionV1 , data = stat)
Et j'ai ensuite essayer de réduire le nombre de paramètres en comparant avec des modèles avec moins de paramètres :
(par exemple :
modele0=lm (TLA ~ Genotype*Treatment*positionH2* positionV2 + positionH1*positionV1 , data = stat) )
et ensuite je compare en faisant anova(modele,modele0)
Mais je trouve que c'est pas très facile et très concluant...
(à la fin, par élimination je trouve un modèle seulement expliquer par des interactions )
Je me souviens que mon prof m'avait donné plusieurs moyens comparer les modèles... (je me souviens qu'il y avait le R², mais bon dans ce cas là on privilégie toujours le modèle avec le plus de paramètres....) Est-ce que vous en connaitriez ?
Merci d'avance !
-----