Bonjour,
Je suis étudiant en écologie et suis confronté à plusieurs problèmes d'analyses de mes données.
Mon étude porte sur la migration de crapauds communs.
Un passage à faune (permettant aux animaux en tout genre de traverser une route sans se faire écraser) est suivi chaque année en période de migration des amphibiens afin de réaliser un suivi sur le long terme de ces dernier. Ce passage à faune, long de 1km, possède 14 buses de sorties. 6 d'entre elles sont suivie depuis 1996, mon étude porte donc sur ces 6 buses.
Le protocole est le suivant :
- les buses sont équipées de caisses afin de piéger les amphibiens en migration,
- un passage, chaque matin, est réalisé pour dénombrer et sexé les individus capturés pendant la nuit
- des données météorologiques sont relevées (température, pluie, neige, vent)
Mes données sont donc des données de comptage par buse. Les individus capturés ne sont pas marqués.
Des données provenant de deux autres sites sont mis à ma disposition (le protocole de récolte est identique).
Sur mon site d'étude, en réalisant le graph des effectifs de crapauds en fonction des années, je distingue deux phases très nettes : de 1996 à 2002, la population migrante était très nettement en augmentation (de façon exponentielle), mais depuis 2002, elle décroit de façon linéaire.
Ma première volonté serait de comparer les migrations selon les sites. Le problème est que le linéaire suivi par site n'est pas le même (au sein d'un même site, il reste tout de même identique d'une années sur l'autre). Le nombre d'unités d’échantillonnage (nombre de buse) n'est pas le même non plus.
Je souhaiterai savoir si les migrations suivent les mêmes évolutions selon les sites.
Je pensait faire une régression linéaire simple par site afin de savoir si la décroissance est significative. Puis un test du Chi 2 afin de comparer Pensez-vous que cela soit approprié ?
En réalisant le graph des effectifs de crapauds en fonction des années, je distingue deux phases très nettes : de 1996 à 2002, la population migrante était très nettement en augmentation, mais depuis 2002, elle décroit de façon linéaire.
Dans un second temps, j'aimerais tester l'influence de variables météorologiques sur la migration (météofrance devrait me fournir des données plus précises que les miennes).
Pour cela, je pense utiliser des GLM en utilisant la famille "Poisson" (adapté aux données de comptage, non ?).
Je m’intéresse au timing de la migration (début, durée, pic) ainsi qu'aux effectifs.
Je vais donc réaliser plusieurs séries de modèles. Chaque série différenciera les sites.
La première devrait s'organiser comme cela et porterait sur l'influence des facteurs météo de la saison d'hivernage :
Effectif par année / Température moyenne des minima de la saison d'hibernation / Nombre de jour de pluie pendant la saison d'hibernation / Nombre de jour de neige pendant la saison d'hibernation / Nombre de jour avec neige au sol pendant la saison d'hibernation.
Ayant 18 années de suivi, est-ce suffisant pour traiter les données par site ou devrais-je les traiter tous ensemble en rajoutant une variable catégorielle "site" ?
La seconde qui porterait sur l'influence des conditions météo au cour de la migration devrait s'organiser comme cela :
Nombre de crapauds pour le jour X / jour de l'année (en y appliquant un effet quadratique) / Température mini / Pluie (catégorielle : oui/non) / Vent (catégorielle ou quantitative selon les données météofrance) / couverture de neige (oui/non)
Pensez vous que l'effet quadratique appliqué à la variable "jour de l'année" est une bonne idée pour corriger le fait que la migration ne se fait pas de façon homogène au cours du temps ?
Je n'ai pas encore trop d'idées sur le traitement du timing de la migration...
Je vous remercie de m'avoir lu et espère ne pas avoir été trop long, mais suffisamment clair dans mes intentions...
Romain
-----