Répondre à la discussion
Affichage des résultats 1 à 10 sur 10

Analyse de données sur des phoques :)



  1. #1
    Koranten

    Analyse de données sur des phoques :)


    ------

    Salut à tous,

    Je suis dans une école d'ingénieurs, mais j'adore aussi la biologie, alors j'ai choisi d'étudier les mammifères pour mon projet d'Analyse de données.

    Je m'intéresse aux mammifères marins: phoques, otaries, éléphants de mer et baleine bleue. L'homme et le chien apparaissent aussi pour voir ce que ça donne.

    Je dois faire une ACP (analyse en composantes principales) ainsi qu'une classification hiérarchique.

    L'ACP sera bientôt prête, mais regardons d'abord la classification hiérarchique

    On étudie la richesse du lait en graisse, protide, lactose et eau.

    On regarde aussi la taille de la mère, le poids du petit, sa taille, la durée de gestation et de l'allaitement.

    Tous les détails sont en pièce-jointe (notamment les noms précis d'espèce).

    La classification hiérarchique est faite, c'est le graphique en forme d'arbre.

    Je suis bien évidemment censé l'analyser, je m'en remets donc à vous, biologistes!

    Voici mon interprétation:
    On voit bien que la première séparation se fait entre mammifères terrestres et marins, jusque là, pas d'embrouille. Ensuite, le mastodonte qu'est la baleine bleue est aussi mise de côté. Normal. Arrive ensuite un groupe d'otaries, à fourrure mais pas seulement, qui se dégage. Mais premier hic: une otarie manque à l'appel, elle est dans l'autre branche! Ensuite, les éléphants de mer se rangent bien sagement. Un phoque commun prend le large. Finalement, 2 phoques du Groenland sur 3 se regroupent, plus ou moins avec une otarie à fourrure, tandis qu'un phoque gris se tape l'incruste au Groenland

    Enfin voilà!

    Mes questions: je sais bien que l'analyse de données n'est pas une science exacte, et que parfois deux espèces censément proches ne le sont pas tant que ça.

    Mais si vous avez des commentaires sur le graphique, des explications, des idées, n'importe quoi pour enrichir mon argumentaire, vous êtes les bienvenus!

    C'est trop cool ce genre de sujet, et puis les phoques sont des bestioles tellement sympas ^^

    L'otarie à fourrure en mission d'infiltration chez les phoques est Callorhinus ursinus, les deux autres sont Arctocephallus pusillus et Arctocephalus gazella, pour les puristes L'otarie sans fourrure avec deux à fourrures est Zalophus californianus.

    Voilà voilà. L'ACP arrive bientôt!

    Merci d'avance

    -----
    Images attachées Images attachées
    Fichiers attachés Fichiers attachés

  2. Publicité
  3. #2
    kinette

    Re : Analyse de données sur des phoques :)

    Bonjour,
    Quelle est ta problématique?
    Souhaites-tu montrer (ou informer) que la répartition suit celle de la phylogénie?
    Ou étudier l'effet d'autres facteurs (dans ce cas il faut choisir un autre type d'analyse, qui justement permette de s'affranchir de la phylogénie... je connais celle des contrastes indépendants mais je ne sais pas dans le détail comment ça marche).

    K
    Nomina si nescis, perit et cognito rerum.

  4. #3
    Koranten

    Re : Analyse de données sur des phoques :)

    En fait c'est assez simple: je voudrais le point de vue de biologistes sur ce résultat, c'est tout!

    Alors par exemple, oui, pourquoi pas, analyser cette classification hiérarchique en la comparant avec la phylogénie.

    Mais si ça vous évoque autre chose, allez-y! Je suis preneur

  5. #4
    kinette

    Re : Analyse de données sur des phoques :)

    Citation Envoyé par Koranten Voir le message
    Alors par exemple, oui, pourquoi pas, analyser cette classification hiérarchique en la comparant avec la phylogénie.

    Mais si ça vous évoque autre chose, allez-y! Je suis preneur
    OK, donc la question est bien celle de la cohérence phylogénie/caractéristique du lait et de la reproduction...
    Désolée mais c'était pas totalement clair pour moi, et d'ailleurs j'avoue avoir du mal à voir l'intérêt de tout grouper.

    Il me semble que les classification qu'on obtient ont des degrés de robustesse variables entre branches, et qu'on doit pouvoir quantifier la cohérence entre deux arbres obtenus par des méthodes différentes (je suis pas phylogéniste, mais ça me paraît correspondre à des trucs qu'on retrouve dans la littérature).

    Donc ça serait chouette si non seulement vous avez les deux arbres, mais pouvez conclure que la différence entre arbres n'est pas liée au hasard, et quantifier cette différence.
    Ensuite se posera la question de l'explication de ces différences... ou non différences!
    Comme vous l'avez fait remarquer, il y a des cas où phylogénie et autres facteurs (terrestre ou non) ne sont pas séparés: on ne peut donc pas conclure si la cohérence observée est un produit de la phylogénie ou de l'adaptation à l'environnement (faudrait regarder ce qui change entre les deux groupes et si ça peut être discuté comme une adaptation à un milieu donné).

    On regarde aussi la taille de la mère, le poids du petit, sa taille, la durée de gestation et de l'allaitement.
    Je vois ici un problème: à mon avis ces variables sont loin d'être indépendantes.
    De même que "la richesse du lait en graisse, protide, lactose et eau." Avez-vous travaillé avec des pourcentages? (ça aussi ça peut poser des problèmes d'analyse statistique).
    Est-ce que vous avez mis toutes ces données dans la même moulinette?
    Il me semblerait plus cohérent de se concentrer sur la composition du lait, et ensuite regarder si la phylogénie ou les autres facteurs (taille de la mère, etc...) sont associés à cette composition.

    K
    Nomina si nescis, perit et cognito rerum.

  6. #5
    Koranten

    Re : Analyse de données sur des phoques :)

    Bon, je vais clarifier un peu. C'est vrai que ça reste un peu flou, mais c'est aussi parce qu'une des pièces-jointes n'a toujours pas été validée.

    Les données graisse/protide/lactose et eau sont en %

    Le reste est en unités classiques.

    J'ai récupéré ces données dans un sujet de master de biologie, moi je suis en ingénierie. Je n'ai fait que récupérer ces données, ce n'est pas moi qui ait demandé spécifiquement tel ou tel données. Je ne m'y connais pas assez. J'ai fait de la récup' dans un vieux sujet.

    C'est justement là qu'un avis de biologiste peut m'intéresser: si ces données vous paraissent pertinentes, complètement stupides, lacunaires, etc.

    En fait, je ne suis pas censé aller plus loin que l'analyse en composantes principales (à venir) et la classification hiérarchique, mais ça m'intéresse de discuter les résultats

    Voyons la classification (l'arbre en pièce-jointe).

    Ce qui m'intéresse, c'est d'avoir le point de vue des biologistes sur cet arbre qui a été conçu par les mathématiques: moi j'y vois bien la séparation des espèces, à part une otarie qui s'est "glissée" parmi les phoques. De ce côté, l'analyse mathématique se révèle performante car capable de séparer les espèces.

    Mais je n'y vois pas grand chose d'autres. Vous, biologistes, y voyez-vous quelques chose de plus?

    Par exemple, je ne sais pas, mais est-ce que cet arbre, en plus de séparer/regrouper correctement les espèces, est une image du processus évolutif (càd est-ce que cet arbre ressemble à l'arbre phylogénétique de ces espèces, un peu, pas du tout)?

    Pour résumer: j'ai des résultats mathématiques, que j'interprète avec mon seul bon sens, mais vous, spécialistes, y voyez vous des choses en plus?

    Merci

  7. A voir en vidéo sur Futura
  8. #6
    kinette

    Re : Analyse de données sur des phoques :)

    Bonjour,
    Bah moi je la voyais ta pièce attachée désolée de pas l'avoir validée plus tôt par contre...

    Alors attention, les données en % ça pose généralement des problèmes pour les tests paramétriques (car c'est loin d'être normal). Faudrait quand même jeter un oeil sur la théorie des ACP pour voir si ça pose problème ou non, de même que des variables non indépendantes.
    (désolée d'être tatillonne, mais pour moi les stats c'est un superbe outil mais pas à utiliser n'importe comment...).
    D'ailleurs oui manifestement ça pose bien problème d'avoir des %:
    http://pbil.univ-lyon1.fr/ADE-4-old/...l/01/0141.html

    Pour votre analyse hiérarchique, quelle est au juste votre méthode?
    Est-ce que vous avez quelque chose qui indique la rubustesse de l'arbre?

    Pour les données, elles sont ce qu'elles sont
    Le problème est qu'à mon avis toutes les variables sont plus ou moins corrélées entre elles, donc pas évident d'en tirer de conclusion "biologique".
    D'ailleurs ça serait pas mal que vous jetiez un oeil du côté de la matrice des corrélations pour voir qu'est-ce qui est corrélé (significativement) avec quoi, et essayer de voir si on peut proposer une explication. M'étonnerait pas que plus le petit soit gros, plus la gestation est grande, et qu'ensuite la richesse du lait et la durée d'allaitement dépendent du rapport entre taille du petit et celle de la mère (donc importance de la croissance nécessaire).

    Comme dit dans le sujet, les variables environnementales peuvent jouer (mais manifestement vous ne les avez pas ).

    Hum, je réalise un truc, c'est que vous avez plusieurs individus par espèce... et qu'ils ne se placent pas du tout pareil dans l'arbre... du coup, comment dire... pas vraiment l'impression que ce truc soit exploitable, à part pour les séparations très nettes...

    K
    Nomina si nescis, perit et cognito rerum.

  9. Publicité
  10. #7
    Koranten

    Re : Analyse de données sur des phoques :)

    Pour les variables corrélées... l'ACP, en passant en base propre, ne permet pas justement de les décoreller? En physique en tous cas, ça sert à ça: des équations couplées se découplent... et du coup c'est beaucoup plus simple à résoudre ^^

    De ce que j'en ai vu, on a tout à fait le droit de faire une ACP sur des variables non-indépendantes. Ca va justement nous indiquer à quel point les variables dépendent les unes des autres (ou plutôt leur corrélation).

    J'essaie de mettre l'ACP en pièce-jointe, mais elle est refusée (c'est du .xls)? La matrice de corrélation est dans le fichier.

    Les variables environnementales, on en a une partie quand même: hémisphère, chaud ou froid, etc.

    Merci!

  11. #8
    kinette

    Re : Analyse de données sur des phoques :)

    Bonjour,
    Je n'ai pas dit que l'ACP ne permettait pas d'utiliser des variables corrélées. Mais je me demande à quel point ce qu'il en sort signifie quelque chose quand une variable est structurellement dépendante d'une autre (imaginons que nous ayions un pourcentage d'eau, un pourcentage de matière sèche: l'un est directement dépendant de l'autre. Introduire les deux comme variables revient à redoubler une variable. Je ne sais pas trop quelles sont les conséquences d'une telle situation pour une ACP, j'ai plus l'habitude des ANOVA...).

    Je me demande si l'ACP est la meilleure méthode par rapport à votre problématique, personnellement j'aurais plutôt penché pour une analyse discriminante (pour voir si on peut discriminer les espèces ou non)...
    http://fr.wikipedia.org/wiki/Analyse_discriminante (apparemment on peut dire que c'est une forme d'ACP particulière ).

    De toute façon, dans ce jeu de données, le nombre d'individu/espèce est carrément insuffisant pour pouvroi conclure quoi que ce soit
    Bon courage,
    K
    Nomina si nescis, perit et cognito rerum.

  12. #9
    Koranten

    Re : Analyse de données sur des phoques :)

    Il faudrait vraiment beaucoup plus d'espèces? Combien à votre avis?

    En tous les cas, il ne s'agit que d'un petit projet, je ne vais pas aller chercher beaucoup plus loin.

    L'ACP n'est peut-être pas pertinente, mais qu'en est-il de la classification hiérarchique? C'est elle qui donne l'arbre. Il s'agit du regroupement au fur et à mesure des individus en minimisant l'inertie inter-classe. Ca ressemble un peu au lieun que vous avez donné sur l'analyse discriminante.

  13. #10
    kinette

    Re : Analyse de données sur des phoques :)

    Bonjour,
    A mon avis le problème n'est pas le nombre d'espèces mais le nombre d'individus par espèce: cf. l'arbre qui montre qu'un individu d'otarie se retrouve au milieu des phoques et pas l'autre: comment savoir si on a une vue représentative de l'espèce à partir de deux individus?
    Normalement pour ce genre de travail soit on travaille avec les valeurs moyennes pour l'espèce, soit (ce qui est mieux à mon avis ) on travaille avec le plus d'individus possible pour chaque espèce (ça permet de vérifier si on a une bonne séparation entre les espèces).

    La classification hiérarchique n'est pas un problème en soi, ce qui pose plus problème à mon avis c'est la pertinence de l'information qui en résulte (peut-on vraiment en tirer des conclusions?).
    Apparemment ACP et classification hiérarchiques ont des liens:
    http://www.numdam.org/numdam-bin/fit...1977__25_4_5_0

    Là j'ai pas trop le temps de me pencher plus sur le sujet, désolée,
    Bon courage,
    K
    Nomina si nescis, perit et cognito rerum.

Sur le même thème :

Discussions similaires

  1. Massacre des phoques au Canada...
    Par shokin dans le forum Environnement, développement durable et écologie
    Réponses: 49
    Dernier message: 10/08/2007, 16h13
  2. Des manchots et des phoques océanographes !
    Par RSSBot dans le forum Commentez les actus, dossiers et définitions
    Réponses: 0
    Dernier message: 13/07/2006, 15h52
  3. Analyse de données : classification par conservation de variance ?
    Par IdC-Guillom dans le forum Mathématiques du supérieur
    Réponses: 2
    Dernier message: 07/07/2006, 16h20