Traitement de nombreuses données statistiques
Répondre à la discussion
Affichage des résultats 1 à 6 sur 6

Traitement de nombreuses données statistiques



  1. #1
    inviteed469942

    Exclamation Traitement de nombreuses données statistiques


    ------

    Bonjour à tous,

    Actuellement en stage dans un laboratoire, j'étudie le traitement des boues d'épuration pour permettre son optimisation, et j'ai besoin de votre aide car j'ai un grand nombre de données à traiter et je ne sais pas comment m'y prendre (je n'ai été que peu formée aux stats).

    J'effectue à fréquence régulière (1 fois/semaine pdt 1 mois) 2 types de mesures :
    - Activités enzymatiques : elles doivent augmenter au cours du temps.
    - Concentrations en différents composés définis : elles doivent diminuer au cours du temps.

    J'ai identifié 4 variables :
    - pH des boues (ajusté à l'avance) : il varie de 3 à 8
    - Boue inoculée avec une bactérie, ou non
    - Type d'analyse (ex : activité enzymatique de la protéase)
    - Jour d'analyse (J0, J7, J14, J21 ou J28). Note : je peux le cas échéant faire la moyenne des mesures sur le mois, histoire de retirer cette variable.

    Pour chaque paramètre, je fais la mesure sur 3 copies. Ainsi on a n = 3 copies * 6 (nb de pH différents) * 2 (inoculation ou non) = 36 individus

    J'aimerais savoir quel est le meilleur test statistique à effectuer sur l'ensemble de mes données pour optimiser le traitement des boues, et répondre à la question : quelles sont les meilleures conditions de traitement des boues ?

    Je ne sais pas s'il faut un test paramétrique ou non, et si les échantillons sont dépendants, donc j'hésite entre :
    - ANOVA
    - Kruskal Wallis
    - Corrélation de Pearson
    - Corrélation de Spearman

    De plus, je ne sais pas si mes variables sont correctes et comment les corréler entre elles dans XLSTAT, car les données sont très nombreuses... Bref je suis perdue

    J'espère que quelqu'un pourra éclairer ma lanterne !
    Merci d'avance

    -----

  2. #2
    gg0
    Animateur Mathématiques

    Re : Urgent - Traitement de nombreuses données statistiques

    Bonjour.

    Si ton objectif est "optimiser le traitement des boues", ce n'est pas une question de test, à la limite pas une question de statistiques, mais éventuellement un plan d'expérience peut aider. cependant, si on n'a pas été formé, c'est presque impossible d'en faire un sérieusement. Donc si tu as le temps de t'auto-former aux plans d'expérience, c'est envisageable.
    Sinon, au départ il est inutile d'envisager des tests : Un test sert à valider ou infirmer une hypothèse statistique. Si tu n'as pas d'hypothèse ("optimiser" est une action, pas une hypothèse), la première chose à faire est d'analyser (statistiques descriptives) tes données pour voir ce qui semble utile à ton projet.
    Je ne saurais trop t'inciter aussi à voir ça avec ton responsable de stage, qui a sans doute des connaissances qui pourraient te servir, pour éviter de perdre du temps à retrouver dans les données ce que tout le monde sait dans le labo (on appelle ça des "retours d'expérience"). C'est d'ailleurs la première étape de la construction d'un plan d'expérience.

    Cordialement.

    NB : Traiter en même temps plusieurs variables est toujours difficile pour quelqu'un qui n'est pas très formé en stats.
    Dernière modification par gg0 ; 20/09/2018 à 09h20.

  3. #3
    inviteed469942

    Re : Urgent - Traitement de nombreuses données statistiques

    Bonjour,

    Merci beaucoup pour votre réponse !
    J'ai posté ce message un peu en désespoir de cause car mon responsable de stage est absent toute la durée du stage (oui oui)...
    Mais je vais suivre vos conseils.

    A bientôt,
    ReblochonDeSavoie

  4. #4
    inviteed469942

    Re : Urgent - Traitement de nombreuses données statistiques

    Edit : à vrai dire, il y a bien une hypothèse de départ concernant la variable d'inoculation... C'est que dans les échantillons inoculés, il y aura une activité enzymatique plus élevée que dans les non inoculés. Mais cette hypothèse n'implique pas le pH, c'est vrai. Dans ce cas, un simple test t suffit, non ?

  5. A voir en vidéo sur Futura
  6. #5
    gg0
    Animateur Mathématiques

    Re : Urgent - Traitement de nombreuses données statistiques

    Pour une comparaison de moyennes d'échantillons gaussiens (ou suffisamment grands), effectivement, on peut utiliser un teste t.

    Question : C'est ton responsable de stage dans l'entreprise qui est absent ? Alors l'entreprise doit t'en trouver un autre, sinon ce n'est pas un stage (pas d'encadrement !!); vois vite avec ton établissement de formation.

    Cordialement.

  7. #6
    inviteed469942

    Re : Urgent - Traitement de nombreuses données statistiques

    Super !

    Mon maître de stage (celui qui a signé les papiers) est bien présent dans l'organisme, mais effectivement celui qui est censé m'encadrer n'est pas là. Je ne pense pas en parler à mon établissement car mon stage se passe à l'étranger et touche à sa fin maintenant ; il s'est bien passé globalement.

    Merci encore pour votre aide !

Discussions similaires

  1. Analyse de données/ statistiques
    Par invite5ffffaa4 dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 25/04/2016, 20h33
  2. Prouver la convergence statistiques d'une série de données
    Par invitea165c44a dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 02/10/2013, 10h18
  3. [biostatistiques] statistiques avec des données binaires ?
    Par invite20cfa015 dans le forum Mathématiques du supérieur
    Réponses: 4
    Dernier message: 04/05/2010, 18h34
  4. [Statistiques] Normalisation des données
    Par invitec4d2e6d6 dans le forum Mathématiques du supérieur
    Réponses: 1
    Dernier message: 14/02/2009, 14h56
  5. [probas/statistiques] adéquation de données à une loi équirépartie
    Par invite97a92052 dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 24/05/2005, 18h46