Analyse données aberrantes Excel
Affichage des résultats 1 à 8 sur 8

Analyse données aberrantes Excel



  1. #1
    InsalienValencia

    Post Analyse données aberrantes Excel


    ------

    Bonjour à tous,
    je travaille actuellement sur un projet de pompe à chaleur expérimental dans le cadre d'un stage d'initiation à la recherche. Je ne vais pas rentrer dans les détails mais je suis amené à analyser de nombreux paramètres (Températures et pressions d'entrées et de sortie de l'évaporateur, du condenseur etc...). L'acquisition se fait lorsque un point stationnaire est atteint et ce, pendant 10min. 400 points environ sont mesurés à chaque essai.

    Les points sont envoyés sous Excel sur un onglet. Dans un autre onglet, on moyenne les différents paramètres mesurés et on calcule l'écart-type associé. Cependant, suite à une défaillance du dispositif expérimental, à chaque essai, il y a une dizaine de points (sur les 400 relevés) qui sont totalement aberrants et qui faussent complètement les moyennes et erreurs associées. Je peux les supprimer à la main (car ils sont facilement repérables), mais cela est fastidieux et long.

    Qq'un aurait-il une idée pour programmer l'élimination de ces points? Au mieux, je pourrais utiliser le test de Grubbs ou un autre test, mais Excel peut il faire tout seul ce genre de test? De plus, je ne sais pas si Grubbs est le meilleur test dans ce cas là, et il faudrait itérer non? Sinon, des idées qui utiliseraient les fonctionnalités d'Excel??

    Merci de vos éventuelles réponses

    -----

  2. #2
    pascaltech

    Re : Analyse données aberrantes Excel

    Bonjour,

    Je ne connais pas ton niveau sous excel et si tu maîtrise la déclaration de conditions. Par défaut je te propose ceci :

    Oui, tu peux mettre une condition dans une cellule, par exemple :

    =SI(E8>F$5;SI(E8<G$5;E8;0);0) ( il n'est pas utile d'écrire les zéro mais sur le site cela donne des smiley)


    Avec E8 à E23 correspondant aux valeurs mesurées listées en colonne

    F$5 correspondant à la cellule F5 = valeur mini
    G$5 correspondant à la cellule F5 = valeur maxi

    L'ancre $ te permets de copier cette formule dans toute la colonne sans avoir à retaper les cellules de références F5 et G5, dont la valeur de la ligne suivrait la position relative de la cellule de ta première valeur et les cellules maxi et mini.

    Cela est limité à une comparaison avec une valeur maxi et une valeur mini. Ce n'est peut être pas suffisant.

    Vois si tu peux utiliser le calcul des moindres carrés pour lisser tes valeurs dans une sorte de serpent (voir le serpent monétaire, terme inventé par Crâne d'Oeuf en Chef, COC dit VGE) ou tuyau autour d'une courbe moyenne.
    Dernière modification par pascaltech ; 19/11/2013 à 11h58.
    Il faut toujours passer deux couches, car cela plaît aux nasmes.

  3. #3
    InsalienValencia

    Re : Analyse données aberrantes Excel

    Merci, (oui, je suis débutant en Excel),

    j?utilise une version espagnole de Excel mais cela ne change rien. J'essaye d'incrémenter une somme des valeurs de l'autre page si chaque valeur est comprise entre Valmax et Valmin. Somme avec deux conditions donc:
    mais Ça n'a pas l'air de marcher. Y a til une erreur là dedans?
    =SUMAR.SI.CONJUNTO('Data logger'!D51437;'Data logger'!D51437;"<A8";'Data logger'!D51437;">A10")

  4. #4
    InsalienValencia

    Re : Analyse données aberrantes Excel

    C'est très basique ce que je fais mais c'est pour commencer.
    Imposer deux conditions à la même plage de donnée...mon bout de code me donne une somme égale à 0. Je pense que j'ai fait une erreur ou alors je n'utilise pas la bonne fonction

  5. A voir en vidéo sur Futura
  6. #5
    InsalienValencia

    Re : Analyse données aberrantes Excel

    En y réfléchissant, je ne pars peutêtre pas dans la bonne direction puisque je veux à terme faire la nouvelle moyenne (=sans ces valeurs aberrantes).
    En admettant ma formule marche, j'aurai ma nouvelle somme sans les valeurs aberrantes, très bien, mais il me faudrait aussi le nombre de valeurs gardées: pour diviser la somme par ce nombre de valeur. huuum

  7. #6
    Arzhur

    Re : Analyse données aberrantes Excel

    Bonjour,

    tu peux mettre aussi dans une autre colonne la valeur "1" si tu gardes la mesure ou la valeur "0" si tu ne la gardes pas (avec un SI)

    Ainsi pour le calcul de la moyenne : tu sommes le "produit des 2 cases" et tu divises par le somme de la colonne avec les 0 ou 1. (je sais pas si je suis très clair)

  8. #7
    InsalienValencia

    Re : Analyse données aberrantes Excel

    oui, c'est clair. Je cherchais simplement à éviter de rajouter des nouvelles colonnes car j'ai environ 45 paramètres donc 45 colonnes. Si j'en rajoute une à chaque fois, ça va me surcharger la page, mais en tout cas je vais réfléchir dans cette direction. Parce que à voir si c'est utile de faire cette manip' pour les 45 paramètres.

  9. #8
    pascaltech

    Re : Analyse données aberrantes Excel

    Insalienvalencia,

    Pourrais-tu regarder ce qui cloche dans ta formule et la réécrire, car comme je l'ai dis dans mon message, les ";" et les "(" donnent des smileys.

    C'est très conseillé d'utiliser un maximum de colonnes, cela permet, dans ton cas, de décomposer le processus de selection des valeurs, d'éliminer la partie décimale par exemple, puis de les mesurer ou de créer la moyenne.

    Détermine un processus pas à pas : tu prends une valeur, tu la traite en horizontal. Ensuite tu copies ton traitement sur toute les lignes correspondant à toutes les valeurs. C'est très rapide, même lorsqu'il y a une grande quantité de valeurs.

    Ensuite, soit tu caches ces colonnes soit tu intègres les différentes transformations dans une ou plusieurs formules plus complexes. C'est ma façon de procéder. J'ai, par le passé, travaillé en analyse financière de projet ; j'obtenais jusqu'à 80 colonnes sur 60 onglets. Le fichier était très volumineux, de l'ordre de 120 Mo. C'était le moyen d'analyser un budget de 400 M€ sur la période de développement de 18 mois.

    Dans ma formule "=SI(E8>F$5;SI(E8<G$5;E8;0);0) " je cumule 2 conditions ( tu peux intégrer jusqu'à 7 conditions dans une même cellule) à la différence de "=SUMAR.SI.CONJUNTO" qui ne peut en cumuler que 2 je crois.
    Cette formule se traduit comme ceci : "regarder si la valeur dans E8 est supérieure à la valeur dans F5, alors regarder si la valeur dans E8 est inférieure à G5, alors réécrire E8 dans cette cellule, sinon rien, sinon rien".

    Je te conseille de créer un onglet par paramètre et d'attribuer le nom de ton paramètre à cet onglet. De cette façon, la totalité de chaque page est consacrée à chaque paramètre : 256 colonnes par 14400(environ) lignes : tu as de quoi t'amuser, non ?
    Il faut toujours passer deux couches, car cela plaît aux nasmes.

Discussions similaires

  1. Images pdf (ou jpg) et base de données excel
    Par invite8ef6edc3 dans le forum Logiciel - Software - Open Source
    Réponses: 4
    Dernier message: 15/02/2012, 08h28
  2. Base de données excel
    Par invited5b3bb8b dans le forum Logiciel - Software - Open Source
    Réponses: 6
    Dernier message: 15/04/2010, 21h45
  3. traitement de données excel
    Par cutereu dans le forum Habitat bioclimatique, isolation et chauffage
    Réponses: 1
    Dernier message: 09/03/2010, 14h17
  4. importation de données de excel dans R : données numériques non reconnues
    Par invitef67ae3c5 dans le forum Logiciel - Software - Open Source
    Réponses: 1
    Dernier message: 05/02/2009, 19h00
  5. Statistiques pour éliminer les valeurs aberrantes sous Excel
    Par invite0345d784 dans le forum Mathématiques du supérieur
    Réponses: 3
    Dernier message: 19/05/2008, 15h55