Comparaison entre 2 ensembles de données - Compréhension d'une méthode
Répondre à la discussion
Affichage des résultats 1 à 8 sur 8

Comparaison entre 2 ensembles de données - Compréhension d'une méthode



  1. #1
    fabio123

    Comparaison entre 2 ensembles de données - Compréhension d'une méthode


    ------

    Bonjour,

    je souhaite obtenir de l'aide concernant un article où est décrit la comparaison entre 2 ensembles de données.

    Voici la description (désolé c'est en anglais mais compréhensible) :

    Pièce jointe 380540

    Le but est d'estimer au mieux les paramètres d'un modèle. Pour cela, nous utilisons un vecteur de ces paramètres. D'après ce que j'ai compris, on cherche à quantifier l'acceptabilité de l'égalité entre le vecteur représentant une expérience A et le vecteur d'une autre expérience B.

    QUESTION 1) D'après ces premiers éléments, est-ce que les valeurs dans ce vecteur sont les moyennes ou les estimations de chaque paramètre, qui résultent de mesures faites plusieurs fois : autrement dit, par exemple, l'expérience A consisterait à reproduire la mesure plusieurs fois, est-ce comme cela que le vecteur est construit ?

    Ensuite, il est indiqué que pour des expériences indépendantes A et B, on calcule le suivante la formule :



    avec qui est appelée "expected variance of the random variable .

    QUESTION 2) qu'est-ce qu'il faut comprendre avec cette définition ? ne faut-il pas parler plutôt de matrice de covariance ?

    ça ne semble pas être la matrice de covariance puisqu'il est indiqué juste après : que les matrice et sont les matrices de covariance des paramètres partagés entre les 2 ensembles.

    QUESTION 3) d'après vous, d'où est issue la relation qui fait apparaître l'inverse de la matrice ? et à quoi correspond alors cette matrice ?

    Ensuite, il est marqué que la Probability-To-Exceed (PTE) est évaluée à partir du et qui est définie par une équation Gaussienne-sigma selon :



    où ERF est l'intégrale d'une distribution gaussienne.

    QUESTION 4) Est-ce que correspond à une fonction cumulative. J'ai essayé de faire le lien avec la distribution du avec 2 degrés de liberté mais dans ce cas-là, je n'intègre pas une gaussienne comme ci-dessus mais une simple exponentielle. Comment faire apparaître l'intégrale d'une Gaussienne ? ou alors on parle d'une autre distribution ?

    Il me semble que la PTE quantifie le pourcentage de chance que l'on ait un dépassant un seuil fixé par le niveau de confiance (CL). On pourrait donc écrire aussi :



    QUESTION 5) Comment la PTE permet d'estimer la différence entre 2 ensembles de données ? S'il y a une différence entre les 2 jeux de données, cela signifierait que les éléments non diagonaux de la matrice de covariance sont différents de 0 (termes de covariances) : cette interprétation est-elle correcte ?

    Enfin, j'aimerais comprendre la signification des seuils appliqués aux résultats obtenus pour qualifier "evidence of tension" à et "definitive evidence of tension" à . "tension" voudrait signifier "incompatibilité" dans l'estimation des paramètre sur A et B ?

    QUESTION 6) est-ce que ces seuils ne doivent surtout pas être dépassés pour pouvoir valider la cohérence entre les 2 ensembles de données ?, c'est-à-dire que les 2 jeux de données aboutissent avec une certaine marge d'erreur aux mêmes estimations sur chaque paramètre ?

    Merci par avance pour votre aide et vos remarques

    -----

  2. #2
    PhilTheGap

    Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

    Bonjour Fabio

    Ta PJ n'est pas valide...

  3. #3
    fabio123

    Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

    voici les 2 images qui devraient être validées. Dois-je contacter l'administrateur si elles ne le sont pas ?

    sHFF5.png

    et la suite :

    tIpgS.png

    désolé pour le désagrément, j'espère que mon post restera compréhensible.

    Cordialement

  4. #4
    PhilTheGap

    Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

    Citation Envoyé par fabio123 Voir le message
    Bonjour,

    je souhaite obtenir de l'aide concernant un article où est décrit la comparaison entre 2 ensembles de données.
    Pourquoi ne donnes-tu pas un lien URL plutôt qu'une PJ ?

    QUESTION 1) D'après ces premiers éléments, est-ce que les valeurs dans ce vecteur sont les moyennes ou les estimations de chaque paramètre, qui résultent de mesures faites plusieurs fois : autrement dit, par exemple, l'expérience A consisterait à reproduire la mesure plusieurs fois, est-ce comme cela que le vecteur est construit ?
    Je n'ai pas tous les éléments pour répondre en l'absence de contexte de l'article. Tes deux images sont bien courtes... Je dirais que ce sont deux modèles considérés a priori comme différents (un modèle = plusieurs paramètres, c'est donc un vecteur). On cherche à vérifier leur (in)dépendance avec le χ². On a un certain nombre de mesures du premier (A), et du deuxième (B). Chaque paramètre du modèle est donc considéré comme une variable aléatoire.

    Ensuite, il est indiqué que pour des expériences indépendantes A et B, on calcule le suivante la formule :



    avec qui est appelée "expected variance of the random variable .

    QUESTION 2) qu'est-ce qu'il faut comprendre avec cette définition ? ne faut-il pas parler plutôt de matrice de covariance ?
    Une covariance est calculée avec deux variables, mais ici on parle de LA variable . Donc c'est une variance (une matrice de variance de rang N, puisqu'il y a N paramètres).


    Je vais regarder la suite... J'ai fait du χ² dans ma jeunesse pendant mon service scientifique !

  5. A voir en vidéo sur Futura
  6. #5
    fabio123

    Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

    Excuse-moi, j'aurais du dès le début te donner le lien de l'article complet :

    https://arxiv.org/pdf/1711.00403.pdf

    La partie qui me pose problème est la partie : "3. RESULTS AND CONSISTENCY WITH EXTERNAL DATA SET"

    J'ai déjà vu la notion de chi2 par exemple dans l'estimation des paramètres de linéarité (a,b) sous la forme "y = a x + b" : c'est-à-que l'on suppose que le modèle est linéaire et on fait une méthode des moindres carrées en minimisant le chi2. Il me semble que l'on appelle ça une régression linéaire tout simplement.

    Mais dans cet article, j'ai l'impression que le chi2 sert à tester la cohérence entre 2 jeux de données (Expérience A et Expérience B) : mais quels sont alors les paramètres que le chi2 estime ? j'ai du mal à saisir la démarche...

    toute aide est la bienvenue pour mes QUESTIONS DE 1) à 6) du premier post. Merci

  7. #6
    PhilTheGap

    Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

    Bonjour Fabio

    Je n'ai pas eu bcp de temps récemment. Es-tu tj en attente de réponses ? Je peux me pencher à nouveau sur la question.

  8. #7
    fabio123

    Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

    Bonjour PhilTheGap,

    j'aurais toujours besoin d'un peu d'aide sur ce post, quand tu auras le temps ...

    Cordialement

  9. #8
    PhilTheGap

    Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

    ok ça pourrait être le vas cette semaine

Discussions similaires

  1. Excel: comparaison de cellules et copie de données entre 2 classeurs
    Par invitedb15c8e5 dans le forum Logiciel - Software - Open Source
    Réponses: 15
    Dernier message: 23/05/2015, 15h46
  2. Réponses: 4
    Dernier message: 27/11/2013, 17h10
  3. Réponses: 1
    Dernier message: 14/08/2012, 23h21
  4. Compréhension de la comparaison des acides entre eux
    Par invite37da9b1a dans le forum Chimie
    Réponses: 3
    Dernier message: 05/03/2010, 15h15
  5. [Antiquité] Méthode de comparaison entre deux villes antiques
    Par invite7a79e807 dans le forum Archéologie
    Réponses: 4
    Dernier message: 24/03/2008, 18h47