Comparaison entre 2 ensembles de données - Compréhension d'une méthode

**fabio123** · 04/01/2019, 09h26

Bonjour,

je souhaite obtenir de l'aide concernant un article où est décrit la comparaison entre 2 ensembles de données.

Voici la description (désolé c'est en anglais mais compréhensible) :

Pièce jointe 380540

Le but est d'estimer au mieux les paramètres d'un modèle. Pour cela, nous utilisons un vecteur $\text{[math]}$ de ces paramètres. D'après ce que j'ai compris, on cherche à quantifier l'acceptabilité de l'égalité entre le vecteur $\text{[math]}$ représentant une expérience A et le vecteur $\text{[math]}$ d'une autre expérience B.

QUESTION 1) D'après ces premiers éléments, est-ce que les valeurs dans ce vecteur sont les moyennes ou les estimations de chaque paramètre, qui résultent de mesures faites plusieurs fois : autrement dit, par exemple, l'expérience A consisterait à reproduire la mesure plusieurs fois, est-ce comme cela que le vecteur $\text{[math]}$ est construit ?

Ensuite, il est indiqué que pour des expériences indépendantes A et B, on calcule le $\text{[math]}$ suivante la formule :

$\text{[math]}$

avec $\text{[math]}$ qui est appelée "expected variance of the random variable $\text{[math]}$ .

QUESTION 2) qu'est-ce qu'il faut comprendre avec cette définition ? ne faut-il pas parler plutôt de matrice de covariance ?

ça ne semble pas être la matrice de covariance puisqu'il est indiqué juste après : $\text{[math]}$ que les matrice $\text{[math]}$ et $\text{[math]}$ sont les matrices de covariance des paramètres partagés entre les 2 ensembles.

QUESTION 3) d'après vous, d'où est issue la relation $\text{[math]}$ qui fait apparaître l'inverse de la matrice $\text{[math]}$ ? et à quoi correspond alors cette matrice $\text{[math]}$ ?

Ensuite, il est marqué que la Probability-To-Exceed (PTE) est évaluée à partir du $\text{[math]}$ et qui est définie par une équation Gaussienne-sigma selon :

$\text{[math]}$

où ERF est l'intégrale d'une distribution gaussienne.

QUESTION 4) Est-ce que $\text{[math]}$ correspond à une fonction cumulative. J'ai essayé de faire le lien avec la distribution du $\text{[math]}$ avec 2 degrés de liberté mais dans ce cas-là, je n'intègre pas une gaussienne comme ci-dessus mais une simple exponentielle. Comment faire apparaître l'intégrale d'une Gaussienne ? ou alors on parle d'une autre distribution ?

Il me semble que la PTE quantifie le pourcentage de chance que l'on ait un $\text{[math]}$ dépassant un seuil fixé par le niveau de confiance (CL). On pourrait donc écrire aussi :

$\text{[math]}$

QUESTION 5) Comment la PTE permet d'estimer la différence entre 2 ensembles de données ? S'il y a une différence entre les 2 jeux de données, cela signifierait que les éléments non diagonaux de la matrice de covariance sont différents de 0 (termes de covariances) : cette interprétation est-elle correcte ?

Enfin, j'aimerais comprendre la signification des seuils appliqués aux résultats obtenus pour qualifier "evidence of tension" à $\text{[math]}$ et "definitive evidence of tension" à $\text{[math]}$ . "tension" voudrait signifier "incompatibilité" dans l'estimation des paramètre sur A et B ?

QUESTION 6) est-ce que ces seuils ne doivent surtout pas être dépassés pour pouvoir valider la cohérence entre les 2 ensembles de données ?, c'est-à-dire que les 2 jeux de données aboutissent avec une certaine marge d'erreur aux mêmes estimations sur chaque paramètre ?

Merci par avance pour votre aide et vos remarques

**PhilTheGap** · 09/01/2019, 15h36

Bonjour Fabio

Ta PJ n'est pas valide...

**fabio123** · 09/01/2019, 16h32

voici les 2 images qui devraient être validées. Dois-je contacter l'administrateur si elles ne le sont pas ?

sHFF5.png

et la suite :

tIpgS.png

désolé pour le désagrément, j'espère que mon post restera compréhensible.

Cordialement

**PhilTheGap** · 10/01/2019, 15h10

Envoyé par fabio123

Bonjour,

je souhaite obtenir de l'aide concernant un article où est décrit la comparaison entre 2 ensembles de données.

Pourquoi ne donnes-tu pas un lien URL plutôt qu'une PJ ?

QUESTION 1) D'après ces premiers éléments, est-ce que les valeurs dans ce vecteur sont les moyennes ou les estimations de chaque paramètre, qui résultent de mesures faites plusieurs fois : autrement dit, par exemple, l'expérience A consisterait à reproduire la mesure plusieurs fois, est-ce comme cela que le vecteur $\text{[math]}$ est construit ?

Je n'ai pas tous les éléments pour répondre en l'absence de contexte de l'article. Tes deux images sont bien courtes... Je dirais que ce sont deux modèles considérés a priori comme différents (un modèle = plusieurs paramètres, c'est donc un vecteur). On cherche à vérifier leur (in)dépendance avec le χ². On a un certain nombre de mesures du premier (A), et du deuxième (B). Chaque paramètre du modèle est donc considéré comme une variable aléatoire.

Ensuite, il est indiqué que pour des expériences indépendantes A et B, on calcule le $\text{[math]}$ suivante la formule :

$\text{[math]}$

avec $\text{[math]}$ qui est appelée "expected variance of the random variable $\text{[math]}$ .

QUESTION 2) qu'est-ce qu'il faut comprendre avec cette définition ? ne faut-il pas parler plutôt de matrice de covariance ?

Une covariance est calculée avec deux variables, mais ici on parle de LA variable $\text{[math]}$ . Donc c'est une variance (une matrice de variance de rang N, puisqu'il y a N paramètres).

Je vais regarder la suite... J'ai fait du χ² dans ma jeunesse pendant mon service scientifique !

A voir en vidéo sur Futura · Aujourd'hui

**fabio123** · 19/01/2019, 13h29

Excuse-moi, j'aurais du dès le début te donner le lien de l'article complet :

https://arxiv.org/pdf/1711.00403.pdf

La partie qui me pose problème est la partie : "3. RESULTS AND CONSISTENCY WITH EXTERNAL DATA SET"

J'ai déjà vu la notion de chi2 par exemple dans l'estimation des paramètres de linéarité (a,b) sous la forme "y = a x + b" : c'est-à-que l'on suppose que le modèle est linéaire et on fait une méthode des moindres carrées en minimisant le chi2. Il me semble que l'on appelle ça une régression linéaire tout simplement.

Mais dans cet article, j'ai l'impression que le chi2 sert à tester la cohérence entre 2 jeux de données (Expérience A et Expérience B) : mais quels sont alors les paramètres que le chi2 estime ? j'ai du mal à saisir la démarche...

toute aide est la bienvenue pour mes QUESTIONS DE 1) à 6) du premier post. Merci

**PhilTheGap** · 28/01/2019, 16h28

Bonjour Fabio

Je n'ai pas eu bcp de temps récemment. Es-tu tj en attente de réponses ? Je peux me pencher à nouveau sur la question.

**fabio123** · 08/02/2019, 10h56

Bonjour PhilTheGap,

j'aurais toujours besoin d'un peu d'aide sur ce post, quand tu auras le temps ...

Cordialement

**PhilTheGap** · 11/02/2019, 11h20

ok ça pourrait être le vas cette semaine

Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Re : Comparaison entre 2 ensembles de données - Compréhension d'une méthode

Discussions similaires

Excel: comparaison de cellules et copie de données entre 2 classeurs

Besoin d'aide pour un développement de macro VB pour comparaison de données entre 2 tableaux excel

analyse statistique? comparaison entre données expérimentaux et simulation numérique

Compréhension de la comparaison des acides entre eux

[Antiquité] Méthode de comparaison entre deux villes antiques