Confiance en l'existence d'une exoplanète
Répondre à la discussion
Affichage des résultats 1 à 2 sur 2

Confiance en l'existence d'une exoplanète



  1. #1
    Brinicle

    Confiance en l'existence d'une exoplanète


    ------

    Bonjour,

    Depuis peu, pour un projet de machine learning, je m'intéresse aux données récoltées par le télescope spatial Kepler (relatif aux exoplanètes) : https://exoplanetarchive.ipac.caltec...fig=cumulative

    La question porte sur la colonne "koi_score" dont voici la définition (donnée par https://exoplanetarchive.ipac.caltec...e_columns.html) :

    A value between 0 and 1 that indicates the confidence in the KOI disposition. For CANDIDATEs, a higher value indicates more confidence in its disposition, while for FALSE POSITIVEs, a higher value indicates less confidence in that disposition. The value is calculated from a Monte Carlo technique such that the score's value is equivalent to the frction of iterations where the Robovetter yields a disposition of CANDIDATE.
    Au début, je pensais naïvement que cela correspondait en gros à la probabilité que le KOI soit une exoplanète... Mais en regardant l'histogramme des valeurs prises par les "CONFIRMED", "CANDIDATE" et "FALSE POSITIVE" (dans koi_disposition), on voit que certaines exoplanètes confirmées ont un score de 0 et des faux positifs un score de 1 .

    Nom : hist_scores.png
Affichages : 302
Taille : 8,6 Ko

    Qu'est-ce donc exactement que ce score ?

    -----
    Ne jamais faire un calcul sans connaître son résultat !

  2. #2
    physeb2

    Re : Confiance en l'existence d'une exoplanète

    Bonjour Brinicle,

    désolé pour la réponse tardive mais les dernieres semaines furent un enfer au travail.
    Tu ne peux pas interpréter un score comme une probabilité au sens strict. Tu as un estimateur et son score indique bien un degré de confiance. Mais cela ne veut pas dire que la probabilité est égale au score.

    Il faut prendre en compte deux choses avec un estimateur, la pureté et la completude (désolé pour ce barbarisme, mais je n'ai pas d'autre mot):
    - Pureté: quelle est la fraction de tes objets avec un score donné sont confirmés par rapport au nombre total d'objets avec ce score et plus (dans ton graph: Confirmées/(Confirmées + Faux positif) intégré entre un score donné et 1)
    - Complétude : quelle fraction des objets supposés être observés ont un score supérieur ou égal a celui que tu considère. Ça tu ne l'a pas avec tes données, il faut en générale des simulations ou des observations que tu vas cacher a ton estimateur durant l'entrainement pour lesquels tu as une grande confiance sur la détection des objets avec d'autres méthodes.

    Tu peux en prenant en compte ces deux informations déduire une probabilité estimé (qui sera imparfaite), ce qui est très différent de prendre directement le score de ton estimateur.

    Le fait que tu ais pas mal de "confirmées" avec un faible score est tout afait raisonnable quand on voit la grande quantié de "faux positifs" avec ce même score. En fait c'est la pureté qui fait baissé le score dans la construction de l'estimateur. L'estimateur a été construit pour donner un score qui cherche a optimiser entre pureté et complétude, tu dois sacrifier quelques objets pour ne pas te contaminer avec beaucoup de fausses détections.

    Je ne sais pas si j'ai répondu a ta question.

Discussions similaires

  1. confiance
    Par invite65305976 dans le forum Psychologies (archives)
    Réponses: 1
    Dernier message: 04/12/2010, 17h14
  2. existence, précieuse existence
    Par inviteb9ffe72a dans le forum Epistémologie et Logique (archives)
    Réponses: 5
    Dernier message: 23/08/2009, 18h57
  3. Confiance en soi.
    Par invite647af5f4 dans le forum Psychologies (archives)
    Réponses: 12
    Dernier message: 24/05/2007, 07h56
  4. confiance
    Par invite975d9f0f dans le forum Psychologies (archives)
    Réponses: 8
    Dernier message: 12/03/2006, 19h29