Bonjour,
Je m'intéresse à la comparaison entre deux catalogues de corps célestes et je cherche à identifier les objets communs.
Pour cela, j'ai commencé par fixer une distance arbitraire et ai considéré que tous les objets dont la distance est inférieure à cette valeur seuil sont en réalité identiques.
J'essaie maintenant de raffiner un peu le traitement en abordant un traitement statistique : plutôt que de considérer une valeur complètement arbitraire, je voudrais déterminer la valeur seuil à partir des données. Typiquement, si en moyenne les objets sont à 0.0001 les uns des autres, deux objets distants de 0.5 sont sans doute différents.
Comment déterminer une distance moyenne qui correspondra, par exemple, à 80% de la population ?
Je comptais essayer quelque chose du genre mais je n'arrive pas à voir quel pourcentage de la population est comprise entre 0 et cette valeur.
J'ai bien conscience que ma question est mal posée, mais je n'arrive pas à la formuler plus précisément (le sujet n'est pas très clair dans ma tête !).
Merci d'avance !
Pen
-----