Répondre à la discussion
Affichage des résultats 1 à 19 sur 19

comparaison de listes



  1. #1
    ricoou

    comparaison de listes


    ------

    Bonjour à tous,

    Je recherche un test statistique ou un calcul de score qui me permettrait de valider la similarité entre deux listes d'effectifs différents par exemple.

    Pour faire plus clair, j'ai deux listes de chiffres, je recherche le nombre de chiffre en commun et je souhaite pouvoir dire si c'est liste sont significativement ressemblante ou non???

    Merci d'avance pour votre aide.

    -----

  2. #2
    ricoou

    Re : comparaison de listes

    Bonjour à tous,

    Je recherche un test statistique ou un calcul de score qui me permettrait de valider la similarité entre deux listes d'effectifs différents par exemple.

    Pour faire plus clair, j'ai deux listes de chiffres, je recherche le nombre de chiffres en commun et je souhaite pouvoir dire si ces listes sont significativement ressemblantes ou non???

    Merci d'avance pour votre aide.

  3. #3
    invite986312212
    Invité

    Re : comparaison de listes

    bonjour,

    "ressemblantes" c'est un peu vague. Est-ce que l'ordre compte? si c'est non, alors peut-être un test non paramétrique d'égalité de deux distributions ferait l'affaire (Kolmogorov-Smirnov par exemple).

  4. #4
    ricoou

    Re : comparaison de listes

    c'est vrai "ressemblante" reste un peu vague peut être que similaire conviendrait mieux. L'ordre n'est pas pris en compte. Je vais essayer ce test; Merci

  5. A voir en vidéo sur Futura
  6. #5
    invite986312212
    Invité

    Re : comparaison de listes

    ou alors un simple test d'égalité des moyennes et variances.

  7. #6
    ricoou

    Re : comparaison de listes

    on ne peut pas calculer de moyenne ou de variance intra liste. les données non aucun rapport entre elles, uniquement avec des valeurs de l'autre liste

  8. #7
    invite986312212
    Invité

    Re : comparaison de listes

    je ne comprends pas bien: "aucun rapport", mais en tout cas si on ne peut pas calculer de moyenne, alors on ne doit pas pouvoir parler de distribution non plus.

  9. #8
    ricoou

    Re : comparaison de listes

    c'est mon problème principal, il ne s'agit pas de distributions. il me faut trouver un moyen pour dire que le nombre de chiffre communs au 2 liste est suffisant pour affirmer que les listes sont similaires.

  10. #9
    Médiat

    Re : comparaison de listes

    Je ne suis pas certain d'avoir compris exactement ce que tu cherches, mais peut-être peux-u regarder la notion de distance entre mots sur un même alphabet (un mot est bien une liste ordonnée), en particulier la distance de Levenshtein...
    Je suis Charlie.
    J'affirme péremptoirement que toute affirmation péremptoire est fausse

  11. #10
    spi100

    Re : comparaison de listes

    Effectivement, distance de levenstein si l'ordre à une importance. Sinon la distance de Jacquard fait l'affaire.
    GCS/S s: a C++ DI++>+++ UL++A++HIS++$ P++>+++$ E+>++$ W+>++$ N+ Y+ e++++ t+++ y+++

  12. #11
    ricoou

    Smile Re : comparaison de listes

    Pour essayer de me faire mieux comprendre voici un exemple concret:

    Liste1: 2B-58-16-47A-5-4.8-36

    Liste2: 16-5-2M-1000000-58-2B-9-41-22-63L-9P-4.8

    Valeurs communes: 2B, 16, 5, 4.8

    Comment peut on tester la similarité des listes??

  13. #12
    Médiat

    Re : comparaison de listes

    Citation Envoyé par ricoou Voir le message
    Pour essayer de me faire mieux comprendre voici un exemple concret:
    Je n'avais donc pas compris le problème, tu peux oublier la distance de Levenshtein.

    Est-ce qu'il ne te suffit pas de compter les valeur commune et de diviser par quelque chose (le nombre valeur dans la plus grande liste, ou dans la plus petite liste, à toi de voir)
    Je suis Charlie.
    J'affirme péremptoirement que toute affirmation péremptoire est fausse

  14. #13
    invite986312212
    Invité

    Re : comparaison de listes

    bonjour,
    moi non plus je n'avais pas compris. Déjà je vois qu'il ne s'agit pas de chiffres.

    qu'appelles-tu "tester" ?

  15. #14
    ricoou

    Re : comparaison de listes

    Par "tester" je voulais dire : utiliser un test statistique permettant de dire si le score calculé ( par division du nombre de valeurs communes par le nombre de valeur de la plus grande liste par exemple ) est plus significatif pour un cas ou un autre (grande différence du nombre de valeurs entre les listes ou pas de différence) ??

    Liste1: 5 valeurs
    Liste2: 25 valeurs
    5 valeurs en commun
    scoreA 5/25 ->1/5

    Liste1':15
    Liste2':25
    5 valeurs en commun
    scoreB 5/25 ->1/5

    La similarité entre les listes 1 et 2 est-elle la même que celle entre les listes 1' et 2'?? peut-on faire un test statistique qui permette de départager les scoreA et B?

  16. #15
    ricoou

    Re : comparaison de listes

    Désolé pour le casse tête!!

  17. #16
    invite986312212
    Invité

    Re : comparaison de listes

    un test statistique suppose un modèle stochastique sous-jacent. Par exemple si les mots qui composent tes listes sont issus d'un ensemble fini et pas trop grand, tu pourrais éventuellement prendre comme hypothèse nulle le fait que tes deux listes sont des échantillons indépendants tirés dans cet ensemble (avec ou sans remise, faut voir) et voir si cette hypothèse tient la route (i.e. si la "distance" entre listes n'est pas de trop plus petite qu'attendue sous l'hypothèse nulle). Mais encore faut-il que cette hypothèse nulle ne soit pas trop farfelue dans le contexte, sinon tu ne fais que tester la farfeluité de ladite hypothèse.

  18. #17
    ricoou

    Re : comparaison de listes

    Selon cette méthode, quel test dois-je utiliser pour réfuter ou non l'hypothèse nulle: "les deux listes sont des échantillons indépendants tirés dans cet ensemble" ??

  19. #18
    spi100

    Re : comparaison de listes

    Je ne vois pas pourquoi la distance de Levenstein ne serait pas adaptée. Le principe est d'associer un cout à chaque transformation élémentaire : 1 cout pour la substitution, l'ajout et la suppression.
    La distance est alors donnée par l'ensemble des transformations de moindre cout. Tu peux adapter les couts élémentaires comme tu veux, jusqu'à que tu juges que ta distance soit suffisamment discriminante.
    GCS/S s: a C++ DI++>+++ UL++A++HIS++$ P++>+++$ E+>++$ W+>++$ N+ Y+ e++++ t+++ y+++

  20. #19
    invite986312212
    Invité

    Re : comparaison de listes

    oui mais le tout n'est pas de choisir une distance adaptée, si on veut faire un test il faut encore pouvoir en calculer la distribution, encore que tout peut se simuler. Mais cette idée d'insertion/délétion me fait penser aux distances utilisées en génétique. Il y a peut-être des idées à rechercher dans cette discipline.

Discussions similaires

  1. Listes alcools
    Par mimi.22 dans le forum Chimie
    Réponses: 1
    Dernier message: 07/02/2008, 14h20
  2. [Divers] Listes Biologie
    Par Chamallow- dans le forum Biologie
    Réponses: 11
    Dernier message: 26/10/2007, 09h53
  3. Familles et listes...
    Par Deeprod dans le forum Mathématiques du supérieur
    Réponses: 5
    Dernier message: 14/03/2007, 23h04
  4. Outlook et listes de distribution
    Par banout dans le forum Logiciel - Software - Open Source
    Réponses: 0
    Dernier message: 06/07/2006, 06h52
  5. Listes d'attentes
    Par MS-405S dans le forum Orientation après le BAC
    Réponses: 0
    Dernier message: 29/07/2005, 20h26