logiciel de tri de mots
Répondre à la discussion
Affichage des résultats 1 à 3 sur 3

logiciel de tri de mots



  1. #1
    invite2973d341

    logiciel de tri de mots


    ------

    Bonjour à toutes et à tous
    J'ai un problème que je n'arrive pas à résoudre. J'ai une liste de thèmes appelant la I={ mot1,mot2,...,mot N}
    et j'ai 120 documents qui contiennent en moyenne 70 pages (cette donnée ne va nous servir à rien c'est juste pour montrer que le travail ne peut pas se faire à la main).
    Je cherche à extraire une sous-liste I' de I qui sera la plus représentative des 120 documents
    Avec le logiciel Lexico3 (logiciel d'analyse du contenu) j'arrive à extraire la fréquence d'apparition des mots dans chaque article.
    Y a-t-il un logiciel pour résoudre ce problème ? Merci à vous.

    -----

  2. #2
    invite3edbf683

    Re : logiciel de tri de mots

    j'aurais bien aimé vouloir t'aidé mais je ne comprend rien a ce que tu veux

    en revanche si c'est du texte je pense que tu peux éventuellement écrire un petit programme en C ou en bash qui face ce que tu veux

  3. #3
    jacknicklaus

    Re : logiciel de tri de mots

    Si je comprends bien, tu as une liste de mots I = (M1 ... Mn) , et une liste de documents (D1 à D120). Ton objectif est de déterminer un sous-ensemble de la liste de mots qui soit "représentative" du contenu des documents, cette représentativité étant la fréquence d'apparition des mots dans les documents. Si c'est çà, je ne vois pas trop la difficulté :

    Proposition :

    Si tu as déjà, pour tout j entre 1 et 120, la fréquence d’apparition des mots (M1...Mn) de chaque document, il te suffit de sommer les fréquences sur tous les documents, et obtenir une liste F = (F1 ... Fn) où chaque valeur est la somme des fréquences d'apparition de chaque mot de la liste I , sommée sur tous les documents. Il te reste à choisir une valeur de coupure arbitraire, en dessous de la quelle tu décideras de ne pas retenir une fréquence Fi. Ta sous liste de I sera alors la liste des mots dont la fréquence est au dessus de ta valeur de coupure.
    Dernière modification par jacknicklaus ; 29/06/2017 à 13h52.
    There are more things in heaven and earth, Horatio, Than are dreamt of in your philosophy.

Discussions similaires

  1. Jeu de mots croisés ?
    Par invite6d44a734 dans le forum Logiciel - Software - Open Source
    Réponses: 4
    Dernier message: 13/05/2010, 18h41
  2. Les mots
    Par invite18cacc8a dans le forum Éthique des sciences (archives)
    Réponses: 9
    Dernier message: 07/01/2010, 14h08
  3. Occurences de mots
    Par invited6f8ccbf dans le forum Logiciel - Software - Open Source
    Réponses: 1
    Dernier message: 21/10/2007, 17h41
  4. jeu de mots
    Par invite58081e51 dans le forum Science ludique : la science en s'amusant
    Réponses: 15
    Dernier message: 04/03/2005, 17h37