Bonjour, cliquez-ici pour vous inscrire et participer au forum.
  • Login:



+ Répondre à la discussion
Affichage des résultats 1 à 3 sur 3

logiciel de tri de mots

  1. rojopomodoro00

    Date d'inscription
    juin 2017
    Âge
    24
    Messages
    1

    logiciel de tri de mots

    Bonjour à toutes et à tous
    J'ai un problème que je n'arrive pas à résoudre. J'ai une liste de thèmes appelant la I={ mot1,mot2,...,mot N}
    et j'ai 120 documents qui contiennent en moyenne 70 pages (cette donnée ne va nous servir à rien c'est juste pour montrer que le travail ne peut pas se faire à la main).
    Je cherche à extraire une sous-liste I' de I qui sera la plus représentative des 120 documents
    Avec le logiciel Lexico3 (logiciel d'analyse du contenu) j'arrive à extraire la fréquence d'apparition des mots dans chaque article.
    Y a-t-il un logiciel pour résoudre ce problème ? Merci à vous.

    -----

     


    • Publicité



  2. robotzeus1

    Date d'inscription
    janvier 2012
    Messages
    58

    Re : logiciel de tri de mots

    j'aurais bien aimé vouloir t'aidé mais je ne comprend rien a ce que tu veux

    en revanche si c'est du texte je pense que tu peux éventuellement écrire un petit programme en C ou en bash qui face ce que tu veux
     

  3. jacknicklaus

    Date d'inscription
    janvier 2017
    Messages
    785

    Re : logiciel de tri de mots

    Si je comprends bien, tu as une liste de mots I = (M1 ... Mn) , et une liste de documents (D1 à D120). Ton objectif est de déterminer un sous-ensemble de la liste de mots qui soit "représentative" du contenu des documents, cette représentativité étant la fréquence d'apparition des mots dans les documents. Si c'est çà, je ne vois pas trop la difficulté :

    Proposition :

    Si tu as déjà, pour tout j entre 1 et 120, la fréquence d’apparition des mots (M1...Mn) de chaque document, il te suffit de sommer les fréquences sur tous les documents, et obtenir une liste F = (F1 ... Fn) où chaque valeur est la somme des fréquences d'apparition de chaque mot de la liste I , sommée sur tous les documents. Il te reste à choisir une valeur de coupure arbitraire, en dessous de la quelle tu décideras de ne pas retenir une fréquence Fi. Ta sous liste de I sera alors la liste des mots dont la fréquence est au dessus de ta valeur de coupure.
    Dernière modification par jacknicklaus ; 29/06/2017 à 13h52.
     


    • Publicité







Sur le même thème :





 

Discussions similaires

  1. Jeu de mots croisés ?
    Par dan3131 dans le forum Logiciel - Software - Open Source
    Réponses: 4
    Dernier message: 13/05/2010, 18h41
  2. Les mots
    Par placerouge1 dans le forum Éthique des sciences
    Réponses: 9
    Dernier message: 07/01/2010, 14h08
  3. Occurences de mots
    Par azeto dans le forum Logiciel - Software - Open Source
    Réponses: 1
    Dernier message: 21/10/2007, 17h41
  4. jeu de mots
    Par maxevans dans le forum Science ludique : la science en s'amusant
    Réponses: 15
    Dernier message: 04/03/2005, 17h37