Bonjour à toutes et à tous
J'ai un problème que je n'arrive pas à résoudre. J'ai une liste de thèmes appelant la I={ mot1,mot2,...,mot N}
et j'ai 120 documents qui contiennent en moyenne 70 pages (cette donnée ne va nous servir à rien c'est juste pour montrer que le travail ne peut pas se faire à la main).
Je cherche à extraire une sous-liste I' de I qui sera la plus représentative des 120 documents
Avec le logiciel Lexico3 (logiciel d'analyse du contenu) j'arrive à extraire la fréquence d'apparition des mots dans chaque article.
Y a-t-il un logiciel pour résoudre ce problème ? Merci à vous.
-----