Bonjour,
Je dispose d'une liste de milliers de mots (noms propres)
je cherche à établir une liste de toutes les combinaisons de trois lettres successives réalisables avec ces chaines de caractères
Exemple: avec MARTIN et MARSOUIN
MARTIN = MAR+ART+RTI+TIN
MARSOUIN = MAR+ARS+RSO+SOU+OUI+UIN
Une fois cette liste de 3 générée, je souhaite balayer la base avec chaque mot de 3 lettres afin de déterminer leur fréquence.
la liste de fréquence pour cet exemple: MAR=2 les autres=1
Ce problème est certainement élémentaire pour un statisticien ou programmeur; mais pour un citoyen lambda comme moi c'est un peu du chinois.
Si quelqu'un connait une application toute faite (en VB de préférence) merci de m'en faire part !
Pas la peine de répondre avec de belle équations, je ne les comprendrais pas...
Mon réel problème: la décomposition de chaque nom en groupes de 3 lettres sachant que le premier résultat comporte les 3 premières lettres (du 1er mot), le 2eme résultat commence à la 2eme lettre etc et que l'analyse d'un mot s'arrête lorsqu'il reste moins de 3 lettres. On passe alors au mot suvant.
Pour analyser la fréquence, j'ai déjà d'un outil: TextSTAT.exe (merci au concepteur).
-----