Bonjour,
Je recherche un algorithme d'analyse du genre LCS qui me permettrais d'analyser un fichier en retournant par exemple une séquence qui apparait plusieurs fois dans le fichier.
Un exemple de ce que je recherche:
Soit un fichier contenant la suite suivante:
12ABCDEF000ABCD1234563434
J'aimerais que l'algorithme retourne quelque chose du genre:
"Chaine de 2 caractère: 12 apparait 2 fois, 34 apparait 3 fois"
"Chaine de 4 caractères, ABCD apparait 2 fois".
Ceci n'est qu'un exemple, bien sure je pense limiter la taille minimale pour la recherche à beaucoup plus de 2 caractères afin d'éviter que l'algorithme ne prenne trop de temps a s'exécuter.
Cette recherche sera effectuer sur des fichier avec environ 5000 caractères.
Je pense qu'il existe des algorithmes optimisés (du genre LCS) un peu comme dans les recherche de séquence ADN.
Pour info je programme sous c#
Merci pour votre aide.
-----