Bonjour à tous,

Pourriez vous me donner des éléments de réponse concernant ceci:

J'aimerais faire une analyse de données sur des données qui sont qualitative et indexé par le temps.

Typiquement, on pourrait ramener ça à une suite de lettres qui sont indexé par le temps. Les intervalle de temps sont réguliers.

Le type d'analyse que j'aimerais faire ce serait une sorte de clustering. J'aimerais détecter des patterns courant dans cette suite de lettres.
Ou alors s'il existe une corrélation entre deux lettre, est ce que si une lettre apparait, une autre à aussi tendance à apparaitre. Ou encore
quel est le temps moyen entre l'apparition de deux lettre différentes.

Je maitrise les stat de façon générale, mais je n'ai encore jamais fait de séries temporelle. Mais j'ai pas l'impression qu'on puisse utiliser les série temporelle ici, puisque mes données sont qualitative. Est ce que je me trompe?

Sinon je maitrise toute les stats de façon assez poussé, ainsi que les techniques de base du machine learning supervisé et non supervisé.

J'ai déjà regardé un peu du coté de la sliding window approach, mais j'ai l'impression de faire fausse route

Pourriez vous m'éclairer?

Merci d'avance.